首页
学习
活动
专区
圈层
工具
发布
为你推荐
腾讯专区
云计算
人工智能
前端
后端
编程语言
数据库
大数据
音视频
安全
物联网
硬件
运维
测试
网络与通信
架构设计
开发工具
操作系统
职业发展
算法

管理

构建AI智能体:参数的艺术:如何在有限算力下实现高质量的AI诗歌创作
回顾昨日的训练历程,我们经历了一场从混乱到有序的技术探索。初始阶段,模型表现令人堪忧:生成内容严重重复、格律混乱,损失值高达1.7467,输出的诗歌如同破碎的镜像,充斥着"长恨歌中用了此"的无意义重复。这背后反映的是训练不充分、参数配置失衡等深层问题。面对这一困境,我们进行了系统的参数重构——将LoRA秩从4提升至16以增强表达能力,学习率调整为2e-4确保稳定收敛,训练轮次延长至20个epoch保证充分学习,同时优化了提示词格式和生成参数。这一系列精准调整,如同为模型注入了新的生命力,为今日的突破性成果奠定了坚实基础。
未闻花名
2026-01-06
880
金融服务领域的智能体革命:AI智能体解决方案、产业分析与技术实施的战略分析
金融服务行业正处于一场范式转变的前沿,它正在超越传统自动化和被动式人工智能带来的渐进式改进,转而拥抱自主AI智能体(AI Agents)的变革潜力。这些智能体不仅仅是更高级的聊天机器人或语言模型;它们是目标导向的数字系统,能够独立规划、推理并执行复杂的多步骤业务流程。
IAN李车
2026-01-07
840
当残差不再是直线:DeepSeek 的 mHC 如何把 Hyper-Connections 拉回稳定区
每次一到过节期间,DeepSeek就要发点东西庆祝一下过节。真的不让我们这些程序员活了
算法一只狗
2026-01-07
480
架构视角:我的2025
今年公众号看到的最多的新闻大概就是这两种了:一边是大厂裁员消息,一边是 AI 工具越来越好用,看着新闻说“AI 会替代大量重复性、规则化岗位”,我下意识摸了摸熟练了 CRUD 的手,心想:“这不是正说我吗?”以前大家开玩笑说自己是“人肉 IDE”“高级复制粘贴工程师”,现在 AI 真成了“超级粘贴器”,还不要工资不摸鱼,笑着笑着,笑不出来了,今年软件研发行业有几个明显变化:
西门呀在吹雪
2026-01-07
440
大模型提示词-新手篇
“提示词优化”(Prompt Engineering)是让大模型发挥最大效果的核心技能,也是很多 AI 应用的 隐形竞争力。本篇文章系统性帮你梳理学习 & 精通提示词优化的方法步骤,让你能够从入门直接走向高手级。
收心
2026-01-07
690
Logstash S3 插件磁盘爆满踩坑记:一行代码引发的血案
本文描述问题及解决方法同样适用于 腾讯云 Elasticsearch Service(ES)。
岳涛
2026-01-06
1072
2025,一个普通开发者的社区成长地图
一种在地图上:一月南京红山动物园看熊猫,三月杭州西湖边等论坛开场,六月上海能源展看光伏板闪光,八月千岛湖的游船上他有点晕船,十二月青岛海边海鸥成群飞过。
肥晨
2026-01-06
1611
加密流量分析在金融科技领域的高级安全与反欺诈应用
本部分将解构加密流量分析(ETA)的技术基础,阐明如何在不解密流量载荷的前提下实现网络可见性。报告将详细介绍作为分析原始材料的具体数据点,并引入将这些数据转化为可操作情报的机器学习技术。
IAN李车
2026-01-05
1680
国产第一编程大模型GLM4.7在claude code和trae里面效果天差地别
最近在重构一个遗留 PHP 项目时,我遇到了一个令人深思的现象:使用完全相同的 API 密钥、调用同一个大模型(智谱 GLM-4.7),仅因前端工具不同,AI 对同一提示词的理解和执行结果竟大相径庭。
高老师
2026-01-07
3830
DEF-YOLO:基于YOLO的热成像隐蔵武器检测
深耕计算机视觉与深度学习领域,专注于视觉检测前沿技术的探索与突破。长期致力于YOLO系列算法的结构性创新、性能极限优化与工业级落地实践,旨在打通从学术研究到产业应用的最后一公里。
AI小怪兽
2026-01-07
510
为你推荐
腾讯专区
订阅及关注
云计算
人工智能
前端
后端
编程语言
数据库
大数据
音视频
安全
物联网
硬件
运维
测试
网络与通信
架构设计
开发工具
操作系统
职业发展
算法
构建AI智能体:参数的艺术:如何在有限算力下实现高质量的AI诗歌创作
回顾昨日的训练历程,我们经历了一场从混乱到有序的技术探索。初始阶段,模型表现令人堪忧:生成内容严重重复、格律混乱,损失值高达1.7467,输出的诗歌如同破碎的镜像,充斥着"长恨歌中用了此"的无意义重复。这背后反映的是训练不充分、参数配置失衡等深层问题。面对这一困境,我们进行了系统的参数重构——将LoRA秩从4提升至16以增强表达能力,学习率调整为2e-4确保稳定收敛,训练轮次延长至20个epoch保证充分学习,同时优化了提示词格式和生成参数。这一系列精准调整,如同为模型注入了新的生命力,为今日的突破性成果奠定了坚实基础。
未闻花名
2026-01-06
金融服务领域的智能体革命:AI智能体解决方案、产业分析与技术实施的战略分析
金融服务行业正处于一场范式转变的前沿,它正在超越传统自动化和被动式人工智能带来的渐进式改进,转而拥抱自主AI智能体(AI Agents)的变革潜力。这些智能体不仅仅是更高级的聊天机器人或语言模型;它们是目标导向的数字系统,能够独立规划、推理并执行复杂的多步骤业务流程。
IAN李车
2026-01-07
当残差不再是直线:DeepSeek 的 mHC 如何把 Hyper-Connections 拉回稳定区
每次一到过节期间,DeepSeek就要发点东西庆祝一下过节。真的不让我们这些程序员活了
算法一只狗
2026-01-07
架构视角:我的2025
今年公众号看到的最多的新闻大概就是这两种了:一边是大厂裁员消息,一边是 AI 工具越来越好用,看着新闻说“AI 会替代大量重复性、规则化岗位”,我下意识摸了摸熟练了 CRUD 的手,心想:“这不是正说我吗?”以前大家开玩笑说自己是“人肉 IDE”“高级复制粘贴工程师”,现在 AI 真成了“超级粘贴器”,还不要工资不摸鱼,笑着笑着,笑不出来了,今年软件研发行业有几个明显变化:
西门呀在吹雪
2026-01-07
大模型提示词-新手篇
“提示词优化”(Prompt Engineering)是让大模型发挥最大效果的核心技能,也是很多 AI 应用的 隐形竞争力。本篇文章系统性帮你梳理学习 & 精通提示词优化的方法步骤,让你能够从入门直接走向高手级。
收心
2026-01-07
Logstash S3 插件磁盘爆满踩坑记:一行代码引发的血案
本文描述问题及解决方法同样适用于 腾讯云 Elasticsearch Service(ES)。
岳涛
2026-01-06
2025,一个普通开发者的社区成长地图
一种在地图上:一月南京红山动物园看熊猫,三月杭州西湖边等论坛开场,六月上海能源展看光伏板闪光,八月千岛湖的游船上他有点晕船,十二月青岛海边海鸥成群飞过。
肥晨
2026-01-06
加密流量分析在金融科技领域的高级安全与反欺诈应用
本部分将解构加密流量分析(ETA)的技术基础,阐明如何在不解密流量载荷的前提下实现网络可见性。报告将详细介绍作为分析原始材料的具体数据点,并引入将这些数据转化为可操作情报的机器学习技术。
IAN李车
2026-01-05
国产第一编程大模型GLM4.7在claude code和trae里面效果天差地别
最近在重构一个遗留 PHP 项目时,我遇到了一个令人深思的现象:使用完全相同的 API 密钥、调用同一个大模型(智谱 GLM-4.7),仅因前端工具不同,AI 对同一提示词的理解和执行结果竟大相径庭。
高老师
2026-01-07
DEF-YOLO:基于YOLO的热成像隐蔵武器检测
深耕计算机视觉与深度学习领域,专注于视觉检测前沿技术的探索与突破。长期致力于YOLO系列算法的结构性创新、性能极限优化与工业级落地实践,旨在打通从学术研究到产业应用的最后一公里。
AI小怪兽
2026-01-07

下午好!

欢迎来到腾讯云开发者社区

沙龙日历
全部 >
加入讨论
的问答专区 >
    原创作者热度排行榜
    更多 >
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
    领券