自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1320)
  • 收藏
  • 关注

原创 程序员挣够了钱,到中年失业真的很可怕吗?

最近一刷知乎全部都是大龄程序员失业危机真的有这么可怕吗?程序员35岁就真的到了瓶颈期?我不这么认为挣够了钱,当然不可怕,问题是没挣够啊~!!!按题主的算法是,大城市薪资1w以上,45岁失业,工作20年可以挣够钱:那我们现在来算一下,20年12个月1w=240w没错,这样算下来的确是可以挣到240w左右,但是你还有很多地方需要花钱,如:房租/房贷、孩子学费、赡养老人、家庭日常开支、朋友聚会……等等,这样全部算下来,你觉得你真的挣够钱了吗???而且按照题主说的是45岁失业,但现实是35岁很多程序员

2022-01-05 22:40:31 20021 37

原创 如果一名程序员一个月拿两万,得知一对夫妇卖猪肉可以赚五万一个月后会怎么选择,做程序员还是卖猪肉?

在知乎上看到这么个帖子,觉得挺有意思,大家一起瞧瞧?对此,我也看到了许多犀利的回答哈**A:**我反过来问你,如果一对夫妇卖猪肉一个月只能挣一万,听说一名程序员一个月拿五万,他们能选择去当程序员拿五万吗?这时候你知道不是谁都能当程序员,不是哪个程序员都能拿五万了,那你怎么就觉得谁都能卖猪肉、谁卖猪肉都能赚五万一个月了?你拿得动刀吗?你有超过常人的进货和销售渠道吗?你有人家的口碑吗?**B:**有时候可能会有一些莫名的优越感,将这个世界按照一条线性的赛道来理解,就像从小到大好好学习,一路考大学,唯一的

2022-01-04 21:58:55 15907 32

原创 一天高中的女同桌突然问我是不是程序员,满脸黑人问号?

背景昨天一个我高中的女同桌突然发微信问我“你是不是程序猿 我有问题求助”,先是激动后是茫然再是冷静,毕业多年不见联系,突然发个信息求助,感觉大脑有点反应不过来…再说我一个搞Python的,这点要求大家懂的,人生苦短,我用Python!为了大家的面子,为了程序猿们的脸,不就简单的小Python嘛,必须答应!梳理需求现有excel表格记录着 有效图片的名字,如:要从一个文件夹里把excel表格里记录名字的图片筛选出来;需求也不是很难,代码思路就有了:读取Excel表格第一列的信息并放入

2021-12-30 22:31:31 31719 36

原创 企业级多智能体AI系统构建实战

本文档提供完整的代码实现、部署方案和最佳实践,帮助开发者将多智能体理论转化为生产级系统。

2025-07-21 20:06:33 632

原创 智能体应用场景的探索——从人的角度理解智能体应用

在之前关于智能体的理解就是一个能使用工具的大模型,然后通过Function call的方式给模型配置工具就是一个智能体的了;但等到你真的问我智能体能干什么有哪些应用场景,已经具体应该怎么做。

2025-07-21 20:01:03 693

原创 别卷了!用 Dify 搭建你的专属 AI 数据分析报告助手

> **导读**:AI 正在席卷所有行业,与其焦虑,不如拥抱。本文将带你实战一个强大的 AI 应用开发平台 Dify,仅需 5 分钟,无需一行代码,即可搭建一个能与你对话、帮你分析实验数据的 AI 助手。告别繁琐脚本,让科研回归专注!

2025-07-20 10:45:00 1045

原创 百度搜索-走向人工智能大模型驱动的搜索新范式

百度搜索在 2025 年 6 月底于 Arxiv 发表的长达几十页的 AI搜索论文,Towards AI Search Paradigm(通向AI搜索范式),

2025-07-19 10:45:00 1057

原创 智能决策,自主收集:PT-IntelBot​(渗透测试情报收集Agent)

1、除了这一段和第七章输出报告展示部分外,文章其他部分都是Cursor写的,代码也是Cursor写的,当然,程序可以用的。

2025-07-18 22:11:06 1062

原创 生产环境也稳如老狗?试试 LangGraph 打造高可用 AI Agents

人工智能(AI)已经不再只是个时髦词,它正在改变我们解决实际问题的方式。从聊天机器人到自动化工作流,AI 智能体是这些创新的核心。但要打造一个可靠、可扩展、随时能上线的 AI 智能体可不是件容易事。这时候,LangGraph 登场了!它是 LangChain 的一个强大框架,能帮你轻松构建复杂、状态化的 AI 智能体,处理各种棘手的任务。这篇文章咱们就来聊聊如何用 LangGraph 打造生产就绪的 AI 智能体,还会通过一个实际案例,配上代码、工作流和图表,把一切讲得明明白白。

2025-07-17 20:55:23 853

原创 从0到1打造智能体:LangChain6步破解企业级Agent落地难题!

2025年,智能体(Agent)概念火遍全球,但真正落地的项目为何寥寥无几?当想象力撞上现实瓶颈,如何让AI助手从概念走向生产环境?本文用一套被LangChain验证的实战框架+真实邮件助手案例,带你拆解Agent构建全流程!

2025-07-17 20:29:52 556

原创 再谈大语言模型的应用安全

本文旨在重新审视大语言模型(LLM)的应用安全格局。随着LLM从实验室走向广泛的企业级应用,安全威胁已不再是理论上的推演,而是演变为具体的、高影响的实战攻防场景。攻击者正利用模型架构的固有弱点和应用集成的复杂性,开发出如RAG投毒、Agent劫持等新型攻击向量。因此,企业必须超越传统的安全边界,构建一个多层次、贯穿模型全生命周期的纵深防御体系。本文将深入剖析当前LLM安全的核心挑战,并结合最新研究与最佳实践,提供一套可落地的分析框架与行动指南。

2025-07-17 20:28:53 910

原创 别再找了,它就是目前最强的翻译垂类 Agent !

今年 1 月,当 Manus 以 “首个通用 AI Agent” 之名横空出世,其邀请码一度被炒至 **几万元**时,所有人都感受到了 `Agent` 浪潮的灼热。

2025-07-16 20:37:46 929

原创 从检索到行动:Agentic RAG让大模型真正“干活”的技术全解

听说过 RAG 吗?你可能觉得:“挺酷,能帮我找资料。” 没错——但这只是故事的一半。

2025-07-16 20:36:17 996

原创 大模型训练与微调之Unsloth-实站之Qwen3微调

全新 Qwen3 模型在推理、指令执行、代理功能和多语言支持方面均实现了最先进的进步。Unsloth 使 Qwen3 的微调速度提升了 2 倍,显存占用减少了 70%,并支持 8 倍的上下文长度。

2025-07-16 20:34:52 831

原创 一文搞懂什么是RAG

想象一下,你面前坐着一位超级“学霸”。他博览群书,记忆力惊人,口才极佳,无论你问什么,他都能侃侃而谈,出口成章。

2025-07-15 20:03:51 415

原创 人工智能:AI大模型在金融应用实践的业务场景汇总

当前,AI大模型正深刻重塑金融行业。在业务场景中,其价值已从技术探索走向规模化落地。智能投顾领域,大模型通过分析海量市场数据与用户画像,生成个性化资产配置方案,服务效率提升超50%;信贷风控环节,模型融合多源非结构化数据(如企业公告、产业链动态),实现更精准的信用评估,不良率显著降低;量化交易层面,大模型挖掘市场情绪与隐藏关联因子,助力策略迭代速度提升3倍以上。实践表明,大模型不仅推动降本增效,更拓展了服务边界。未来,随着多模态技术与合规框架的完善,金融智能化将迈入新阶段。

2025-07-15 20:03:10 434

原创 使用 Dify 工作流实现每日热点简报

最近天气炎热,小伙伴们要注意防暑防晒!那说到热,今天给大家分享一个「**实时热点每日简报**」的工作流。

2025-07-15 20:02:11 352

原创 如何凭大模型权重就能逆向大模型训练数据

想象一下,你拿到一个训练好的AI模型文件,竟然能推测出它是用什么数据"喂"出来的。这听起来像科幻小说?

2025-07-14 20:12:58 296

原创 Qwen3-RL训练过程详解

Qwen2.5的RL训练过程主要分为两阶段,第一阶段为离线阶段做DPO,第二阶段为在线阶段使用偏好RM做GRPO,两阶段RL主要是针对通用场景来做的。

2025-07-14 20:12:21 293

原创 一文看懂:AI Agent是什么?智能体融合MCP在企业中的应用场景和实现思路

在企业数字化转型过程中,AI Agent正在成为核心基建,它也正在重塑着技术的边界,它既是连接离散系统的 “智能接口”,也是破解人机协作效率瓶颈的 “关键要素”,更被视为未来企业实现 “自适应运营” 的必选之项。去年,MCP标准的发布,又进一步增强了AI Agent与企业内外部资源(系统)交互的能力,使其在企业数字化、数智化布局中的地位越发重要。

2025-07-14 20:11:14 635

原创 突破80%准确率!首个医学AI推理验证模型Med-PRM开源发布

大型语言模型在回答医学问题方面正在不断改进。然而,它们仍然难以发现和纠正自身推理中的错误。这在医学领域是一个重大问题,因为医学关乎生命,任何步骤的错误都可能带来严重后果。为了解决这一问题,论文推出了**Med-PRM**,这是一个过程奖励模型,能够**评估每个推理步骤**,并基于临床指南和高质量医学资源进行判断。在7个基准测试中,Med-PRM将准确率提升了高达+13.5%,使首个开源80亿参数模型在MedQA上突破了80%的成绩。论文希望这项工作能推动该领域朝着可信赖且经过验证的医学大语言模型方向迈进一步

2025-07-13 10:45:00 703

原创 Engineering | 强烈推荐!北航任磊教授团队:流程工业大模型 ProcessFM —— 挑战与机遇

本期推文将介绍北京航空航天大学任磊教授团队于中国工程院院刊《Engineering》发表的题为“Foundation Models for the Process Industry: Challenges and Opportunities”的文章,提出了首个流程工业大模型框架——ProcessFM。

2025-07-12 19:59:02 452

原创 强化学习反常识革命:让AI学会“放弃“竟提升50%效率!

在传统的深度强化学习(Deep RL)中,智能体(Agent)通常会完整地执行每一个"回合"(Episode),直到成功、失败或达到最大步数。但现实是,很多回合在早期阶段就已经注定是"没有希望"的了。比如,一个机器人想走出迷宫,但它在刚开始就走进了一个死胡同。

2025-07-12 19:58:03 398

原创 LangChain提示词工程

在LangChain中,提示模板(Prompt Templates)扮演着至关重要的角色,它们允许开发者以结构化的方式向语言模型提供输入,从而引导模型生成所需的输出。

2025-07-11 22:22:39 267

原创 论文浅尝 | 用于多文档问答的知识图谱提示(AAAI2024)

随着大型语言模型(LLM)的“预训练、提示、预测”范式在开放域问答(OD-QA)和单文档问答(D-QA)中取得显著成功,如何将这一范式推广到需要跨多份文档进行深度推理与信息聚合的多文档问答(MD-QA)场景,成为一个亟待解决的难题。然而,现有工作主要依赖经典的检索-阅读(retrieve-and-read)框架或多跳检索器(multi-hop retrievers),它们只能零散地检索到各文档中的局部上下文,难以抓取文档间的复杂逻辑关联;即便是最新的链/树/图思维(Chain/Tree/Graph-of-t

2025-07-11 22:21:30 349 1

原创 RL反常识研究,直接给LLM喂答案比提供详细步骤更有用!

当前,我们都知道用强化学习(Reinforcement Learning, RL)来“训练”大语言模型(LLM)进行数学推理,效果非常好,模型在各种数学竞赛榜单上刷出了惊人的高分。但是,这里存在一个“知其然,而不知其所以然”的问题。

2025-07-10 20:14:38 862

原创 最新|Milvus_local_RAG,笔记本也能跑的本地知识库&RAG来了

多数前端开发工程师可能都面临这样一个困境:每天需要查阅大量技术文档、项目规范和学习资料。传统的文件夹分类和搜索方式效率低下,经常**为了找一个API用法翻遍整个项目文档**。

2025-07-10 20:10:25 916

原创 郑志明院士团队 | Agent4Vul:基于多模态LLM智能体的智能合约漏洞检测方法

在Web 3.0生态系统下,智能合约漏洞已成为区块链系统安全的一大威胁。虽然大语言模型(LLM)在代码理解和智能合约安全审计中展现出巨大潜力,但其在漏洞检测任务中的实际表现仍存在显著不足,尤其面对复杂多样的漏洞类型时,检测准确率和稳定性难以保障。因此,如何有效利用LLM的语义理解和推理能力,构建一个高效、通用且鲁棒的漏洞检测框架,成为当前智能合约安全研究中的关键挑战。

2025-07-10 20:08:35 1077

原创 【开源】Open-Data-Scientist:基于ReAct框架的AI数据分析神器,一键生成报告+可视化!

在数据爆炸的时代,如何快速从海量数据中提取价值?传统分析流程耗时耗力,而AI驱动的工具正在改变这一现状。今天介绍的**Open-Data-Scientist**,基于前沿的**ReAct(Reasoning + Action)框架**,实现自动化数据分析、报告生成和可视化,成为数据科学家的新宠。

2025-07-09 20:52:03 779

原创 LLM安全评估新范式!JHU联合微软提出JBDistill框架,将越狱攻击“蒸馏“为安全基准

随着大型语言模型(LLMs)的快速发展以及在关键领域的部署,引发了对更健壮的安全基准测试的迫切需求。现有的安全评估范式主要包括两种:***\*动态安全评估\****(如基于LLM的红队方法)和***\*静态安全基准\****(如人工策划的提示词集合)。然而,这两种范式都存在明显不足,动态评估方法存在***\*可比性和可重复性差\****的问题,而静态基准则面临***\*饱和度和污染问题\****,难以随新模型和新攻击的出现而及时更新。

2025-07-09 20:50:40 987

原创 MoCa:首个大规模双向多模态表征模型

随着 GPT-4o、Qwen-VL 等生成式视觉-语言模型(VLM)大放异彩,通用多模态表示的需求也急速升温;然而,直接用这些 VLM 做检索或理解任务时,单向因果注意力机制往往限制了表示质量。为应对这一问题,来自中国人民大学、微软亚洲研究院、斯坦福大学、普林斯顿大学等机构的研究者提出了**MoCa**框架,是一个“持续预训练 + 异构对比微调”的两阶段框架,可将单向注意力 VLM 轻量化地训练成 SOTA 级双向多模态编码器。

2025-07-09 20:36:02 1049

原创 基于大模型的智能体中由自主性引发的安全风险综述

摘要——大型语言模型(LLMs)的最新进展正在推动自主智能体的发展,这些智能体具备在动态、开放式环境中感知、推理和行动的能力。与传统静态推理系统相比,这类基于大模型的智能体标志着一种范式的转变,即朝向具备交互性和记忆增强能力的实体。尽管这种能力大幅拓展了人工智能的功能边界,但也引入了新的、质变级的安全风险,例如记忆投毒、工具滥用、奖励操控(reward hacking)以及由价值错位导致的涌现性失配等问题,这些风险超出了传统系统或独立LLM的威胁模型范围。

2025-07-08 20:44:39 768

原创 Agentic时代来临!大模型+数据分析重塑企业决策,20+头部企业落地实践

2023年,随着中国大模型市场的爆火,将大模型与数据分析场景相结合的想法引起企业用户的广泛关注。企业希望利用大模型降低数据分析工具的使用门槛,使业务人员也可以更加便捷的使用数据,释放数据生产力;同时提高数据获取效率、改变数据分析模式,使数据分析人员可以有更多精力完成更高价值的分析工作。

2025-07-08 20:43:24 728

原创 DeepEval:LLM 应用评测不再玄学,让大模型评测像写单元测试一样简单

在大模型应用开发中,如何科学、自动化地评测 LLM(大语言模型)的输出质量,一直是让开发者头疼的问题。人工评测虽然靠谱,但效率太低,根本无法支撑快速迭代。

2025-07-07 20:32:39 794

原创 港科大最新发布!从深度学习到LLM,一文揭秘AI如何重塑量化投资

量化投资正迎来一次由深度学习到大语言模型(LLM)的飞跃,这不仅提升了市场预测的精确性,更预示着交易自动化的新时代即将来临。

2025-07-07 20:31:51 569

原创 专题·人工智能安全 | 大语言模型本地化部署的安全威胁及其应对措施

随着大语言模型应用场景的持续拓展,其应用模式已呈现多元化发展态势。除常规的网页端、移动应用及API接口调用外,本地化部署与云服务部署成为企业用户的并行选择。基于数据隐私保护诉求和垂直领域知识库建设的需要,政务、金融、医疗等领域的机构正加速推进大语言模型的私有化部署进程。尽管本地化部署模式在数据主权管控和行业场景适配方面具有显著优势,但其面临的安全挑战具有明显的多维特征,既包含传统网络安全威胁,也涉及人工智能特有的提示词和越狱攻击、数据投毒等新型风险,亟需建立涵盖技术架构、部署策略与运维管理的全链条防护体系。

2025-07-07 20:30:32 770

原创 从0到1构建商用Agent(智能体):踩坑经验与实战复盘

## 如何学习大模型 AI ?由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。但是具体到个人,只能说是:**“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。**这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各

2025-07-07 20:28:59 884

原创 机器学习之Transformer及预训练模型

Transformer是一种高效、灵活的网络,凭借**自注意力机制和并行计算能力**,成为**现代深度学习的核心架构**。自从 ELMO,GPT,BERT等模型问世,基于大规模预料的预训练模型便开始流行起来。学者们的注意力渐渐从模型架构转移到了预训练上。预训练+微调的方式也创造了不少下游任务 SOTA。

2025-07-06 10:45:00 526

原创 SQL语句生成智能体——vanna项目介绍

在大模型应用中有一种技术叫做NL2SQL——自然语言生成SQL语句;在基于人工智能的数据分析场景中,数据库是必不可少的一个环节。但怎么处理数据库中的数据却有不同的思路,比如类似于传统数据分析,使用SQL读取数据库,然后交给大模型进行分析;

2025-07-05 10:45:00 983

原创 Qwen3-Embedding:原理解读和检索场景测试

2025.6.6,通义千问团队发布了 Qwen3-Embedding 和 Qwen3-Reranker 系列。

2025-07-04 13:11:03 1048

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除