江湖人称麻花滕-CSDN博客

本文提出了一种新颖的 Logits DeConfusion (LDC) 方法，通过结合 Multi-level Adapter Fusion (MAF) 模块和 Inter-Class Deconfusion (ICD) 模块，有效地学习并消除 CLIP 的 logits 中的类别间混淆。这种方法不仅能够显著提高分类性能，还能缓解类别间混淆问题。

2025-07-23 17:19:40 571

原创 KAIST最新研究：一文读懂UniversalRAG如何实现多模态、多粒度的高效检索

今天，我们要深入探讨一个最新框架——**UniversalRAG**。这篇来自KAIST与DeepAuto.ai的最新研究，不仅仅是对现有RAG技术的简单升级，更是一次范式上的革新。它试图解决一个核心痛点：真实世界的问题五花八门，所需知识的形态也千差万别，而传统的RAG系统却常常被“单一”所束缚。

2025-07-23 17:18:47 578

原创为什么90%的数据产品经理都搞混了这三个模型？

上周和一个做了3年数据产品经理的朋友吃饭，他苦笑着告诉我："老大让我写PRD时要加上逻辑模型设计，我当场就懵了。`概念模型、逻辑模型、物理模型`，听起来都很高大上，可我真的分不清楚啊！

2025-07-23 17:17:26 742

原创 RAG实战：借助RAGFlow做一个员工智能助理

最近体验了一下RAGFlow的RAG能力，体验下来，它给我的感觉总结两点：1）知识检索方面能力很强；2）Agent工作流搭建很反人性，跟Coze或者Dify比，有点复杂。

2025-07-22 20:18:27 920

原创大模型能力，小模型成本！Google等 | 提出递归混合框架：MoR，大幅提升LLM计算效率

大模型能力不断增强其主要原因是强大算力，但这也是LLMs普及应用面临最严峻的挑战。那么如何在不牺牲模型性能的前提下，提升模型的效率呢？目前研究主要聚焦于参数共享和自适应计算方面，这两类方案尽管都各自取得了显著进展，但能否将两者结合实现更进一步的效率优化呢？

2025-07-22 20:17:06 724

原创 CGCompass：基于图结构与知识驱动的单细胞基础大模型

近年来，单细胞组学技术飞速发展，产出海量数据，助力生命科学研究进入精细解析基因调控机制的新阶段。而深度学习与大规模预训练基础模型在自然语言处理、计算机视觉领域的成功，也为生命科学提供了有力技术支撑。

2025-07-22 20:16:22 750

原创 Qwen3 Embedding：Qwen3官方开源的嵌入模型系列

但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

2025-07-21 20:22:02 395

原创谁都能听懂的Transformer架构-大模型微调作用和原理详解

想象一下，你手头有一本重达10公斤的《人类百科全书》，这本书通晓古今、博闻强识，但当你想查询某个专业领域的问题时，却发现书中内容过于宽泛。这时候，你最需要的是给这本"通才"书籍装上某个领域的"专业索引"，让它变成真正的"领域专家"。这就是大模型微调的核心价值。

2025-07-21 20:21:15 372

原创 AI实现大模型客服：RAG提示词与AI客服的拟人化提示词

在做AI项目落地的时候，我们一般都会在AI工作流中提供一个闲聊类型或者其他类型的问题，用于解决用户日常的咨询，那么这个时候，我们很多时候，希望这个AI客服，能够像人一些，给用户进行回复，解答一些问题，富有感情的，理解了用户的问题的AI智能客服更容易走进用户的信息，从而带来更多的商机。大模型时代可以帮助我们完成这样的事件。

2025-07-21 20:20:08 790

原创 LangChain与Embeddings技术：构建高效RAG系统的核心组件

LangChain作为当前最热门的开源RAG（Retrieval-Augmented Generation，检索增强生成）框架，正在重塑我们处理非结构化数据的方式。在RAG框架中，检索环节至关重要，而Embeddings技术则是实现高效检索的核心组件之一。

2025-07-20 10:45:00 548

原创刚刚，OpenAI 发布了自己的 Agent模式，Manus Style

一个共识是，AI 今年的大主题，是 Agent。

2025-07-19 10:45:00 1653

原创 200行极简demo - 学习如何手搓一个ReAct Agent

本文是一篇关于如何构建一个极简ReAct Agent的实践教程，使用Java语言实现。文章通过一个200行代码的示例，帮助读者深入理解ReAct模式中的“思考 - 行动 - 观察”循环机制，并借助实际场景（如补货计划单审批）演示了Agent的工作流程。此外，作者还分享了代码运行方式、核心思路及具体的执行过程，便于读者动手实践与调试。

2025-07-18 22:29:24 685

原创基于Dify 知识库的实验demo：从0到1构建智能商品分类系统

最近接到了一个新的任务，就是实现一个商品自动分类的功能，根据商家提供的商品名称，实现商品的自动归类，本篇文章记录了各种踩坑的过程，直到实现一个验证可行demo的实验过程。

2025-07-17 21:13:10 751

原创谷歌ICML25|通过学习失败经验迈向AGI！

让AI把每个bug都写成简历项目经验的摆烂式进化指南（原论文题目见文末，点击阅读原文可直接跳转至原文链接，Published on arxiv on 24 May 24, by Google DeepMind）

2025-07-17 21:12:21 837

原创几张图帮你快速了解AI智能体

本文档旨在探讨AI智能体的概念、应用及其未来发展方向。AI智能体是一种能够自主执行任务、进行决策和与环境互动的智能系统。

2025-07-17 21:11:27 685

原创大语言模型Agent在金融交易中的应用综述

在量化投资领域，股票量化交易是一项极具竞争性的任务，需要策略、知识和心理韧性的结合。在本综述中，我们全面回顾了当前关于将 LLMs 用作金融交易Agent的研究。我们总结了Agent中使用的常见架构、数据输入，以及 LLM 交易Agent在回测中的性能，还有这些研究中存在的挑战。

2025-07-16 20:59:57 832

原创让大语言模型在不知道答案时拒绝回答：KnowOrNot框架防止AI幻觉

在政府AI服务部署中，一个关键的技术挑战是如何确保系统在面对超出其知识范围的查询时能够恰当地承认信息不足，而非产生误导性的回答。考虑这样一个场景：公民通过政府AI聊天机器人查询MediShield每个保单年度的最高索赔限额，系统回答为" 150,000"。但是自2025年4月起，该限额已调整至200,000。这种信息不准确性可能导致公民基于错误信息进行财务规划，从而产生实际的经济损失。

2025-07-16 20:56:11 960

原创构建AI Agent的完整实战指南：从邮件助手案例看6步落地方法

今年几乎每家公司都在谈论构建 Agent，但真正付诸实践的却少之又少。放任想象，畅想 Agent 如何改变业务固然轻松，但许多团队却不确定从何入手、如何推进，以及该设定怎样的预期。

2025-07-16 20:54:51 547

原创抛弃预定义Tool，首次提出通过动态工具生成的Agentic多模态Reasoning，破31%涨幅

视觉推理任务中，传统多模态大模型（MLLM）常依赖预定义工具（如目标检测模型），导致**灵活性不足**与**领域适应性差**。例如面对艾宾浩斯错觉（Ebbinghaus illusion），GPT-4.1 因套用固有模板错误判断图形大小，而 **PyVision 通过动态生成 Python 代码测量像素**得出正确答案。这一对比揭示了当前视觉推理的核心痛点：模型缺乏**自主创造工具**的能力。

2025-07-15 20:15:43 265

原创 LLM 系列：模型推理篇

大型语言模型（LLM）的训练过程虽然耗资巨大且备受关注，但其真正的价值实现，却发生在 **推理（Inference）** 这一最终环节。推理是将训练好的模型应用于实际，根据 `用户输入（Prompt）生成响应的过程` 。无论是驱动一个实时聊天机器人，还是进行离线文档分析，高效、可靠的推理是所有 LLM 应用的基石。然而，这一过程远非简单地调用模型那么直接，它面临着一个核心的 *三难困境（Trilemma）

2025-07-15 20:14:49 796

原创 Prompt、Context、Memory：一组漫画带你了解大模型交互的三段技术演进

每次对话都像“第一次见你”，每轮任务都要从头讲起，它可以生成内容，却无法积累状态，也无法进行模型迭代和学习；可以理解你这一次，却无法记住你每一次。

2025-07-15 20:11:19 963

原创企业级智能体开发中所遇到的问题以及解决方案

智能体开发是目前大模型应用的主流方向之一，但由于大模型的不稳定性导致智能体开发困难重重，特别是构建能够稳定运行的智能体，更是难上加难。

2025-07-14 20:24:03 273

原创基于Dify的RAG知识库搭建

Dify 是一款开源的大模型应用开发平台，旨在帮助开发者快速构建生产级生成式 AI 应用。在Dify 本地化部署中，知识库功能是实现企业级 AI 应用的核心能力。本文介绍基于版本 1.5.1 搭建知识库全流程解析，包括以下内容：

2025-07-14 20:23:16 505

原创从RLHF、PPO到GRPO再训练推理模型，这是你需要的强化学习入门指南

强化学习（RL）已经成为当今 LLM 不可或缺的技术之一。从大模型对齐到推理模型训练再到如今的智能体强化学习（Agentic RL），你几乎能在当今 AI 领域的每个领域看到强化学习的身影。

2025-07-14 20:22:06 261

原创文档太长模型“吃不下”？试试这15种Chunking策略，轻松搞定RAG！

你知道吗？在构建一个强大的RAG（Retrieval-Augmented Generation）系统时，决定其“聪明程度”的，可能不是模型本身，而是——**你怎么“切块”你的文档

2025-07-13 10:45:00 837

原创小语言模型是智能体AI的未来

构建基于小型语言模型的智能体系统潜力巨大，其能力正在快速提升！AI开发者应该积极探索小型语言模型（SLMs）。

2025-07-12 20:10:34 261

原创惊爆！首个会“思考”的DNA大模型BioReason横空出世，推理准确率飙升至97%！

在人工智能与生命科学激烈碰撞的前沿领域，一项足以改写游戏规则的重磅研究震撼登场！2025年5月29日，多伦多大学、Vector研究所、UCSF和谷歌DeepMind携手，共同揭开了名为BioReason的全新AI架构神秘面纱，它极有可能是全球第一个真正学会 “思考” 的DNA大模型，标志着生命科学与人工智能融合进程中的重大飞跃！

2025-07-12 20:08:46 353

原创顶刊发表：时空预测新突破！精度超10+倍，速度超100+倍

近期，北大团队提出了一个**时空预测**新架构U-RNN，已发表在Journal of Hydrology（一区TOP）。实验证明，其精度超过现有AI模型10+倍（MAE），速度超过机理模型100+倍！

2025-07-11 22:30:13 234

原创 Qwen架构爆改为DeepSeek，再复现R1

在Deepseek V2出来后，MLA架构巧妙地设计吸引了我。启发我做出CLOVER[2]这篇文章。MLA中存在一个absorb操作，能将Key Weight吸收到Query Weight中，Value Weight吸收到Output Weight中，缺点是合并后参数量会变大。CLOVER先合并再分解，不改变模型结构就能得到正交的注意力头，对剪枝和微调都有很大的好处；

2025-07-11 22:29:19 817

原创如何做好AI Chat BI，准不准，元数据和标签很重要

而要做到“**准**”，标签系统确实起到了**决定性作用**，尤其在企业级 BI 场景中尤为重要。我们来系统回答你的问题

2025-07-10 20:31:24 1039

原创乌炸天！给自己电脑免费部属一套Agent 智能体搭建平台，万事不求人

最近一直在研究n8n，没错就是现在最火的那个开源智能体平台——n8n。

2025-07-10 20:30:46 1021

原创 AI + 向量检索，做一个“懂你”的 icon 推荐服务

在 AntV 信息图设计中，图标承担着将抽象文本“可视化”的作用。

2025-07-10 20:27:54 692

原创 DiffE2E：基于扩散的端到端自动驾驶框架，融合多技术实现CARLA与NAVSIM最佳性能！

端到端学习已成为自动驾驶领域的一项变革性范式。然而，驾驶行为固有的多模态特性以及长尾场景中的泛化挑战仍然是稳健部署的关键障碍。作者提出了DiffE2E，一个基于扩散的端到端自动驾驶框架。该框架首先通过分层双向交叉注意力机制对多传感器感知特征进行多尺度对齐。

2025-07-09 21:16:16 932

空空如也

空空如也