
ai前沿
文章平均质量分 76
Jude_lennon
经历
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【Agent再迎来新发展】强化学习之父携手DeepMind发布论文:欢迎来到经验时代
如何从依赖人类数据的时代迈向人工智能自主学习的时代?为了解决这个问题,刚获得图灵奖的强化学习之父Richard S. Sutton携手DeepMind发布了一篇重量级的论文。这标志着 DeepMind 的人工智能系统从人类数据训练转向类似 AlphaGo 的自主学习和探索型智能体。这与 OpenAI 的 LLM 人工智能发展路径截然不同,以下是论文《Welcome to the Era of Experience》阅读笔记。原创 2025-05-27 22:32:17 · 663 阅读 · 0 评论 -
【国产大模型】DeepSeek发布推理版本r1,性能超越openAI o1
DeepSeek-R1-Lite预览版在解决这些复杂数学问题时拥有极强的“拆解能力”,能够将复杂任务分解为更小的步骤并逐一执行,从而提高其准确性。当时,DeepSeek V2的API定价约等于谷歌的七分之一,GPT-4 Turbo的七十分之一。在前不久发布模型名为DeepSeek-R1-Lite,预览版在难度较高数学和代码任务上超越o1-preview,大幅领先GPT-4o等。随着思维长度的增加,DeepSeek-R1-Lite-Preview 在 AIME 上的得分稳步提高。推理时间更长,性能更佳。原创 2024-11-22 11:33:18 · 1916 阅读 · 0 评论 -
微信公众号推文,关于LLM等
超强!深度学习Top10算法!Agent调研–19类Agent框架对比万字解读AI Agent架构体系,API和RPA将成为重点苹果加入战局,携 300 亿参数的 AI 大模型 MM1 “炸场”!使用Pytorch从零实现Transformer模型ResNet最新变体!性能反超Transformer,模型准确率达98.42%GNN与Transformer创新结合!模型性能起飞!24年最好发论文的方向: 魔改Mamba!(附源码)结合Transformer与Mamba,Jamba来了!新架构Mamba更新二代原创 2024-10-24 15:57:16 · 836 阅读 · 0 评论 -
生成模型可用于解决数学研究层面的问题
Meta和巴黎理工学院的研究人员共同探讨了一个困扰数学界长达132年的问题:李雅普诺夫函数。简单来说,李雅普诺夫函数用于判断一个动力系统相对于其平衡点或轨道,随着时间无限延长后是否能保持全局稳定。论文标题:Global Lyapunov functions: a long-standing open problem in mathematics, with symbolic transformers。原创 2024-10-24 10:39:36 · 754 阅读 · 0 评论 -
因为一句废话,大模型无法解决小学数学题?
前段时间,François Chollet 还发帖说,LLM 通过提示使用时,无法理解与训练数据中情况大相径庭的情况,因此不具备通用智能。他认为,**LLM 的作用主要是作为实际 AGI 的知识和程序存储,它们是一种记忆形式,而智能不仅仅是记忆。星期天,他摘的猕猴桃数量是星期五的两倍。奥利弗有多少个猕猴桃?正如研究人员在他们的论文中所说:「我们研究了这些模型中数学推理的脆弱性,并证明随着问题中子句数量的增加,它们的性能显著下降。星期天,他摘的猕猴桃数量是星期五的两倍,但其中 5 个比平均大小要小。原创 2024-10-23 10:14:52 · 844 阅读 · 0 评论 -
AI前沿 | NVIDIA发布开放的多样化数据生成for LLMs
导航Nemotron生成合成数据原创 2024-06-18 10:18:16 · 1386 阅读 · 0 评论