模型系列(篇五)-DeepSeek

DeepSeek学习平台

  • 今年第一场组队学习来了!含DeepSeek部署学习:https://mp.weixin.qq.com/s/nV9B6g62H4AEzkDw2J9iRw

DeepSeek生态

  • GitHub狂揽14.3K星!DeepSeek官方「工具全家桶」来了,开发者效率直接起飞:https://mp.weixin.qq.com/s/ljIiPa3xthuEVnmnNcqXFg

  • 观点 | 从Deepseek-R1 看 2025 模型的未来:https://mp.weixin.qq.com/s/wyuGyjLp1E6MPFg1PU1DkQ

  • 李国杰院士“七问”DeepSeek:https://mp.weixin.qq.com/s/sok-kMXxCyOaYXWrcBiIVw

  • 英伟达下场,首次优化DeepSeek-R1!B200性能狂飙25倍,碾压H100

DeepSeek使用

  • R1 之后,提示词技巧的变与不变:https://mp.weixin.qq.com/s/hXZ_4D2HFtjubPF0JieZDg

  • DeepSeek正确使用指南!可以放弃提示词那套了:https://mp.weixin.qq.com/s/Yql1o5teauqumD0tXuL2_Q

  • Zotero整合DeepSeek自动帮你读文献,教程来了!:https://mp.weixin.qq.com/s/J8pWhBFAzzo_qW59zJOvXw

  • 深度思考大模型API服务deepseek-free-api:https://mp.weixin.qq.com/s/Avd3WmbdSCRQhca4umWEHA

  • 两种免费使用DeepSeek的方式,不需要再去官网排队了,中国开源必胜!:https://mp.weixin.qq.com/s/jzhUJiLIvvTURN2rYmcV8Q(一:KTransformers本地部署,二:问小白平台)

  • 心法利器[129] | deepseek-R1自测效果分析和选择建议:https://mp.weixin.qq.com/s/WfB0EkpkntzqqMCed507Fg

  • DeepSeek新V3上线,和R1搭配食用最佳:https://mp.weixin.qq.com/s/VOzrK5wadgcPRXexGt_64w 推荐

  • DeepSeek接入个人知识库,保姆级教程来了!:https://mp.weixin.qq.com/s/p6iwPz3LCv3QI7d-b2u1rA

DeepSeek总体介绍

  • CCF2025 Talk-夜话DeepSeek:https://mp.weixin.qq.com/s/S2vRNoTwM_yo0eAm3LDfAw 推荐

  • 十个关键词,带你全面看懂DeepSeek!:https://mp.weixin.qq.com/s/B1HcmnKXXInehR17tlSy6w

  • 深入了解Deepseek模型的最佳三篇论文:https://mp.weixin.qq.com/s/A_GBrDSE2wLcTHrvbWj9Ug

  • DeepSeek从入门到精通【104页超详细资料】:https://mp.weixin.qq.com/s/jomk7r39lertmwojPnz4ZA 推荐

  • 一文纵览DeepSeek模型家族:从LLM到R1:https://mp.weixin.qq.com/s/TFsO6B1ITx7tJv_T9fq8Wg 推荐

  • DeepSeek解析,速通DeepSeekV1~V3核心技术点!:https://mp.weixin.qq.com/s/EKaAd9SsirwygGDYHKVfSg

  • DeepSeek R1 最新全面综述,近两个月的深度思考!:https://mp.weixin.qq.com/s/aZky-d9733mhbAAS24n6zg 推荐

  • 腾讯:23张PPT搞懂DeepSeek核心技术!:https://mp.weixin.qq.com/s/o9zzeQpwoUCR0WdRXdMfvg 推荐

  • DeepSeek大模型原创核心技术解读 推荐

  • 大模型24|DeepSeek相关技术名词含义详解(面向国人的一次倾情科普):https://mp.weixin.qq.com/s/1qo1NIQ5n2k1F9gOhpUfCg 推荐

  • DeepSeek技术全景解析(五):DeepSeek-V3如何在保持高精度的同时提升计算效率:https://mp.weixin.qq.com/s/MC7rBTH-fuPvS4F87GTXOA 推荐

DeepSeek量化系列

  • 目前来看,ollama量化过的DeepSeek模型应该就是最具性价比的选择:https://mp.weixin.qq.com/s/FQG67iWkbrnROS7KRxqHdw

  • 一文学习DeepSeek-V3的蒸馏技术:https://mp.weixin.qq.com/s/zYTQiwqoFoICnvr-x4X9uQ

DeepSeek部署

  • 群晖上私有化部署DeepSeek-R1:https://mp.weixin.qq.com/s/voIekAkardR8V-fB-YqQMQ

  • 手把手带你实战部署DeepSeek-R1大模型(手机安卓端、linux端、windows端):https://mp.weixin.qq.com/s/IJXUGoEXECK9b_EOR4hmrw

  • 【好强!在数学领域 1.5B参数超过GPT-4o!】Deepseek-R1开源啦!本文实战部署推理代码,效果着实惊艳!:https://mp.weixin.qq.com/s/ga7lVNLF5P2k_UoX9mo4pg

  • 本地部署DeepSeek硬件配置清单,满血版太炸裂了:https://mp.weixin.qq.com/s/M7HB7e8d2Qo9J1jdgPefsg

  • 私有化部署DeepSeek等大模型的性能估计:https://mp.weixin.qq.com/s/qKkxipKwLBKxMp36cQo-1A

  • DeepSeek 两种部署方式及官方Prompt模板:https://mp.weixin.qq.com/s/RRTP1RWaN7VH6kec4hatBw

  • 手把手教你驯服DeepSeek-R1!部署+测试+性能优化万字全攻略:https://mp.weixin.qq.com/s/gkFNLeTdh4bafSXOFmQhlA 推荐

  • KTransformer:把 DeepSeek R1 推理机器成本打下来:https://mp.weixin.qq.com/s/R6g1_G6rxTYHeHLt3HgIVg

DeepSeek评测

DeepSeek复现

R1 Zero

  • Deepseek R1 Zero复现全过程记录:https://mp.weixin.qq.com/s/Xg5r3lCycWiMbRuolH9bBQ

  • DeepSeek R1 Zero中文复现教程来了!:https://mp.weixin.qq.com/s/Z7P61IV3n4XYeC0Et_fvwg 推荐

  • 32b R1-Zero复现,聚焦scaling:https://mp.weixin.qq.com/s/vIvszGtRm5do5ISsfI7X7Q 推荐

  • R1-Zero(GRPO)的复现实验记录,踩坑问题(小模型):https://mp.weixin.qq.com/s/1jpgzqEvvOW_NYm0DawRkw 推荐

R1

  • Qwen架构改造成Deepseek,再复现R1计划:https://mp.weixin.qq.com/s/UKPOT-wKVMAoRYUdkJzAEg

  • 0元!使用魔搭免费算力,基于Qwen基座模型,复现DeepSeek-R1:https://mp.weixin.qq.com/s/EkFRLMwHMdLvyra-ql-1QQ 使用Qwen2.5-0.5B模型实现

  • 聊聊DeepSeek R1的开源复现库——Open R1之合成数据:通过Distilable库来生成合成数据,通过prompt引导输出对应格式的数据。https://mp.weixin.qq.com/s/MnmqkWMQeMz3FMarKcqdCA

  • Light-R1-32B之R1复现认识:兼看R1蒸馏模型所用800K数据细节问题:https://mp.weixin.qq.com/s/Cb-P7ioVzG6Jj_iraOCYAQ 推荐

  • 尝试基于0.5B小模型复现DeepSeek-R1的思维链:https://mp.weixin.qq.com/s/RAhLgO0KehR2gh95fOoIqg 包括复现完整代码 推荐

  • 开源社区 DeepSeek R1 最新复现进展汇总:https://mp.weixin.qq.com/s/WlgKVIeUUL2IT89gMTajdw 推荐

  • HuggingFace 又出新教程啦!手把手教你构建DeepSeek-R1推理模型 推荐

  • R1复现小记:在业务场景的两类NLP任务上有显著效果

  • DeepSeek-R1复现之集大成者:DeepSeek-R1复现之集大成者 推荐,将目前复现的项目整合到了一起

  • 用极小模型复现R1思维链失败后的感悟:https://mp.weixin.qq.com/s/HSTNbZiayIKzYheR1tg10A 值得思考

DeepSeek技术基石

Scaling Law

  • 万字长文解读Scaling Law的一切,洞见LLM的未来:。https://mp.weixin.qq.com/s/ohyTi1IEaRRH0ESGGDQiYw

  • S型智能增长曲线:从Deepseek R1看Scaling Law的未来:https://mp.weixin.qq.com/s/614-4cW5VQHl44otz3NT6g

  • 张俊林:从Grok 3看Scaling Law已死?:https://mp.weixin.qq.com/s/x_WHffjPgss3BMixTv3ZkQ

  • 回顾 LLM 领域的一些热词,哪些你不知道?:https://mp.weixin.qq.com/s/k8qvj6xixBgJaEuAOV78pQ

MoE

  • 理解DeepSeek在MoE技术的演进过程和具体实现:https://mp.weixin.qq.com/s/lDqFomS_pqNPyZ2HLrUH8Q 推荐

  • 广告行业中那些趣事系列99:DeepSeek中非常重要的混合专家模型MoE技术详解:https://mp.weixin.qq.com/s/iSWtvP13Yd66Asox-bwSRw 推荐

  • 详细谈谈DeepSeek MoE相关的技术发展:https://mp.weixin.qq.com/s/L8BAFuT5tevRzX9mu0yR-g 推荐

  • 可视化图解MOE大模型的7个核心问题:专家、路由、负载均衡及其用于视觉模态 推荐

MLA

  • 一文了解Deepseek系列中的MLA技术:https://mp.weixin.qq.com/s/WUyY2F6Cr9EU15FHeKM9eg

知识蒸馏

  • 知识蒸馏技术原理详解:从软标签到模型压缩的实现机制:https://mp.weixin.qq.com/s/lwETI5Fa9t48eOIm5usExQ

  • 一文搞懂DeepSeek - 强化学习和蒸馏:https://mp.weixin.qq.com/s/NpffZFVMPHrRtAFjCXZZ-Q

分布式并行

  • DeepSeek背后的技术基石:MoE、数据并行与模型并行:https://mp.weixin.qq.com/s/7woIbImqJLUfQF4NXlrF6w

  • 详细谈谈DeepSeek MoE相关的技术发展:https://mp.weixin.qq.com/s/L8BAFuT5tevRzX9mu0yR-g 推荐

强化学习

  • 5000字!深入解析 PPO 算法:从原理到公式:https://mp.weixin.qq.com/s/UdbF-uV4mZGywf63U6M6NQ

  • 聊聊DeepSeek训练——基于强化学习训练的底层逻辑:https://mp.weixin.qq.com/s/nb6HjRtYqMY80Mhki_MGyw

  • DeepSeek R1爆火后,该如何理解 LLM 中的 RL 算法?:https://mp.weixin.qq.com/s/Tw0oxvUWUH2Z0VeCfQGBsw

  • 【手撕GRPO】你只管给Reward, 剩下的交给RL(附代码):https://mp.weixin.qq.com/s/v4OSW1pi6BqRH6p3R9cQzw

  • Deepseek的RL算法GRPO解读:https://mp.weixin.qq.com/s/MIKz0a9HoEWtoR1yjnkjPA 推荐

  • PPO & GRPO 可视化介绍:https://mp.weixin.qq.com/s/HE5wUIzg5c2u2yqEVVB9fw

  • DeepSeek 背后的数学原理:深入探究群体相对策略优化 (GRPO):https://mp.weixin.qq.com/s/Z-wRuqsQTF_6TeV7ao_9Yw 推荐

  • 通俗理解RLHF和如何实现PPO 算法:https://mp.weixin.qq.com/s/Htk56_jxVDULkklw298e3A 推荐

  • GRPO简化Trick | 只改一个参数, 性能涨10%??:https://mp.weixin.qq.com/s/BxHbU0sD9wWlvTq5JIcZ3w 推荐

  • 一文读懂DPO PPO GRPO三者强化学习适用场景:https://mp.weixin.qq.com/s/xgIwLEtTiLW0iMtGOfOiPg 推荐

  • 从理论到代码剖析DeepSeek-R1:从PPO到Reinforce++,再对比GRPO:https://mp.weixin.qq.com/s/qcwR5D03z4YfRmZJctH8mg 推荐

  • DeepSeek-R1技术剖析:没有强化学习基础也能看懂的PPO & GRPO:https://mp.weixin.qq.com/s/Dx4g1d0LBOq6dBsDuqMWWA 推荐

  • DeepSeek关键RL算法GRPO,手把手教你从头跑通!:https://mp.weixin.qq.com/s/gi8ee4m6borLPlPRBcp7Mg,有具体的代码实现 推荐

DeepSeek开源一周技术

图解KV Cache:解锁LLM推理效率的关键

DeepSeek开源周 Day01:从FlashMLA背后原理回顾KV Cache

DeepSeek开源周 Day02:从DeepEP开源趋势重新审视大模型Infra

DeepSeek开源周 Day03:从DeepGEMM看大模型算力提速的矩阵乘法

DeepSeek开源周 Day04:从DualPipe聊聊大模型分布式训练的并行策略

DeepSeek开源周 Day05:从3FS盘点分布式文件存储系统

大模型上周回顾及Deepseek开源周总结:兼看面向多任务的模型融合思路

DeepSeek五连炸!技术全析:从GPU榨干性能到PB级数据秒处理,一次看完,太硬核!

结尾

亲爱的读者朋友:感谢您在繁忙中驻足阅读本期内容!您的到来是对我们最大的支持❤️

正如古语所言:"当局者迷,旁观者清"。您独到的见解与客观评价,恰似一盏明灯💡,能帮助我们照亮内容盲区,让未来的创作更加贴近您的需求。

若此文给您带来启发或收获,不妨通过以下方式为彼此搭建一座桥梁: ✨ 点击右上角【点赞】图标,让好内容被更多人看见 ✨ 滑动屏幕【收藏】本篇,便于随时查阅回味 ✨ 在评论区留下您的真知灼见,让我们共同碰撞思维的火花

我始终秉持匠心精神,以键盘为犁铧深耕知识沃土💻,用每一次敲击传递专业价值,不断优化内容呈现形式,力求为您打造沉浸式的阅读盛宴📚。

有任何疑问或建议?评论区就是我们的连心桥!您的每一条留言我都将认真研读,并在24小时内回复解答📝。

愿我们携手同行,在知识的雨林中茁壮成长🌳,共享思想绽放的甘甜果实。下期相遇时,期待看到您智慧的评论与闪亮的点赞身影✨!

万分感谢🙏🙏您的点赞👍👍、收藏⭐🌟、评论💬🗯️、关注❤️💚~


自我介绍:一线互联网大厂资深算法研发(工作6年+),4年以上招聘面试官经验(一二面面试官,面试候选人400+),深谙岗位专业知识、技能雷达图,已累计辅导15+求职者顺利入职大中型互联网公司。熟练掌握大模型、NLP、搜索、推荐、数据挖掘算法和优化,提供面试辅导、专业知识入门到进阶辅导等定制化需求等服务,助力您顺利完成学习和求职之旅(有需要者可私信联系) 

友友们,自己的知乎账号为“快乐星球”,定期更新技术文章,敬请关注!   

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值