DeepSeek学习平台
-
今年第一场组队学习来了!含DeepSeek部署学习:https://mp.weixin.qq.com/s/nV9B6g62H4AEzkDw2J9iRw
DeepSeek生态
-
GitHub狂揽14.3K星!DeepSeek官方「工具全家桶」来了,开发者效率直接起飞:https://mp.weixin.qq.com/s/ljIiPa3xthuEVnmnNcqXFg
-
观点 | 从Deepseek-R1 看 2025 模型的未来:https://mp.weixin.qq.com/s/wyuGyjLp1E6MPFg1PU1DkQ
-
李国杰院士“七问”DeepSeek:https://mp.weixin.qq.com/s/sok-kMXxCyOaYXWrcBiIVw
DeepSeek使用
-
R1 之后,提示词技巧的变与不变:https://mp.weixin.qq.com/s/hXZ_4D2HFtjubPF0JieZDg
-
DeepSeek正确使用指南!可以放弃提示词那套了:https://mp.weixin.qq.com/s/Yql1o5teauqumD0tXuL2_Q
-
Zotero整合DeepSeek自动帮你读文献,教程来了!:https://mp.weixin.qq.com/s/J8pWhBFAzzo_qW59zJOvXw
-
深度思考大模型API服务deepseek-free-api:https://mp.weixin.qq.com/s/Avd3WmbdSCRQhca4umWEHA
-
两种免费使用DeepSeek的方式,不需要再去官网排队了,中国开源必胜!:https://mp.weixin.qq.com/s/jzhUJiLIvvTURN2rYmcV8Q(一:KTransformers本地部署,二:问小白平台)
-
心法利器[129] | deepseek-R1自测效果分析和选择建议:https://mp.weixin.qq.com/s/WfB0EkpkntzqqMCed507Fg
-
DeepSeek新V3上线,和R1搭配食用最佳:https://mp.weixin.qq.com/s/VOzrK5wadgcPRXexGt_64w 推荐
-
DeepSeek接入个人知识库,保姆级教程来了!:https://mp.weixin.qq.com/s/p6iwPz3LCv3QI7d-b2u1rA
DeepSeek总体介绍
-
CCF2025 Talk-夜话DeepSeek:https://mp.weixin.qq.com/s/S2vRNoTwM_yo0eAm3LDfAw 推荐
-
十个关键词,带你全面看懂DeepSeek!:https://mp.weixin.qq.com/s/B1HcmnKXXInehR17tlSy6w
-
深入了解Deepseek模型的最佳三篇论文:https://mp.weixin.qq.com/s/A_GBrDSE2wLcTHrvbWj9Ug
-
DeepSeek从入门到精通【104页超详细资料】:https://mp.weixin.qq.com/s/jomk7r39lertmwojPnz4ZA 推荐
-
一文纵览DeepSeek模型家族:从LLM到R1:https://mp.weixin.qq.com/s/TFsO6B1ITx7tJv_T9fq8Wg 推荐
-
DeepSeek解析,速通DeepSeekV1~V3核心技术点!:https://mp.weixin.qq.com/s/EKaAd9SsirwygGDYHKVfSg
-
DeepSeek R1 最新全面综述,近两个月的深度思考!:https://mp.weixin.qq.com/s/aZky-d9733mhbAAS24n6zg 推荐
-
腾讯:23张PPT搞懂DeepSeek核心技术!:https://mp.weixin.qq.com/s/o9zzeQpwoUCR0WdRXdMfvg 推荐
-
大模型24|DeepSeek相关技术名词含义详解(面向国人的一次倾情科普):https://mp.weixin.qq.com/s/1qo1NIQ5n2k1F9gOhpUfCg 推荐
-
DeepSeek技术全景解析(五):DeepSeek-V3如何在保持高精度的同时提升计算效率:https://mp.weixin.qq.com/s/MC7rBTH-fuPvS4F87GTXOA 推荐
DeepSeek量化系列
-
目前来看,ollama量化过的DeepSeek模型应该就是最具性价比的选择:https://mp.weixin.qq.com/s/FQG67iWkbrnROS7KRxqHdw
-
一文学习DeepSeek-V3的蒸馏技术:https://mp.weixin.qq.com/s/zYTQiwqoFoICnvr-x4X9uQ
DeepSeek部署
-
群晖上私有化部署DeepSeek-R1:https://mp.weixin.qq.com/s/voIekAkardR8V-fB-YqQMQ
-
手把手带你实战部署DeepSeek-R1大模型(手机安卓端、linux端、windows端):https://mp.weixin.qq.com/s/IJXUGoEXECK9b_EOR4hmrw
-
【好强!在数学领域 1.5B参数超过GPT-4o!】Deepseek-R1开源啦!本文实战部署推理代码,效果着实惊艳!:https://mp.weixin.qq.com/s/ga7lVNLF5P2k_UoX9mo4pg
-
本地部署DeepSeek硬件配置清单,满血版太炸裂了:https://mp.weixin.qq.com/s/M7HB7e8d2Qo9J1jdgPefsg
-
私有化部署DeepSeek等大模型的性能估计:https://mp.weixin.qq.com/s/qKkxipKwLBKxMp36cQo-1A
-
DeepSeek 两种部署方式及官方Prompt模板:https://mp.weixin.qq.com/s/RRTP1RWaN7VH6kec4hatBw
-
手把手教你驯服DeepSeek-R1!部署+测试+性能优化万字全攻略:https://mp.weixin.qq.com/s/gkFNLeTdh4bafSXOFmQhlA 推荐
-
KTransformer:把 DeepSeek R1 推理机器成本打下来:https://mp.weixin.qq.com/s/R6g1_G6rxTYHeHLt3HgIVg
DeepSeek评测
-
DeepSeek开源FlashMLA评测,性能大幅提升:https://mp.weixin.qq.com/s/KDINC_5jF6trIZMifcvoOA
DeepSeek复现
R1 Zero
-
Deepseek R1 Zero复现全过程记录:https://mp.weixin.qq.com/s/Xg5r3lCycWiMbRuolH9bBQ
-
DeepSeek R1 Zero中文复现教程来了!:https://mp.weixin.qq.com/s/Z7P61IV3n4XYeC0Et_fvwg 推荐
-
32b R1-Zero复现,聚焦scaling:https://mp.weixin.qq.com/s/vIvszGtRm5do5ISsfI7X7Q 推荐
-
R1-Zero(GRPO)的复现实验记录,踩坑问题(小模型):https://mp.weixin.qq.com/s/1jpgzqEvvOW_NYm0DawRkw 推荐
R1
-
Qwen架构改造成Deepseek,再复现R1计划:https://mp.weixin.qq.com/s/UKPOT-wKVMAoRYUdkJzAEg
-
0元!使用魔搭免费算力,基于Qwen基座模型,复现DeepSeek-R1:https://mp.weixin.qq.com/s/EkFRLMwHMdLvyra-ql-1QQ 使用Qwen2.5-0.5B模型实现
-
聊聊DeepSeek R1的开源复现库——Open R1之合成数据:通过Distilable库来生成合成数据,通过prompt引导输出对应格式的数据。https://mp.weixin.qq.com/s/MnmqkWMQeMz3FMarKcqdCA
-
Light-R1-32B之R1复现认识:兼看R1蒸馏模型所用800K数据细节问题:https://mp.weixin.qq.com/s/Cb-P7ioVzG6Jj_iraOCYAQ 推荐
-
尝试基于0.5B小模型复现DeepSeek-R1的思维链:https://mp.weixin.qq.com/s/RAhLgO0KehR2gh95fOoIqg 包括复现完整代码 推荐
-
开源社区 DeepSeek R1 最新复现进展汇总:https://mp.weixin.qq.com/s/WlgKVIeUUL2IT89gMTajdw 推荐
-
R1复现小记:在业务场景的两类NLP任务上有显著效果
-
DeepSeek-R1复现之集大成者:DeepSeek-R1复现之集大成者 推荐,将目前复现的项目整合到了一起
-
用极小模型复现R1思维链失败后的感悟:https://mp.weixin.qq.com/s/HSTNbZiayIKzYheR1tg10A 值得思考
DeepSeek技术基石
Scaling Law
-
万字长文解读Scaling Law的一切,洞见LLM的未来:。https://mp.weixin.qq.com/s/ohyTi1IEaRRH0ESGGDQiYw
-
S型智能增长曲线:从Deepseek R1看Scaling Law的未来:https://mp.weixin.qq.com/s/614-4cW5VQHl44otz3NT6g
-
张俊林:从Grok 3看Scaling Law已死?:https://mp.weixin.qq.com/s/x_WHffjPgss3BMixTv3ZkQ
-
回顾 LLM 领域的一些热词,哪些你不知道?:https://mp.weixin.qq.com/s/k8qvj6xixBgJaEuAOV78pQ
MoE
-
理解DeepSeek在MoE技术的演进过程和具体实现:https://mp.weixin.qq.com/s/lDqFomS_pqNPyZ2HLrUH8Q 推荐
-
广告行业中那些趣事系列99:DeepSeek中非常重要的混合专家模型MoE技术详解:https://mp.weixin.qq.com/s/iSWtvP13Yd66Asox-bwSRw 推荐
-
详细谈谈DeepSeek MoE相关的技术发展:https://mp.weixin.qq.com/s/L8BAFuT5tevRzX9mu0yR-g 推荐
MLA
-
一文了解Deepseek系列中的MLA技术:https://mp.weixin.qq.com/s/WUyY2F6Cr9EU15FHeKM9eg
知识蒸馏
-
知识蒸馏技术原理详解:从软标签到模型压缩的实现机制:https://mp.weixin.qq.com/s/lwETI5Fa9t48eOIm5usExQ
-
一文搞懂DeepSeek - 强化学习和蒸馏:https://mp.weixin.qq.com/s/NpffZFVMPHrRtAFjCXZZ-Q
分布式并行
-
DeepSeek背后的技术基石:MoE、数据并行与模型并行:https://mp.weixin.qq.com/s/7woIbImqJLUfQF4NXlrF6w
-
详细谈谈DeepSeek MoE相关的技术发展:https://mp.weixin.qq.com/s/L8BAFuT5tevRzX9mu0yR-g 推荐
强化学习
-
5000字!深入解析 PPO 算法:从原理到公式:https://mp.weixin.qq.com/s/UdbF-uV4mZGywf63U6M6NQ
-
聊聊DeepSeek训练——基于强化学习训练的底层逻辑:https://mp.weixin.qq.com/s/nb6HjRtYqMY80Mhki_MGyw
-
DeepSeek R1爆火后,该如何理解 LLM 中的 RL 算法?:https://mp.weixin.qq.com/s/Tw0oxvUWUH2Z0VeCfQGBsw
-
【手撕GRPO】你只管给Reward, 剩下的交给RL(附代码):https://mp.weixin.qq.com/s/v4OSW1pi6BqRH6p3R9cQzw
-
Deepseek的RL算法GRPO解读:https://mp.weixin.qq.com/s/MIKz0a9HoEWtoR1yjnkjPA 推荐
-
PPO & GRPO 可视化介绍:https://mp.weixin.qq.com/s/HE5wUIzg5c2u2yqEVVB9fw
-
DeepSeek 背后的数学原理:深入探究群体相对策略优化 (GRPO):https://mp.weixin.qq.com/s/Z-wRuqsQTF_6TeV7ao_9Yw 推荐
-
通俗理解RLHF和如何实现PPO 算法:https://mp.weixin.qq.com/s/Htk56_jxVDULkklw298e3A 推荐
-
GRPO简化Trick | 只改一个参数, 性能涨10%??:https://mp.weixin.qq.com/s/BxHbU0sD9wWlvTq5JIcZ3w 推荐
-
一文读懂DPO PPO GRPO三者强化学习适用场景:https://mp.weixin.qq.com/s/xgIwLEtTiLW0iMtGOfOiPg 推荐
-
从理论到代码剖析DeepSeek-R1:从PPO到Reinforce++,再对比GRPO:https://mp.weixin.qq.com/s/qcwR5D03z4YfRmZJctH8mg 推荐
-
DeepSeek-R1技术剖析:没有强化学习基础也能看懂的PPO & GRPO:https://mp.weixin.qq.com/s/Dx4g1d0LBOq6dBsDuqMWWA 推荐
-
DeepSeek关键RL算法GRPO,手把手教你从头跑通!:https://mp.weixin.qq.com/s/gi8ee4m6borLPlPRBcp7Mg,有具体的代码实现 推荐
DeepSeek开源一周技术
DeepSeek开源周 Day01:从FlashMLA背后原理回顾KV Cache
DeepSeek开源周 Day02:从DeepEP开源趋势重新审视大模型Infra
DeepSeek开源周 Day03:从DeepGEMM看大模型算力提速的矩阵乘法
DeepSeek开源周 Day04:从DualPipe聊聊大模型分布式训练的并行策略
DeepSeek开源周 Day05:从3FS盘点分布式文件存储系统
大模型上周回顾及Deepseek开源周总结:兼看面向多任务的模型融合思路
DeepSeek五连炸!技术全析:从GPU榨干性能到PB级数据秒处理,一次看完,太硬核!
结尾
亲爱的读者朋友:感谢您在繁忙中驻足阅读本期内容!您的到来是对我们最大的支持❤️
正如古语所言:"当局者迷,旁观者清"。您独到的见解与客观评价,恰似一盏明灯💡,能帮助我们照亮内容盲区,让未来的创作更加贴近您的需求。
若此文给您带来启发或收获,不妨通过以下方式为彼此搭建一座桥梁: ✨ 点击右上角【点赞】图标,让好内容被更多人看见 ✨ 滑动屏幕【收藏】本篇,便于随时查阅回味 ✨ 在评论区留下您的真知灼见,让我们共同碰撞思维的火花
我始终秉持匠心精神,以键盘为犁铧深耕知识沃土💻,用每一次敲击传递专业价值,不断优化内容呈现形式,力求为您打造沉浸式的阅读盛宴📚。
有任何疑问或建议?评论区就是我们的连心桥!您的每一条留言我都将认真研读,并在24小时内回复解答📝。
愿我们携手同行,在知识的雨林中茁壮成长🌳,共享思想绽放的甘甜果实。下期相遇时,期待看到您智慧的评论与闪亮的点赞身影✨!
万分感谢🙏🙏您的点赞👍👍、收藏⭐🌟、评论💬🗯️、关注❤️💚~
自我介绍:一线互联网大厂资深算法研发(工作6年+),4年以上招聘面试官经验(一二面面试官,面试候选人400+),深谙岗位专业知识、技能雷达图,已累计辅导15+求职者顺利入职大中型互联网公司。熟练掌握大模型、NLP、搜索、推荐、数据挖掘算法和优化,提供面试辅导、专业知识入门到进阶辅导等定制化需求等服务,助力您顺利完成学习和求职之旅(有需要者可私信联系)
友友们,自己的知乎账号为“快乐星球”,定期更新技术文章,敬请关注!