- 博客(202)
- 收藏
- 关注
原创 【论文精读】OAgents: An Empirical Study of Building Effective Agents
【论文精读】OAgents: An Empirical Study of Building Effective Agents
2025-09-12 00:58:23
729
原创 【论文精读】Synthetic Data Generation & Multi-Step RL for Reasoning & Tool Use
Synthetic Data Generation & Multi-Step RL for Reasoning & Tool Use
2025-09-12 00:51:36
559
原创 【论文精读】Research and Design of Intelligent Parking Management System Based on the YOLO Algorithm
基于 YOLO 算法的智能停车管理系统的研究与设计- Research and Design of Intelligent Parking Management System Based on the YOLO Algorithm
2025-09-01 23:33:28
960
原创 【论文精读】 PVPO: PRE-ESTIMATED VALUE-BASED POLICY OPTIMIZATION FOR AGENTIC REASONING
【论文精读】 PVPO: PRE-ESTIMATED VALUE-BASED POLICY OPTIMIZATION FOR AGENTIC REASONING
2025-09-01 23:17:21
824
原创 【大模型LLM】大模型训练加速 - 模型并行(Model Parallelism)原理详解
大模型训练加速 - 模型并行(Model Parallelism)原理详解
2025-08-02 09:41:58
397
原创 【大模型LLM】大模型训练加速 - 深度混合精度训练(Mixed Precision Training)原理详解
大模型训练加速 - 深度混合精度训练(Mixed Precision Training)原理详解
2025-08-02 09:35:29
389
原创 【大模型LLM】大模型训练加速 - 数据并行(Data Parallelism, DP)原理详解
大模型训练加速-数据并行(Data Parallelism, DP)原理详解
2025-08-02 09:30:39
936
原创 【大模型LLM】大模型训练加速 - 梯度累积(Gradient Accumulation)原理详解
大模型训练加速 - 梯度累积(Gradient Accumulation)原理详解
2025-07-28 18:36:10
980
原创 【大模型LLM】大模型微调训练的过程中 怎么在保留基模的知识能力的基础上 提升模型在微调数据集上的表现
大模型微调训练的过程中 怎么在保留基模的知识能力的基础上 提升模型在微调数据集上的表现
2025-07-14 22:36:17
828
原创 【大模型LLM】 Megatron-LM 大模型训练框架吞吐率计算&吞吐率优化策略
Megatron-LM 大模型训练框架吞吐率计算&吞吐率优化策略
2025-07-06 23:37:10
1014
原创 【文本大模型】从0开始 - 本地部署一个ChatGLM对话模型(基于WebUI)
从0开始 - 本地部署一个ChatGLM对话模型(基于WebUI)
2025-06-18 23:50:09
1144
原创 【大模型】大模型RAG(Retrieval-Augmented Generation)面试题合集
大模型RAG(Retrieval-Augmented Generation)面试题合集
2025-06-07 18:18:13
818
原创 【推荐算法】Embedding+MLP:TensorFlow实现经典深度学习推荐模型详解
Embedding+MLP:TensorFlow实现经典深度学习推荐模型详解
2025-06-04 23:56:57
1260
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人