Oculus Reparo！-CSDN博客

原创强化学习初探及OREAL实践

这个配置可以在40G显卡的显卡上完成训练（偶尔会OOM），至于训练出的水平就不要在意了，无数先辈复现Deepseek R1-Zero模型时就发现过一个铁律，小于 3B 的模型无法学会推理，只适合使用sft微调而不是强化学习。正确的py文件我会直接放到文章中。原版的repo使用的是72B的模型，但这个对大家来说开销太大了，因此换个1.5B的模型意思下。字样，并且花费的时间特别久，就直接去官网下载预编译好的版本自己上传安装吧，别浪费时间编译了，对于按前面的方法搭建的环境来说，直接安装这个包就行。

2025-07-13 22:44:00 1040 1

原创智能体协议 MCP + 书生大模型实践

—— 通过可视化方式解析MCP核心概念、架构与未来前景MCP：AI 的“USB-C 端口”类比大模型的信息孤岛困境传统解决方案与其局限性MCP 核心架构总览MCP 通信机制详解MCP 的三种上下文供给方式MCP 实际工作流程可视化MCP vs 上下文窗口机制（如prompt size）MCP vs ReAct / Agent 架构MCP vs RAG / 插件系统Claude 3 的超长上下文能力简述Claude 如何实现百万 Token 的上下文管理Claude + MCP：构建新一代智能助手MCP 的性

2025-07-07 10:30:44 285

原创 CAMEL 书生多智能体系统实践

使用conda是因为每次重启云，从本地安装的软件又会被重置掉，安装的环境又会失效！3.使用自定义及预定义的 tool 自定义一个自己的 agent（我尽量兼顾简洁与知识点覆盖，有意思的是出现了个提示词相关的问题，见运行结果图，虽然大模型能力在不断增强，搭建一个自己的多智能体系统（这里为让萌新有更全面的理解，我增加了难度做了修改，把用Roleplaying。），作者按照课程任务要求编写两段代码，代码并没有参照课程给出的范例进行编写，视频理解(用什么视频都行，短一点，理解的还真是不错)三段代码运行效果见下图。

2025-07-07 10:02:42 910

原创 Error: llama runner process has terminated: exit status 2

Error: llama runner process has terminated: exit status 2错误是近期刚刚由于某些软件版本原因爆发的错误。估计很多人都已经用大模型查过怎么处理了，所以我就不再做原因分析了和重复赘述了，如果别的办法都不行可以尝试下面的解决方案。解决方案：安装最新的 Microsoft Visual C++ Redistributable 版本后，系统需要重启。

2025-07-01 08:48:15 806

原创 GraphGen：训练数据合成实践

该框架通过构建细粒度知识图谱、识别 LLMs 的知识盲点、并生成多风格的内容来提高模型在知识密集型任务上的表现。最后多说一下，bash scripts/generate.sh命令执行后我有很多次生成的数据都是0，后来我认为是jsonl文件的问题自己创建了新的数据文件就可以执行了，但是。- 聚合 QA 生成：组织和改写子图中的数据，生成涉及多个实体和关系的综合性问答对。- 知识图谱聚合：将不同片段中的相同实体或关系的描述自动合并，形成知识图谱。- 多跳 QA 生成：明确实体间关系，生成需要多步推理的问答对。

2025-06-26 20:40:39 988

原创 InternLM 论文分类微调实践（XTuner 版）

首先需要在 ModelScope 创建模型，为你的模型取一个响亮优雅又好听的名字，然后按右下图中的信息创建（下面截图有点问题，根本不需要创建②，如果你创建了使用。

2025-06-12 12:39:24 1024

原创 LMDeploy 课程

1.本次课程文档涵盖广泛，相当于较为完整的用户手册，部分完全小白用户使用时，可能会有困惑，其实完成闯关任务并不需要操作所有课程内容，只是用到课程很少部分内容。4.本帖分为三个部分完成闯关任务、课程整体介绍、不同量化方法的简要说明。4.量化部署internlm2-chat-7b。

2025-06-08 10:15:23 816

原创 OpenCompass 评测书生大模型实践

支持多种模型和评测集：VLMEvalKit支持超过三十个开源多模态模型和十余个开源多模态评测集，包括GPT-4v、GeminiPro、QwenVLPlus等主流模型和MME、MMBench、SEEDBench等评测集。易于扩展：VLMEvalKit框架支持轻松添加新的多模态模型和评测集。用户可以根据需要添加新的模型或评测集，并确保原有的评测集和模型仍然适用于新的模型或评测集。如果你的电脑上面没有该模型的模型文件，则需要自己下载，然后更改模型路径，也可以不修改，在运行模型评测命令的时候会自动下载模型文件。

2025-06-04 23:20:36 610

原创探索大模型能力边界

其他：书生大模型较小的参数效果真的很惊人，比较而言DeepSeek真的懒得评论，每次都跑不出来结果，体验和智谱清言与千问比起来都差的太远。3.按照下图操作输入问题进行模型PK,模型跑完后可以给出评判A好，B好，一致，都很差。然后共享就可以获取对话截图。1.登陆https://opencompass.org.cn/arena。11个有趣的操作样例如下。

2025-06-02 15:40:11 156

原创与InternLM及InternVL大模型对话

1.与InternLM对话。InternVL对话。

2025-06-02 11:37:53 418

原创茴香豆：企业级知识库问答工具（本地版搭建）

”“1.本来想把Web 版茴香豆任务做掉，无奈赶上服务器升级无法执行2.操作参考链接中的步骤参照是可以一步一步执行的，但是有两点需要注意①本地安装时的以下命令可能只能书生浦语的工作机上才可以执行（其他的工作站暂未测试过）②上面的参考链接部分安装包没有写全，代码运行时要一步步的安装包，我生成了个requirements.txt（相关内容在文章最后），供大家直接使用。使用方法pip install -r requirements.txt”“”

2024-12-27 14:20:12 963

原创 MindSearch 快速部署

参考链接任务流程：：通过 Codespace 创建虚拟环境并安装依赖。注意事项：1.代码一行行的粘贴，不要一整块的适用2.sk-pmsxyxxxx.....注意不要有<>,否则会报错3.没有用过的小白可能掌握有多少个新开窗口，可以直接使用4个（第一个重启的不需要关闭，直接开启第二个窗口就行）

2024-12-15 20:09:06 813

原创 InternVL 部署微调实践

学习链接： https://github.com/InternLM/Tutorial/tree/camp4/docs/L2/InternVL"""说两个注意事项吧：1.作者之前手贱删掉了xtuner后来在网上找的克隆链接项目内容不全，这个给作者造成了较大的困扰，如果有同样问题的小伙伴建议去本期任务的前面操作手册克隆git clone https://github.com/InternLM/xtuner.git（等你用的时候，可能这个版本也不对了）

2024-12-14 21:09:29 875

原创 LMDeploy 量化部署实践闯关任务

2.我量化了两个模型，可以看到量化后的模型明显小于量化前的模型（非常耗时，我是周末睡觉前直接开了12个小时，估计6个小时左右）二、使用Function call功能让大模型完成一次简单的"加"与"乘"函数调用。模型封装本地API并与大模型进行一次对话，作业截图需包括显存占用情况与大模型回复。根据提供的function拆分成了"加"和"乘"两步，第一步调用。量化后的模型无论是大小还是运行阶段对于硬件的占用都更“友好！零、先上一个有意思的bug视图，输入不要带空格。1.量化前的模型使用及内存占用见下方视图。

2024-12-08 21:06:25 343

原创 Lagent：从零搭建你的 Multi-Agent

https://github.com/InternLM/Tutorial/blob/camp4/docs/L2/Agent/task.md一、Lagent框架中Agent的使用目标通过Lagent框架，基于InternLM2.5，搭建一个Web Demo，体验其智能体功能与工具集成能力。步骤与实现环境准备代码实现插件与功能运行与测试 bash复制代码效果展示注意事项实现流程Streamlit 界面交互用户通过 Web 界面输入主题，系统实时展示生成、批评和优化的内容，分步骤呈现：通过 Lag

2024-12-07 12:33:01 977

原创【实战营闯关任务】探索书生大模型能力边界

气体的粒子数为N = 1023,温度为T=300 K,且系统的能级是离散的,能级间隔为e=1eV。每个小球的位置是整数坐标，且第 n 个小球的位置为n2 (即第一个小球在12=1,第二个小球在2^2 =4,第三个小球在3^2= 9,依此类推)。给定一个整数数组 nums 和一个整数目标值 target，请你在该数组中找出和为目标值 target 的那两个整数，并返回它们的数组下标。在某城市的五个公司（A、B、C、D、E）中，有五名员工（分别为1号、2号、3号、4号、5号）参加了一个面试。

2024-12-03 13:29:10 824

原创 OpenCompass 评测（API模式）

是一个 Python 库，主要用于提供 Python 软件包的元数据（metadata）。这个库允许你访问和操作已安装的 Python 包的元数据，包括包的版本信息、入口点、依赖关系等。是用于评估文本生成模型（例如，机器翻译、文本摘要等）的评价指标工具。注意事项：需要额外安装两个包，此外运行时间我是20分钟（不要着急）：等待大约 10 分钟，获取评测结果。

2024-11-20 23:09:05 837

原创 XTuner 微调个人小助手认知

2. **安装 XTuner：** 建议使用源码安装，同时确保依赖项（如 PyTorch 和 Transformers）版本正确。2. **配置文件调整：** 修改 `pretrained_model_name_or_path` 和数据路径等关键参数。2. **命令：** 使用 `xtuner convert pth_to_hf` 指定配置文件、权重路径和保存路径。3. **验证安装：** 使用 `xtuner list-cfg` 确保配置打印无误。1. **软链接模型：** 将预训练模型链接到指定路径。

2024-11-18 13:39:09 278

原创 Llamaindex RAG 实践(含一个小白天坑说明)

其实对于一个功能强大的包，不一定要安装完整的，耐心等一等，即使出现了输入行，也再等一等，程序必须要执行的模块下载好其实就行了，我前两次在暗处输入框后煤油灯，导致bin文件缺失，最后一次虽然整个程序没有安装完成，但是代码可以运行了，奥利给！为了完成作业，作为小白的我真是郁闷坏了，下面是一个抛错（下载的 Sentence Transformer 模型有缺失！先完成任务，再解释一个坑，首先严格按照下方链接肯定是可以实现的。实在忍不了，直接执行命令，竟然这次成功了！重新下载呗，就是有包下载不了。

2024-11-16 13:49:57 247

原创 2个基于LangGPT格式编写提示词进行评测的样例

两者比较明显后面的更有针对性，更符合特点功能需求。第二次评测后按照LangGPT格式及流程修改输入。利用大模型对两次输出结果进行比对。

2024-11-11 23:50:25 260

原创书生大模型“strawberry”中有几个字母“r”的“恶意”搞笑统计

多说一下，我个人不认为书生大模型真的这么“愚蠢”，这应该设计者为了增加作业难度“恶意”设计的一个陷阱，供其他学员参考。

2024-11-11 22:13:45 302

原创书生·万象图片识别示例

2024-11-11 15:51:01 152

原创书生·浦语写一段简单代码的演示

2024-11-11 15:43:59 377

原创书生大模型全链路开源开放体系学习

书生大模型秉持“书生·浦语，为人类服务”的理念，致力于以自主知识产权的人工智能技术，为人类提供高效、精准、友好的智能服务。实验室开发的人工智能模型聚焦于推动社会各个领域的创新与应用。实验室推出的高质量数据集涵盖自然语言处理（NLP）、计算机视觉（CV）、语音识别等领域，辅助模型训练和评估。书生大模型提供完整的训练和优化代码，包括数据预处理、架构设计、训练策略等内容。书生大模型提供丰富的应用场景代码示例（如文本生成、情感分析、机器翻译等），并提供详细的部署指南，确保模型在实际应用中的高效性和稳定性。

2024-11-07 23:13:47 790

原创 L0G4000玩转HF作业

下载完成config.json文件、model.safetensors.index.json文件。1登陆codespaces后进入Jupyter Notebook。4运行粘贴好内容的py文件完成模型下载。2执行代码运行必要的工具下载命令。# 安装transformers。# 创建一个目录来存放下载的文件。# 遍历文件列表并下载每个文件。# 指定要下载的文件列表。

2024-11-03 11:28:27 221

原创 Vscode连接InternStudio debug笔记

1首次debug需要配置以下，点击“create a launch.json file”，选择python debugger后选择“Python File” config。请帮我从以下``内的这段模型介绍文字中提取关于该模型的信息，要求包含模型名字、开发机构、提供参数版本、上下文长度四个内容，以json格式返回。2.设置断点（算上我的apikey运行时已经发现是30行有问题），断点只为完成任务，随便设置几个，就本任务看变量变化并没有太多意义。print("解析后的 JSON 内容：", res_json)

2024-11-02 09:14:12 511

原创书生大模型学习班作业383. 赎金信

如果某个字符在 str2 中的数量不足，返回 False。如果所有字符都可以满足，返回 True。使用 Counter 创建两个计数器，分别统计 str1 和 str2 中每个字符的出现次数。# 检查 str1 中的每个字符在 str2 中是否有足够的数量。遍历 str1 中的每个字符，并检查它在 str2 中的数量是否足够。# 统计每个字符在 str1 和 str2 中的出现次数。str2 = input("输入被参考验证的字符串")str1 = input("输入要验证的字符串")

2024-10-31 13:37:03 246

原创书生大模型作业L0G1000作业

InternStudio

2024-10-30 11:08:08 164

weixin_42716893的博客