自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 收藏
  • 关注

原创 强化学习初探及OREAL实践

这个配置可以在40G显卡的显卡上完成训练(偶尔会OOM),至于训练出的水平就不要在意了,无数先辈复现Deepseek R1-Zero模型时就发现过一个铁律,小于 3B 的模型无法学会推理,只适合使用sft微调而不是强化学习。正确的py文件我会直接放到文章中。原版的repo使用的是72B的模型,但这个对大家来说开销太大了,因此换个1.5B的模型意思下。字样,并且花费的时间特别久,就直接去官网下载预编译好的版本自己上传安装吧,别浪费时间编译了,对于按前面的方法搭建的环境来说,直接安装这个包就行。

2025-07-13 22:44:00 1040 1

原创 智能体协议 MCP + 书生大模型实践

—— 通过可视化方式解析MCP核心概念、架构与未来前景MCP:AI 的“USB-C 端口”类比大模型的信息孤岛困境传统解决方案与其局限性MCP 核心架构总览MCP 通信机制详解MCP 的三种上下文供给方式MCP 实际工作流程可视化MCP vs 上下文窗口机制(如prompt size)MCP vs ReAct / Agent 架构MCP vs RAG / 插件系统Claude 3 的超长上下文能力简述Claude 如何实现百万 Token 的上下文管理Claude + MCP:构建新一代智能助手MCP 的性

2025-07-07 10:30:44 285

原创 CAMEL 书生多智能体系统实践

使用conda是因为每次重启云,从本地安装的软件又会被重置掉,安装的环境又会失效!3.使用自定义及预定义的 tool 自定义一个自己的 agent(我尽量兼顾简洁与知识点覆盖,有意思的是出现了个提示词相关的问题,见运行结果图,虽然大模型能力在不断增强,搭建一个自己的多智能体系统(这里为让萌新有更全面的理解,我增加了难度做了修改,把用Roleplaying。),作者按照课程任务要求编写两段代码,代码并没有参照课程给出的范例进行编写,视频理解(用什么视频都行,短一点,理解的还真是不错)三段代码运行效果见下图。

2025-07-07 10:02:42 910

原创 Error: llama runner process has terminated: exit status 2

Error: llama runner process has terminated: exit status 2错误是近期刚刚由于某些软件版本原因爆发的错误。估计很多人都已经用大模型查过怎么处理了,所以我就不再做原因分析了和重复赘述了,如果别的办法都不行可以尝试下面的解决方案。解决方案:安装最新的 Microsoft Visual C++ Redistributable 版本后,系统需要重启。

2025-07-01 08:48:15 806

原创 GraphGen:训练数据合成实践

该框架通过构建细粒度知识图谱、识别 LLMs 的知识盲点、并生成多风格的内容来提高模型在知识密集型任务上的表现。最后多说一下,bash scripts/generate.sh命令执行后我有很多次生成的数据都是0,后来我认为是jsonl文件的问题自己创建了新的数据文件就可以执行了,但是。- 聚合 QA 生成:组织和改写子图中的数据,生成涉及多个实体和关系的综合性问答对。- 知识图谱聚合:将不同片段中的相同实体或关系的描述自动合并,形成知识图谱。- 多跳 QA 生成:明确实体间关系,生成需要多步推理的问答对。

2025-06-26 20:40:39 988

原创 InternLM 论文分类微调实践(XTuner 版)

首先需要在 ModelScope 创建模型,为你的模型取一个响亮优雅又好听的名字,然后按右下图中的信息创建(下面截图有点问题,根本不需要创建②,如果你创建了使用。

2025-06-12 12:39:24 1024

原创 LMDeploy 课程

1.本次课程文档涵盖广泛,相当于较为完整的用户手册,部分完全小白用户使用时,可能会有困惑,其实完成闯关任务并不需要操作所有课程内容,只是用到课程很少部分内容。4.本帖分为三个部分完成闯关任务、课程整体介绍、不同量化方法的简要说明。4.量化部署internlm2-chat-7b。

2025-06-08 10:15:23 816

原创 OpenCompass 评测书生大模型实践

支持多种模型和评测集:VLMEvalKit支持超过三十个开源多模态模型和十余个开源多模态评测集,包括GPT-4v、GeminiPro、QwenVLPlus等主流模型和MME、MMBench、SEEDBench等评测集。易于扩展:VLMEvalKit框架支持轻松添加新的多模态模型和评测集。用户可以根据需要添加新的模型或评测集,并确保原有的评测集和模型仍然适用于新的模型或评测集。如果你的电脑上面没有该模型的模型文件,则需要自己下载,然后更改模型路径,也可以不修改,在运行模型评测命令的时候会自动下载模型文件。

2025-06-04 23:20:36 610

原创 探索大模型能力边界

其他:书生大模型较小的参数效果真的很惊人,比较而言DeepSeek真的懒得评论,每次都跑不出来结果,体验和智谱清言与千问比起来都差的太远。3.按照下图操作输入问题进行模型PK,模型跑完后可以给出评判A好,B好,一致,都很差。然后共享就可以获取对话截图。1.登陆https://opencompass.org.cn/arena。11个有趣的操作样例如下。

2025-06-02 15:40:11 156

原创 与InternLM及InternVL大模型对话

1.与InternLM对话。InternVL对话。

2025-06-02 11:37:53 418

原创 茴香豆:企业级知识库问答工具(本地版搭建)

”“1.本来想把Web 版茴香豆任务做掉,无奈赶上服务器升级无法执行2.操作参考链接中的步骤参照是可以一步一步执行的,但是有两点需要注意①本地安装时的以下命令可能只能书生浦语的工作机上才可以执行(其他的工作站暂未测试过)②上面的参考链接部分安装包没有写全,代码运行时要一步步的安装包,我生成了个requirements.txt(相关内容在文章最后),供大家直接使用。使用方法pip install -r requirements.txt”“”

2024-12-27 14:20:12 963

原创 MindSearch 快速部署

参考链接任务流程::通过 Codespace 创建虚拟环境并安装依赖。注意事项:1.代码一行行的粘贴,不要一整块的适用2.sk-pmsxyxxxx.....注意不要有<>,否则会报错3.没有用过的小白可能掌握有多少个新开窗口,可以直接使用4个(第一个重启的不需要关闭,直接开启第二个窗口就行)

2024-12-15 20:09:06 813

原创 InternVL 部署微调实践

学习链接: https://github.com/InternLM/Tutorial/tree/camp4/docs/L2/InternVL"""说两个注意事项吧:1.作者之前手贱删掉了xtuner后来在网上找的克隆链接项目内容不全,这个给作者造成了较大的困扰,如果有同样问题的小伙伴建议去本期任务的前面操作手册克隆git clone https://github.com/InternLM/xtuner.git(等你用的时候,可能这个版本也不对了)

2024-12-14 21:09:29 875

原创 LMDeploy 量化部署实践闯关任务

2.我量化了两个模型,可以看到量化后的模型明显小于量化前的模型(非常耗时,我是周末睡觉前直接开了12个小时,估计6个小时左右)二、使用Function call功能让大模型完成一次简单的"加"与"乘"函数调用。模型封装本地API并与大模型进行一次对话,作业截图需包括显存占用情况与大模型回复。根据提供的function拆分成了"加"和"乘"两步,第一步调用。量化后的模型无论是大小还是运行阶段对于硬件的占用都更“友好!零、先上一个有意思的bug视图,输入不要带空格。1.量化前的模型使用及内存占用见下方视图。

2024-12-08 21:06:25 343

原创 Lagent:从零搭建你的 Multi-Agent

https://github.com/InternLM/Tutorial/blob/camp4/docs/L2/Agent/task.md一、Lagent框架中Agent的使用目标通过Lagent框架,基于InternLM2.5,搭建一个Web Demo,体验其智能体功能与工具集成能力。步骤与实现环境准备代码实现插件与功能运行与测试 bash复制代码效果展示注意事项实现流程Streamlit 界面交互用户通过 Web 界面输入主题,系统实时展示生成、批评和优化的内容,分步骤呈现:通过 Lag

2024-12-07 12:33:01 977

原创 【实战营闯关任务】探索书生大模型能力边界

气体的粒子数为N = 1023,温度为T=300 K,且系统的能级是离散的,能级间隔为e=1eV。每个小球的位置是整数坐标,且第 n 个小球的位置为n2 (即第一个小球在12=1,第二个小球在2^2 =4,第三个小球在3^2= 9,依此类推)。给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出 和为目标值 target 的那 两个 整数,并返回它们的数组下标。在某城市的五个公司(A、B、C、D、E)中,有五名员工(分别为1号、2号、3号、4号、5号)参加了一个面试。

2024-12-03 13:29:10 824

原创 OpenCompass 评测(API模式)

是一个 Python 库,主要用于提供 Python 软件包的元数据(metadata)。这个库允许你访问和操作已安装的 Python 包的元数据,包括包的版本信息、入口点、依赖关系等。是用于评估文本生成模型(例如,机器翻译、文本摘要等)的评价指标工具。注意事项:需要额外安装两个包,此外运行时间我是20分钟(不要着急):等待大约 10 分钟,获取评测结果。

2024-11-20 23:09:05 837

原创 XTuner 微调个人小助手认知

2. **安装 XTuner:** 建议使用源码安装,同时确保依赖项(如 PyTorch 和 Transformers)版本正确。2. **配置文件调整:** 修改 `pretrained_model_name_or_path` 和数据路径等关键参数。2. **命令:** 使用 `xtuner convert pth_to_hf` 指定配置文件、权重路径和保存路径。3. **验证安装:** 使用 `xtuner list-cfg` 确保配置打印无误。1. **软链接模型:** 将预训练模型链接到指定路径。

2024-11-18 13:39:09 278

原创 Llamaindex RAG 实践(含一个小白天坑说明)

其实对于一个功能强大的包,不一定要安装完整的,耐心等一等,即使出现了输入行,也再等一等,程序必须要执行的模块下载好其实就行了,我前两次在暗处输入框后煤油灯,导致bin文件缺失,最后一次虽然整个程序没有安装完成,但是代码可以运行了,奥利给!为了完成作业,作为小白的我真是郁闷坏了,下面是一个抛错(下载的 Sentence Transformer 模型有缺失!先完成任务,再解释一个坑,首先严格按照下方链接肯定是可以实现的。实在忍不了,直接执行命令,竟然这次成功了!重新下载呗,就是有包下载不了。

2024-11-16 13:49:57 247

原创 2个基于LangGPT格式编写提示词进行评测的样例

两者比较明显后面的更有针对性,更符合特点功能需求。第二次评测后按照LangGPT格式及流程修改输入。利用大模型对两次输出结果进行比对。

2024-11-11 23:50:25 260

原创 书生大模型“strawberry”中有几个字母“r”的“恶意”搞笑统计

多说一下,我个人不认为书生大模型真的这么“愚蠢”,这应该设计者为了增加作业难度“恶意”设计的一个陷阱,供其他学员参考。

2024-11-11 22:13:45 302

原创 书生·万象图片识别示例

2024-11-11 15:51:01 152

原创 书生·浦语写一段简单代码的演示

2024-11-11 15:43:59 377

原创 书生大模型全链路开源开放体系学习

书生大模型秉持“书生·浦语,为人类服务”的理念,致力于以自主知识产权的人工智能技术,为人类提供高效、精准、友好的智能服务。实验室开发的人工智能模型聚焦于推动社会各个领域的创新与应用。实验室推出的高质量数据集涵盖自然语言处理(NLP)、计算机视觉(CV)、语音识别等领域,辅助模型训练和评估。书生大模型提供完整的训练和优化代码,包括数据预处理、架构设计、训练策略等内容。书生大模型提供丰富的应用场景代码示例(如文本生成、情感分析、机器翻译等),并提供详细的部署指南,确保模型在实际应用中的高效性和稳定性。

2024-11-07 23:13:47 790

原创 L0G4000玩转HF作业

下载完成config.json文件、model.safetensors.index.json文件。1登陆codespaces后进入Jupyter Notebook。4运行粘贴好内容的py文件完成模型下载。2执行代码运行必要的工具下载命令。# 安装transformers。# 创建一个目录来存放下载的文件。# 遍历文件列表并下载每个文件。# 指定要下载的文件列表。

2024-11-03 11:28:27 221

原创 Vscode连接InternStudio debug笔记

1首次debug需要配置以下,点击“create a launch.json file”,选择python debugger后选择“Python File” config。请帮我从以下``内的这段模型介绍文字中提取关于该模型的信息,要求包含模型名字、开发机构、提供参数版本、上下文长度四个内容,以json格式返回。2.设置断点(算上我的apikey运行时已经发现是30行有问题),断点只为完成任务,随便设置几个,就本任务看变量变化并没有太多意义。print("解析后的 JSON 内容:", res_json)

2024-11-02 09:14:12 511

原创 书生大模型学习班作业383. 赎金信

如果某个字符在 str2 中的数量不足,返回 False。如果所有字符都可以满足,返回 True。使用 Counter 创建两个计数器,分别统计 str1 和 str2 中每个字符的出现次数。# 检查 str1 中的每个字符在 str2 中是否有足够的数量。遍历 str1 中的每个字符,并检查它在 str2 中的数量是否足够。# 统计每个字符在 str1 和 str2 中的出现次数。str2 = input("输入被参考验证的字符串")str1 = input("输入要验证的字符串")

2024-10-31 13:37:03 246

原创 书生大模型作业L0G1000作业

InternStudio

2024-10-30 11:08:08 164

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除