自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 大模型评估指标

2、ARC(AI2 Reasoning Challenge),AI到推理挑战,分为Challenge Set和Easy Set部分,挑战集合包括问题答案通过基于检索的算法和词并行算法。1、MMLU(Measuring Massive Multitask Language Understanding)多大量多任务语言理解能力评测,57个任务,Humanities,Social Scienc ,Science Technology Engineering and mathematics(STEM),

2025-08-04 11:47:33 186

原创 构建思维树解决情报分析问题

### 3. 状态评估器(State Evaluator):筛选优质分析分支 采用“**独立评分+联合投票**”双维度评估,确保分支的合理性与重要性: - **独立评分(数值化评估)** 对每个分支,用LM从3个维度打分(1-10分),加权计算总分(权重可自定义): 1. 相关性:该分支与核心问题的关联度(如“中东能源出口”与“欧洲能源安全”的相关性);”),选出前3-5个优质分支进入下一步。2. **分支对比**:不同分析角度的差异(如“地缘派”vs“经济派”对“俄欧妥协可能性”的分歧);

2025-07-19 19:58:15 374

原创 训练奖励模型,reward-model

【代码】训练奖励模型,reward-model。

2025-07-05 23:13:23 106

原创 gui agent 厉害

包括文本描述和tootip描述,训练follow insturciton的训练,给定element和图片,使用mobile的数据和general数据,没有早期发展的内容,导致训练follow的内容,有非常大创新,有benchmark的内容,涉及到os web等内容,benchmark 结。2、使用planning model,grounding model失效,next step,mobile zero-shot,都能达到sota的性能,gui action的任务,构建场景和指令,

2025-07-05 12:50:43 95

原创 01大模型评估deepeval

然后 deepeval login登录。

2025-06-25 21:34:33 96

原创 websocket学习

【代码】websocket学习。

2025-06-21 10:18:16 68

原创 DB-GPT开发

2、anything LLM大模型的anything建设。1、读取表格中的数据然后操作。

2025-06-18 22:34:42 94

原创 富文本编辑器 6月17日

npm install @wangeditor/editor-for-react --legacy-peer-deps 强制安装。wangeditor 王编辑器。

2025-06-18 17:13:14 84

原创 富文本编辑器

【代码】富文本编辑器。

2025-06-17 22:59:20 71

原创 ant design flex布局学习

3、在router中添加write网页。1、card布局的方式。

2025-06-17 17:58:03 112

原创 大模型智能体专题

GUI Agents 即图形用户界面智能体,是人工智能领域中一种能够在图形用户界面环境下理解、解释并执行用户命令的智能程序2。检索引入知识,开展实验,智能体完成任务,做action的比例,KnowSelf以约15-26%的知识量超越了所有100%,深蓝色Gemma-2B,知识智能体在开放环境的领域适应性,为知识密集型行业应用落地。agent tool use能力,考察大模型智能体的能力,自适应交换对于MLLM GUI-Agent,直接搜屏幕,GUI agent混合训练,能够。逆向合成,从反向找到解决途径。

2025-06-15 07:35:20 914

原创 flex布局学习

左侧 右侧 中部区域。

2025-06-14 09:08:30 240

原创 改造当前代码为流式输出

【代码】改造当前代码为流式输出。

2025-06-12 23:26:20 90

原创 调用后端程序的代码

console.log('返回的文本数据:', response.data.reply);console.log('后端返回的数据:', response.data);console.log('用户数据:', response.data);console.error('用户信息请求错误:', error);message.success('用户输入的是:' + text)message.success('用户信息获取成功');message.error('获取用户信息失败');// 打印后端返回的数据。

2025-06-12 22:25:09 170

原创 简单的ant design X调用机制

content用钩子函数来设置内容。

2025-06-12 17:48:41 117

原创 写大模型接口,在tsx中

终于增加了搞好了前后端能够传递信息了。为大模型数据调整后台数据。veRL强化学习框架。

2025-06-12 16:51:07 116

原创 豆包大模型

3、大模型应用实验室 实时视频理解,模型能预定酒店,还能看是否有浴缸。豆包app 实时视频通话功能。在这里可以有代码共享,

2025-06-11 20:00:25 82

原创 python设计接口

在ant design pro中放一个表格。增加了表格,表格数据如何防。

2025-06-11 09:30:55 295

原创 后端可用的python接口代码

【代码】后端可用的python接口代码。

2025-06-10 23:55:45 106

原创 ant design pro修改程序第10天,6月10日

创建一个程序,增加一个窗口接受返回值。建立一个前后端请求的代码,不好使。

2025-06-10 23:24:29 68

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除