# 基于Python的InstructKGC项目
## 项目简介
本项目是天池比赛CCKS2023指令驱动的自适应知识图谱构建比赛的参赛代码。主要关注在已有知识图谱构建大模型Zhixi的基础上,如何最大化提升单一大模型在知识图谱构建上的效果。项目提出了多种策略,包括`triple-level-search`方法、`Tail-first-model`训练、打乱relation_set顺序以及预提供`<head, rel>`对或`<tail, rel>`对的形式,来干涉大模型生成结果的过程,从而得到更多的候选三元组。
## 主要特性和功能
1. **`triple-level-search`方法**:在生成句子时,该方法会保留每种分支的可能,直到当前三元组生成完成,因此在不同长度的三元组生成上具备更好的自适应能力。
2. **`Tail-first-model`训练**:使用LoRA方法在基准大模型的基础上微调,得到按照(tail, relation, head)顺序生成三元组的模型。
3. **打乱relation_set顺序**:通过打乱relation_set的顺序,以及预提供`<head, rel>`对或`<tail, rel>`对的形式,来干涉大模型生成结果的过程。
4. **结果选取算法**:从候选三元组的集合中选取最终结果的算法流程,通过优先选取`head-first-model`和`tail-first-model`共有的结果,以及对特定relation手动制定的处理规则等,得到最终结果。
## 安装使用步骤
1. **下载源码**:下载本项目的源码文件。
2. **数据和环境准备**:
- 从比赛界面下载三个数据文件,放置在`data/`文件夹下。
- 下载基准知识图谱大模型的参数,放置在`model_hub/`文件夹下。
- 下载并设置`tail-first-model`的LoRA模型参数。
3. **运行项目**:
- **快速复现比赛结果**:根据GPU显存情况选择执行命令,读取数据集和预生成的临时文件,输出结果并更新临时文件。
- **训练`tail-first-model`**:生成训练数据集并进行模型训练。
- **完整执行流程**:依次生成不同结果并最终输出结果。
## 可能的问题
1. **`triple-level-search`方法**:仅支持batchsize=1的生成,且在某些输入下可能会报错。
2. **基准模型问题**:在运行过程中可能会生成预料之外的符号,导致`triple-level-search`报错。
## Acknowledge
没有合适的资源?快使用搜索试试~ 我知道了~
(源码)基于Python的InstructKGC项目.zip

共17个文件
py:8个
png:3个
md:3个

0 下载量 188 浏览量
2025-08-13
06:55:24
上传
评论
收藏 4.78MB ZIP 举报
温馨提示
# 基于Python的InstructKGC项目 ## 项目简介 本项目是天池比赛CCKS2023指令驱动的自适应知识图谱构建比赛的参赛代码。主要关注在已有知识图谱构建大模型Zhixi的基础上,如何最大化提升单一大模型在知识图谱构建上的效果。项目提出了多种策略,包括triplelevelsearch方法、Tailfirstmodel训练、打乱relationset顺序以及预提供<head, rel>对或<tail, rel>对的形式,来干涉大模型生成结果的过程,从而得到更多的候选三元组。 ## 主要特性和功能 1. triplelevelsearch方法在生成句子时,该方法会保留每种分支的可能,直到当前三元组生成完成,因此在不同长度的三元组生成上具备更好的自适应能力。 2. Tailfirstmodel训练使用LoRA方法在基准大模型的基础上微调,得到按照(tail, relation, head)顺序生成三元组的模型。
资源推荐
资源详情
资源评论






























收起资源包目录





















共 17 条
- 1
资源评论


静默小音箱
- 粉丝: 2323
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源
- 基于 Python 与 Django 框架,集成 face-recognition、keras、tensorflow 及 opencv 等库的后端项目
- 计算机网络安全与防范喻骏.doc
- 软件开发质量管理层次模型(下).docx
- 《基因工程的基本操作程序》.ppt
- 文科院校大学计算机基础教学改革与实践.docx
- 四层楼电梯的PLC控制设计.doc
- 软考嵌入式系统设计师基础知识复习笔记讲解资料.doc
- 油气田物联网设备在线管理系统研究.doc
- 基于 IMDB 数据集利用 LSTM 和预训练词典向量进行电影评论情感分类分析
- 企业云计算平台虚拟化软件选型方案.doc
- 如何将Photoshop模糊过的图片清晰还原.doc
- c语言课程学生成绩管理.doc
- 《C语言程序设计与数据结构》课件第08章.ppt
- 单片机配电房温湿度测控系统设计方案.doc
- 电子商务对物联网技术的运用.docx
- 基于网络环境的小学信息技术微课教学探究-(3).doc
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈



安全验证
文档复制为VIP权益,开通VIP直接复制
