TextRank模型改进

本文介绍了TextRank4zh模型的改进方法,通过调整关键词权重和窗口滑动策略,提高了模型对文本关键信息的抓取效果。通过在迭代过程中考虑关键词权重,实现了对节点影响力的更精确计算,并对比了修改前后的执行结果,展示了改进的优越性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

2.2模型改进:

TextRank4zh实现过程:
在这里插入图片描述

TextRank4zh模型修改:
在这里插入图片描述

改进思路:

1、找到textRank4zh中对无权图进行权重迭代计算的公式实现部分
2、向计算公式方法中传入参数(输入的关键词本身的权重大小)
3、修改窗口滑动建立节点之间关系的代码。通过遍历每一个query对应的list,对list中每次词进行加权。原理是(第一个句子中的单词权重为1,之后的每个句子权重递减)。得到所有候选关键词和对应的权重之后进行归一化。
4、将根据所在句子为当前问题和历史问题赋予的关键词权重和无权图同时送入进行迭代。

在这里插入图片描述

对应到代码函数调用关系:

在这里插入图片描述

对应修改的核心代码实现:

在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值