ACL 2025 论文阅读:Dynamic Label Name Refinement for Few-Shot Dialogue Intent Classification

论文名:用于小样本对话意图分类的动态标签名称优化;2025 ACL 主会场的短篇论文

arxiv链接:https://arxiv.org/abs/2412.15603

短篇论文在提交review的时候,只需要写4页,看完这篇论文我觉得4页纸就可以把思想表达清楚了。

使用大模型针对文本做分类的时候,需要给大模型输入文本与候选类别标签。大模型需要把文本与候选的标签名称对应起来。如果标签名称并不能很好的代表这个类别的含义,那么大模型在做自然语言推理的时候,效果就会不好。这篇论文提出了一种方法,让大模型根据上下文,给每个类别动态的定义新标签。然后大模型再针对新标签进行分类。

image-20250709192616521

图1 类别名称相似影响分类结果,分成上下两部分看。图1 的上部分是根据相似相似召回的段落,根据原始文本与标签名称,优化定义出新的标签名称。

图1 的下部分是一个例子。原始的分类标签名很相似会导致大模型分类效果不好。使用大模型定义新标签,新标签的之间的相似度会降低,这样有利于大模型分类。

image-20250709193808522
大模型在标签重命名的时候,是一次性对所有的标签重命名。
这些类别在一起,方便大模型重新定义类别,这样就方便针对不同的类别,定义出类别相似度较远的新的类别名。

image-20250709194101676

图2 是流程图,图1与图2有很多重复的地方。图2透漏的额外内容就是在最后再把新标签名再换回原始的标签名。

image-20250709194425103

表1主实验,说明使用refined定义新的标签名,分类效果更好。

实验分析:

image-20250709194548433

针对不同模型的新类别重定义的效果,计算旧类别名与新类别名之间的相似度。从上图的实验结果可以看出,强大的模型旧类别名与新类别名之间的相似度会更低。

image-20250709194913612

表3的这个实验我觉得做的很巧妙。表3 的模型有2行,顶部行的模型用于修改标签名,第二行的模型用于文本分类。
从这个表中,可以看出来,强大的模型做标签名修改,强大的模型做文本推理,两个都可以提高文本分类的效果。
从这个表的设计来看,我觉得做的很好。因为最终效果不仅会和标签名修改的效果有关系,也和最终用于文本分类的模型也有关系。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

jieshenai

为了遇见更好的文章

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值