ESimCSE 论文笔记

最新推荐文章于 2024-12-12 15:02:02 发布

shuaiZuJiaoFu

最新推荐文章于 2024-12-12 15:02:02 发布

阅读量491

点赞数

CC 4.0 BY-SA版权

文章标签：论文阅读深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shuaiZuJiaoFu/article/details/128867921

ESimCSE通过改进正负样本构建方法提升了无监督句子嵌入的对比学习效果。它使用单词重复作为正样本生成策略，引入动量对比学习增加负样本数量，避免了批大小增加带来的性能下降。实验证明，这些改动在BERT-base上提高了Spearman相关度2.02%。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

单位：中国科学院信息工程研究所，中国科学院大学，快手科技
时间：2022.09
发表：COLING
论文链接： https://arxiv.org/abs/2109.04380

一、前言

1. ESimCSE想做些什么？

SimCSE 采用两次 dropout 作为一对正样本来当作数据增强的方法（详细内容可见我的上一篇笔记），但这样有一个不好的地方就是模型会偏向认为具有相同长度的句子彼此之间就更为相似。

为了验证这一观点，作者根据句子对的长度差异是否≤3，将每个STS测试集划分为两组，计算每组的模型预测和正则化标准答案之间的相似度差异。结果如表所示，当长度差≤3时，七个数据集的平均相似性差异较大，这验证了作者的假设。

让我比较奇怪的是下面的 ESimCSE ，虽然两者的差距是缩小了，但相似性差异都比 SimCSE 差异大是怎么回事。

2. ESimCSE做到了什么？

为了缓解上述的问题，作者应用一个简单而有效的重复操作来修改输入句子，然后将输入的句子及其修改后的对应句子分别传递给预先训练好的 Transformer 编码器，彼此间作为正样本。此外，还从计算机视觉领域获得灵感，引入了动量对比来增加负数对的数量，而不需要进行额外的计算。

实验结果表明，ESimCS

最低0.47元/天解锁文章

200万优质内容无限畅学

博客等级

码龄6年

7
原创

2
点赞

10
收藏

5
粉丝

关注

私信

热门文章

上一篇：: DKT 论文笔记

下一篇：: Contrastive Adversarial Training

最新评论

ESimCSE 论文笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
DKT 论文笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
ContrastNet 论文笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
SimCSE 论文笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
ALBERT 论文笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34 给我们提。

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。