某机构EMNLP 2022论文技术概览
某机构在今年经验方法自然语言处理会议(EMNLP)上发表的40余篇论文(包括新设产业轨道收录论文),既涵盖了自然语言理解、问答系统等传统主题,也拓展到机器人技术、地理空间学习等跨领域研究,其中两篇论文还涉及双关语生成。
查询重写技术(应用于自学习和指代消解)已成为某机构的一个活跃研究方向,本次会议有5篇相关论文。多篇论文探索了快速兴起的提示工程领域,即通过提示大型语言模型生成特定类型的输出。
以下是某机构EMNLP学术轨道和产业轨道论文的快速导览:
持续学习
- 迭代分层测试与测量实现自动化模型更新
- 基于需求的语音理解模型更新:我们学到了什么?
- 基于局部分布近似的无监督训练数据重加权技术
对话系统
《面向任务对话的检索式响应模型部署》提出通过交叉注意力层学习历史记录、配置文件特征与候选响应之间的语义关联,并使用评分函数对候选响应进行排序。
评估体系
GEMv2:单行代码实现多语言自然语言生成基准测试
事实核查
《基于依存树的事实核查机器生成文本》通过依存解析树识别待核查声明中的实体属性。
公平性
MT-GenEval:基于反事实与上下文的机器翻译性别准确性评估数据集
幽默生成
- 情境化双关语生成
- ExPUNations:通过关键词和解释增强双关语
信息抽取
- 跨语言商品评论摘要混合方法
- Ask-and-Verify:属性值抽取的跨度候选生成与验证
- DORE:基于生成框架的文档有序关系抽取(通过识别文档中同一实体的多个实例构建实体关系矩阵)
信息检索
- 基于词项影响分解的稀疏索引加速方法
- 机器翻译对电商多语言搜索的影响
知识蒸馏
- 将多语言Transformer蒸馏至CNN实现可扩展意图分类
- 知识蒸馏传输集及其对下游自然语言理解任务的影响
机器学习
《焦点损失校准不平衡分类器的实证研究》
模型适配
《元学习差异:大语言模型高效适配准备》
开放世界分类
《基于自适应负样本的开放世界分类》提出区分已知与未知数据类别的新方法
多模态交互
多模态上下文传递
自然语言处理
- McPhraSy:多上下文短语相似性与聚类
- 基于抽象意义表示的无监督句法控制复述生成
自然语言理解
- 基于模型解释的训练样本选择改进大规模对话系统
- 通过细粒度查询理解改进文本到SQL语义解析
地理定位学习
《基于深度度量学习的冷启动难解析地址地理定位》利用深度度量学习捕捉地址的地理空间距离语义
提示工程
DynaMaR:基于掩码标记表示的动态提示
查询重写
《CGF:对话AI查询重写的约束生成框架》使用字典树约束查询重写模型的输出
问答系统
- 集成Transformer实现高效精准排序任务
- FocusQA:聚焦上下文的开放域问答
- 从答案排序到答案生成的知识迁移
- 基于句子级目标的预训练Transformer模型
- RLET:基于强化学习的可解释问答与蕴含树方法
机器人技术
ALFRED-L:研究交互式视觉环境中语言对动作学习的作用,提出新的测试分割方案评估智能体轨迹位置记忆能力
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
公众号二维码