百分点认知智能实验室：疫情情绪识别大赛的亚军是如何炼成的

本文介绍了百分点认知智能实验室在疫情期间网民情绪识别大赛中获得亚军的方案。他们面对数据的挑战，采用了数据清洗、多模态融合、机器学习技术（如半监督学习和对抗训练）、模型集成等策略，最终实现模型的高性能和稳定性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

编者按

为助力疫情防控和疫情之后的经济社会恢复工作，推动北京市政府数据开放，吸纳大数据产业顶尖社会资源，充分释放专业人才智慧资源，北京市经济和信息化局、中国计算机学会大数据专家委员会联合主办科技战疫·大数据公益挑战赛。

北京百分点信息科技有限公司认知智能实验室参加了该挑战赛中的“疫情期间网民情绪识别“比赛，该赛题也是第二十六届全国信息检索学术会议（The 26th China Conference on Information Retrieval, CCIR 2020）评测大赛赛题。经过长达2个多月的激烈角逐，百分点认知智能实验室从2049支参赛队伍中脱颖而出，取得了A榜第1，B榜第2的成绩，并且通过决赛的答辩，获得了该比赛的亚军。

本文作者：易显维苏海波

1. 背景介绍

2019新型冠状病毒（COVID-19）感染的肺炎疫情发生对人们生活生产的方方面面产生了重要影响，并引发国内舆论的广泛关注，众多网民参与疫情相关话题的讨论。为了帮助政府掌握真实社会舆论情况，科学高效地做好防控宣传和舆情引导工作，主办方组织了“疫情期间网民情绪识别”的评测大赛，吸引了2049支队伍的参加，包括各大知名高校以及大数据和人工智能企业。

具体的赛题任务是给定微博ID和微博内容，设计算法对微博内容进行情绪识别，判断微博内容是积极的、消极的还是中性的，具体可以见下图1。同时本赛题也是第二十六届全国信息检索学术会议 CCIR 2020评测大赛赛题。