
模型评测
文章平均质量分 97
J_Xiong0117
一枚终生学习的算法工程师
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【VLMs篇】02:多模态模型评测
人工智能的浪潮席卷而来,多模态模型已成为 AI 领域的核心驱动力。它们如同拥有多重感官的智能体,能够理解和生成文本、图像、音频、视频等多元信息,在各个领域展现出前所未有的潜力。然而,与模型能力的飞速提升形成鲜明对比的是,多模态模型评测体系的相对滞后。原创 2025-01-24 17:38:21 · 1284 阅读 · 0 评论 -
【LLMs篇】01:大模型评测数据集和评测框架调研
上海人工智能实验室研发推出了 OpenCompass 司南开源评测体系。该体系是面向大语言模型、多模态大模型等各类模型的一站式评测平台。OpenCompass 的主要特点包括开源可复现全面的能力维度丰富的模型支持分布式高效评测多样化评测范式以及灵活化拓展。原创 2025-01-24 17:02:53 · 2378 阅读 · 0 评论