论文信息
题目:MCPL: Multi-Modal Collaborative Prompt Learning for Medical Vision-Language Model
MCPL:医学视觉-语言模型的多模态协作提示学习
作者:Pengyu Wang, Huaqi Zhang, Yixuan Yuan
源码链接:https://github.com/CUHK-AIM-Group/MCPL
论文创新点
-
首次提出多模态协作提示学习范式
本文首次提出了一种多模态协作提示学习方法,用于对齐医学文本-图像表示。与现有的独立或单向耦合的多模态提示方法不同,本文通过建立多向提示耦合,使提示能够协作学习,从而提高多模态提示之间的协同作用。 -
构建解剖-病理(AP)提示
本文首次引入实例级的解剖和病理信息来构建解剖-病理(AP)提示,使V-L模型能够更好地理解和对齐医学报告和图像。通过结合解剖和病理信息,模型能够更准确地