当人工智能进入深度应用的黄金时代,单一模态的局限正被多模态交互彻底打破。文心ERNIE-4.5-VL视觉语言模型( ERNIE-4.5-VL-28B-A3B;ERNIE-4.5-VL-424B-A47B )以突破性的图文、视频理解与推理能力,架起数字世界与物理世界的智能桥梁,更支持100+语言交互,让跨模态智能触手可及。
实验结果表明,轻量级视觉语言模型ERNIE-4.5-VL-28B-A3B的激活参数显著减少,但与Qwen2.5-VL-7B和Qwen2.5-VL-32B等模型相比,其在大多数基准测试中仍具有竞争力,甚至表现更优。
ERNIE-4.5-VL模型支持128K上下文长度,结合“思考模式”与“非思考模式”双选项,既能快速响应基础任务,又能深度破解复杂问题,灵活适配从日常场景到专业领域的全场景需求。
ERNIE-4.5-VL的跨模态能力覆盖以下核心任务场景:
▎技术直播与实训营来袭,手把手教你玩转多模态
8月20日-8月28日每周三、周四20:30,飞桨开发者技术专家将聚焦博物馆文物讲解、英语学习助手、医疗问诊系统、个性化习题生成与智能批改等实战场景,带来专场直播,手把手教你玩转多模态大模型!欢迎扫码报名,即刻锁定技术直播与实训营!
▎相关链接
■ 文心大模型技术 Blog(含技术报告下载):
https://yiyan.baidu.com/blog/posts/ernie4.5
■ 文心4.5系列模型下载
Hugging Face:
https://huggingface.co/baidu
飞桨星河社区:
https://aistudio.baidu.com/modelsoverview?sortBy=weight&q=ernie
GitHub:
https://github.com/PaddlePaddle/ERNIE
魔搭社区:
https://modelscope.cn/models/dengcao/ERNIE-4.5-VL-28B-A3B-Paddle
■ 文心4.5系列模型训练部署
ERNIEKit:
https://github.com/PaddlePaddle/ERNIE/blob/develop/docs/erniekit.md
FastDeploy:
https://github.com/PaddlePaddle/FastDeploy/
关注【飞桨PaddlePaddle】公众号
获取更多技术内容~