
VLA
文章平均质量分 89
zhaoyqcsdn
a coder with c++/Python/shell;
自动驾驶从业者
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
怎么理解TP,FP,FN,Precision,Recall
指标关注点优化方向应用倾向Precision检测结果的可靠性减少误检(FP ↓)避免误判的系统Recall目标的覆盖率减少漏检(FN ↓)避免遗漏目标的系统F1 Score综合性能平衡 Precision 和 Recall需要兼顾两者的场景简单记忆Precision→ “模型检测结果有多准?Recall→ “模型能找到多少真目标?TP/FP/FN是构建这两个指标的基石。原创 2025-06-14 14:44:42 · 1044 阅读 · 0 评论 -
怎么理解自动驾驶技术中的agent
为何如此设计?资源优化:预测模块只需处理关键 Agent(减少算力消耗)。功能分离:Agent → 预测意图 + 博弈交互(如让行、超车)。静态障碍物 → 几何避障(如绕开路桩)。状态切换处理:跟踪模块持续监控“静止物体”,避免漏跟临时停止的 Agent(如车辆突然启动)。五、总结:Agent 的最终判定条件一个物体被系统认定为 Agent,需同时满足:结语在自动驾驶系统中,Agent 与静态障碍物的区分本质是动态交互性与静态确定性的分离。感知与跟踪模块通过层层过滤,将原始检测目原创 2025-06-14 14:38:00 · 786 阅读 · 0 评论 -
理想汽车MindVLA自动驾驶架构核心技术梳理
MindVLA通过。原创 2025-04-13 21:56:15 · 1583 阅读 · 0 评论 -
RT-2论文深度解读:视觉-语言-动作统一模型的机器人泛化革命
RT-2证明了大规模预训练模型向物理世界的迁移可行性,为通用机器人学习开辟了新范式。其核心价值不仅在于技术突破,更在于揭示了"具身智能"可能的技术演进路径——通过语言这一通用接口,实现人类与机器人的自然协作。:利用互联网规模的视觉语言预训练知识,实现机器人技能的零样本(zero-shot)迁移。指令:“把可乐递给饥饿的人” → 成功定位可乐瓶并递向人体姿态。原创 2025-04-13 21:44:42 · 1008 阅读 · 0 评论 -
端到端VLA模型架构:让机器“知行合一”的工程实践
尽管面临数据与解释性挑战,但其在复杂任务中的潜力已初见端倪——从Google RT-2的零样本泛化能力,到PaLM-E的多任务统一建模,端到端架构正成为具身智能的核心载体。未来的机器人将不再依赖繁琐的手工编程,而是像人类一样,通过“看-想-动”的连贯过程,自主适应瞬息万变的物理世界。这种“流水线”模式看似分工明确,却存在致命缺陷——各模块间的信息损失、误差累积和延迟叠加,导致系统难以应对动态复杂任务(如“避开移动障碍物并抓取摇晃的杯子”)。:根据图像和指令“向左/右移动方块”,控制机械臂末端水平移动。原创 2025-04-13 16:24:16 · 1965 阅读 · 0 评论 -
生成与强化学习:赋予VLA系统物理行动能力
动作生成与强化学习是VLA系统从“纸上谈兵”走向“真枪实弹”的关键。未来,随着大模型与强化学习的深度融合,VLA系统将不仅限于执行预设任务,而是能够像人类一样,在动态环境中自主学习、灵活应变——这才是真正意义上的具身智能。当机器能够“看懂”图像、“听懂”指令时,一个更根本的挑战浮现:如何让它们像人类一样,将认知转化为精准的物理动作?本文将从机器人运动建模、强化学习框架、仿真训练环境三个维度展开,解析VLA系统中的动作生成原理,并通过机械臂抓取任务的代码实战,揭示如何让机器在物理世界中“动起来”。原创 2025-04-13 16:05:31 · 1139 阅读 · 0 评论 -
多模态表示学习:构建VLA技术的基石
引言:从“单感官”到“多感官”的智能进化人类婴儿通过眼睛观察、耳朵聆听、双手触摸来认识世界——这种多感官协同的认知方式,正是智能的本质特征。而在人工智能领域,要让机器像人类一样理解并操作物理世界,必须突破单一模态的局限,构建视觉、语言、动作的统一语义空间。这正是多模态表示学习的核心目标:让不同模态的数据(如图像、文本、动作)在共享的数学空间中“对话”,为VLA技术奠定基础。原创 2025-04-13 10:50:01 · 740 阅读 · 0 评论 -
VLA技术:开启具身智能时代的钥匙
视觉-语言-动作(Vision-Language-Action, VLA)技术的核心使命:赋予智能体“眼睛”“嘴巴”和“手脚”,使其在物理世界中完成复杂任务。随着多模态大模型与机器人技术的深度融合,我们或将见证一场新的智能革命——未来的家庭机器人不仅能听懂指令,还能主动思考:“主人可能想喝咖啡,我现在应该去清洁咖啡机。从家庭机器人整理房间到手术器械的精准操控,从自动驾驶汽车理解语音指令到工业机械臂自主装配零件,VLA技术正在重新定义人工智能的边界。原创 2025-04-13 10:46:21 · 1085 阅读 · 0 评论