基于VLA的具身智能方案, ,,胜天国际加速落地物理AI

胜天国际会员中心 — 登录享专属商务服务

胜天国际会员中心 — 登录享专属商务服务 > 新闻及媒体 > 2025

基于VLA的具身智能方案, ,,胜天国际加速落地物理AI

2025-07-23

在人工智能加速迈向物理世界的浪潮中, ,,具身智能正成为驱动机器人技术演进的核心动力 。。。它不仅要求机器人具备对环境的感知和理解能力, ,,更要求其能据此做出连续、、、合理、、、精准的物理行为 。。。“物理Al(Physica AI)”新概念的出现, ,,强调未来AI不应止步于认知理解, ,,更应“动起来、、、干实事” 。。。这一理念为具身智能提供了明确的发展方向, ,,也对数据、、、模型与交互系统提出更高要求 。。。

胜天国际子公司智境云创基于VLA(Vision-Language-Action)模型构建了一套数据采集与行为生成方案, ,,并全面集成于自研Behavision空间智能 MaaS平台 。。。该方案从感知、、、语言理解到动作控制形成闭环, ,,为机器人在复杂环境中实现类人交互、、、泛化执行与自主决策提供新型底层能力 。。。

图片
序号1.jpg

TOP 01

感知一语言一行为融合

VLA模型构建智能控制新范式

VLA模型作为当前多模态AI的技术前沿, ,,融合视觉图像、、、自然语言和动作控制三种模态信息, ,,打通从感知输入到控制输出的全链路通道 。。。智境云创基于该架构搭建的具身智能行为生成引擎, ,,让机器人从图像中理解场景, ,,从语音中识别意图, ,,并将两者共同转化为可执行的动作序列, ,,完成如“拿起水杯”、、、“打开抽屉”等多阶段任务 。。。

图片

相较于传统感知-推理-控制的离散模块式设计, ,,VLA模型具备更强的上下文感知能力和任务泛化能力, ,,能在服务、、、工业、、、教育等多场景下应对非结构化环境和自然语言指令, ,,实现从“看懂”到“行动”的知行合一能力跃迁 。。。

序号2.jpg

TOP 02

多源数据采集体系

构建行为学习的认知底座

依托Behavision空间智能MaaS平台, ,,智境云创构建“感知—推理—执行”全链路的数据采集体系, ,,形成具身智能行为学习的认知基座 。。。平台集成毫米级高精度3D扫描设备、、、双目视觉系统与自研算法矩阵, ,,能够高效采集环境结构、、、物体属性、、、语言指令与机器人动作等多源异构数据 。。。通过端云协同的数据处理框架, ,,可实时完成点云重建、、、语义解析、、、轨迹还原与多模态对齐, ,,确保采集数据在空间、、、时间和语义维度的高一致性 。。。该体系不仅显著提升多模态数据的质量和效率, ,,也为后续VLA模型训练与策略迁移提供了高质量训练样本, ,,加快模型从数据到控制的收敛速度 。。。

随着“物理AI”理念的实践推进, ,,智境云创将持续拓展Behavision平台在空间智能、、、具身智能等领域的能力边界 。。。未来, ,,将进一步打通3D铰接数据体系与VLA模型的融合机制, ,,构建统一的“认知—语义—行为图谱, ,,为具身机器人提供面向真实世界的通用智能操作系统, ,,加速行业迈向机器人“安卓时刻” 。。。