2024年,在各大企业纷纷角逐大模型之际,具身智能却“异军突起”,成为推动人工智能向物理世界深度渗透的重要力量。
李飞飞的Voxposer、谷歌的RT1和RT2、谷歌的RTX、字节跳动的Robot Flamingo、斯坦福的ACT和卡耐基梅隆的3D_diffuser_act,均在不同任务和场景中展示了强大的能力,并有潜力带来革命性的变革。
中国工程院发布“新一代信息工程科技新质生产力技术备选清单(2024)”,具身智能位列其中。10月10日,在工业和信息化部与北京市人民政府共同指导下,北京具身智能机器人创新中心正式升级为“国家地方共建具身智能机器人创新中心”。具身智能正引发各界的高度关注,『制造前沿』通过本文剖析什么是具身智能、市场发展、产业链及关键企业,一文了解具身智能概况。文末提供两份最新发布的具身智能研究报告下载。
完整报告下载方式见文末!
"具身智能"(Embodied Intelligence)是一个涉及人工智能、认知科学和机器人学的概念,是指将人工智能融入机器人等物理实体,赋予它们感知、学习和与环境动态交互的能力。这个概念认为,智能不仅仅是大脑或算法的功能,而是通过身体与环境的交互来实现的。通俗解释就是将AI植入到各种机器人上,让机器人可以对周围环境变化做出感知,并且做出相应决策。
图 / 具身智能的“三要素”概念内涵示意图
来源:中国信息通信研究院
工业机器人提供了具身智能所需的物理实体,使其能够在现实世界中进行感知、操作和移动。
AI大模型则为工业机器人提供了强大的“大脑”,使其具备更高级的智能。AI大模型通过整合感知、认知和决策能力,将机器人从单一功能的执行单元提升为具有自主学习和优化能力的智能系统。这种转变使得机器人能够更好地适应复杂多变的工业环境,显著提高生产效率和柔性化水平。AI大模型的核心价值在于能够让人与设备实现自然语言层面的交互,大幅提高工业机器人的自主能力和认知能力,解决复杂场景的应用难题。然而,具身智能不等于“大模型+机器人”,准确来说是人工智能+机器人等物理实体。大模型具备思维推理、计划决策、语言和视觉理解等能力,这仅能模拟大脑皮层部分功能分区的智力表现。2024年5月,斯坦福大学教授李飞飞在《时代周刊》撰文写道,“大模型不存在主观感觉能力,多少亿参数都不行”。脑、身体和环境的深度耦合是产生高级认知的基础。这需要构建新一代人工智能算法,结合了脑神经、运控控制等复杂理论,推动具身智能实现认知涌现。
在具身智能的发展中,数据、本体和软硬件底座共同构成了其发展的基础。本体作为任务执行机构,其硬件组件和形态对具身智能的能力发挥有直接影响。数据对具身智能的能力提升和应用探索至关重要,高质量的多模态数据驱动具身智能感知、决策及行动控制能力快速提升。软硬件底座,如机器人操作系统和仿真引擎,显著提升了技术研发效率。
国家地方共建具身智能机器人创新中心总经理熊友军表示,将让机器人在大脑方面能够具备“一脑多机”和“一脑多能”的能力。所谓“一脑多机”是机器人的大脑以后除了用在人形机器人平台上,还可用在轮式机器人、机械手臂、爬行机器人上,各种各样的机器人都可以用这个聪明的大脑。所说的“一脑多能”,实际上就是机器人能够适应各种不同的场景,室内场景、室外场景、家庭场景、工业场景、教育场景、养老场景等等,都能够适应,这就是未来希望具身智能机器人大脑能做的事情。
1. 工业制造领域:具身智能有望成为新型工业化的关键核心,使得机器人从“能动”到“能干活”转变,为工业制造业的智能化升级提供支持。例如,通过自然语言控制机械臂、无人机、移动机器人等,提高生产效率和制造精度 。
2. 自动驾驶领域:具身智能的感知、决策与行动能力与自动驾驶天然契合,将推动从简单的导航到全面的环境交互和决策的转变,为智能交通和智慧城市建设提供基础 。
3. 物流运输领域:具身智能通过优化仓储物流产线,实现高效货物运转,降低流通成本,助力形成高效、快捷、现代化、智能化的物流体系 。
4. 家庭服务领域:具身智能将解放人类双手,实现全场景的智能家务服务,提供拟人化交互服务,应对老龄化问题 。
5. 医疗康养领域:具身智能提供辅助和服务,有望极大地改善医疗服务的质量和效率,推动医疗服务从传统的被动治疗向主动预防、个性化护理和智能化康复转变 。
6. 其他领域:具身智能还将推动各行各业的创新与转型,从赋能到变革,开启智能应用的新纪元 。
据不完全统计,2024年上半年,具身智能概念创业公司超50家,融资事件频发。同时,在上海世界人工智能大会、世界机器人大会、云栖大会现场,具身智能机器人也备受瞩目。
具身智能领域的初创公司类型多样,涵盖了从技术研发到产品应用的各个环节。以下是一些具身智能初创公司的类型和特点:
1. 技术研发型:这类公司专注于具身智能技术的研究与开发,包括算法、软件、硬件等多个方面。例如,穹彻智能(Noematrix)致力于研发具身智能大脑系统及其相关工具与平台,提出了“以力为中心”的具身大脑系统,通过快速迭代通用技能,实现高效且低成本的解决方案 。
2. 产品应用型:这些公司致力于将具身智能技术应用于具体的产品中,如家庭服务机器人、工业机器人等。例如,智元机器人(AgiBOT)推出了具身智能机器人远征A1,该公司在短时间内完成了多轮融资,并进入了福布斯中国推出的“2023上半年全球新晋独角兽全名单” 。
3. 数据驱动型:这类公司专注于收集和处理具身智能所需的大量数据,以训练和优化智能系统。例如,北京具身智能机器人创新中心正在建设国家级数据采集训练场,未来将建成百万量级高密度、高质量、高通用性数据集,打造世界最大的具身智能机器人数据工厂 。
4. 平台服务型:提供平台和服务,帮助其他公司或开发者快速开发和部署具身智能应用。例如,穹彻智能推出了AnySkill通用技能系列产品,可适配多种具身智能本体平台,具有高度的环境适应性和操作对象泛化能力 。
5. 硬件创新型:专注于具身智能硬件的设计和制造,如机器人的机械臂、腿部关节等。这些公司可能与技术研发型公司紧密合作,共同推动具身智能技术的发展。
6. 垂直领域应用型:针对特定行业或场景,如医疗、教育、零售等,开发具身智能解决方案。这些公司通常对特定领域有深入理解,能够将具身智能技术与行业需求有效结合。
特斯拉、谷歌、英伟达、OpenA1、小米、优必选、华为、科大讯飞等国内外多家知名企业均在具身智能领域积极布局,并已取得显著进展。
2023年5月,英伟达发布多态具身智能系统 VIMA,能在视觉文本提示的指导下,执行复杂任务、获取概念和理解边界。2024年2月,英伟达宣布成立通用具身智能体研究实验室GEAR,标志着英伟达正式入局具身智能领域的研究,加速人工智能具身化进程。
2023年8月谷歌DeepMind推出机器人模型Robotics Transformer2(RT-2),是全球第一个控制机器人的视觉-语言-动作大模型(Vision Language Action Models,VLAs),10月发布 RT-X机器人大模型。
2024年4月,优必选人形机器人WalkerS通过百度智能云千帆 AppBuilder 平台接入百度文心大模型进行任务调度应用开发,共同探索 AI大模型+人形机器人应用。
2024年4月份起北京具身智能机器人创新中心围绕具身智能基础模型、具身智能仿真应用以及大规模具身智能数据集等,开展具身智能体母平台“开物”的研发。
特斯拉宣称将推进Optimus人形机器人的进一步应用,预计2025年Optimus正式部署到工厂。
据36氪研究院测算,具身智能的市场规模已从2018年的2,923亿元增长至2023年的7,487亿元,年复合增长率达到20.7%。预计未来五年,具身智能的市场规模将持续增长,有望在2026年突破万亿规模。
图 / 中国具身智能行业市场规模预测(单位:亿元)
数据来源:36氪研究院根据公开资料整理与测算
具身智能产业是一个融合了先进技术、复杂系统集成和多元化应用场景的综合性产业。产业链涵盖了从硬件基础到技术核心,再到多元产品与应用场景的广泛领域。上游的芯片、传感器、电机、通信模组和能源管理为具身智能提供了坚实的硬件基础;中游的AI算法、操作系统、云服务和中间件是技术核心,负责实现智能设备的各项功能;下游的机器人和自动驾驶载具则是具身智能的具体应用,涵盖工业制造、服务业、家政服务、交通出行和公共安全等多个领域。
图 / 具身智能产业图谱
来源:36氪研究院
1. 芯片
- AI芯片:作为具身智能的“心脏”,AI芯片提供强大的计算能力,支持复杂的算法运行。主要包括GPGPU、FPGA、ASIC芯片(如VPU和TPU)和存算一体芯片。
2. 传感器
- 力传感器:测量智能体与环境的接触力和力矩,对于复杂和精细作业至关重要。六维力传感器是力控核心部件。
- 触觉传感器:模仿生物触觉,提供外界感知,对智能体末端的动作执行和精细操作同样重要。
- IMU惯性传感器:测量物体的角速度和加速度,对智能体姿态控制和定位导航具有关键作用。
- 视觉传感器:助力智能体直接获取外部图像信息,以实现模型和软件运行。3D视觉传感器提供更为丰富的空间信息。
3. 电机(含伺服电机)
- 伺服电机:作为执行机构,将智能系统的指令转化为具体的物理动作,实现机器与环境的交互。
4. 通信模组
- 无线通信模组:负责设备之间的数据传输和通信,确保系统各部分之间的协同工作,实现信息的无缝流转。
5. 能源管理
- 高性能电池:为人形机器人等提供稳定的能源供应,延长续航时间。
- 电源管理系统:确保系统的高效运行和能源管理。
1. AI算法
- 大模型:提升具身智能的感知精度、决策效率和执行自主性,使其能够更灵活地适应复杂多变的环境。
- 强化学习:通过不断与环境交互收集数据,优化内部模型和策略。
- 进化算法:增强学习和优化能力,适应环境变化和任务需求变化。
2. 操作系统
- 统一软件平台:为智能设备提供操作系统,支持各种应用程序的运行和管理。
3. 云服务
- 云计算:提供弹性可扩展的计算资源,满足具身智能在处理大规模数据和运行高性能算法时的需求。
4. 中间件
- 连接桥梁:起到连接不同系统和组件的桥梁作用,确保系统的整体协同工作。
1. 机器人
- 服务机器人:包括餐饮配送机器人、酒店机器人、清洁机器人、医疗康养机器人等。
- 工业机器人:用于自动化生产线、智能仓储与物流、质量控制与检测等环节。
- 医疗机器人:提供精准的辅助治疗服务。
- 特种机器人:用于高危环境中的任务执行。
- 人形机器人:具备高度仿真的身体结构和强大的运动能力,广泛应用于工业制造、服务业和家政服务等领域。
2. 自动驾驶载具
- 自动驾驶汽车:利用自主导航和避障技术,提高交通安全和出行效率。
- 无人机:具备垂直起降、悬停、自主飞行等能力,在航拍、物流、农业、救援等领域发挥重要作用。
- eVTOL:结合了传统航空器的快速性与地面交通工具的便捷性,能够在城市密集区域实现垂直起降。
3. 应用场景
- 工业制造:提升生产效率、保障人员安全并缓解劳动力短缺问题。
- 服务业:提升客户体验,应用于客户服务、导购、迎宾等任务。
- 家政服务:满足未来养老需求,提供陪伴与亲和力,并通过低成本与量产策略实现家庭普及。
- 交通出行:改变人们的出行方式和物流配送模式。
- 公共安全:为社会的安全和稳定提供保障。
『制造前沿』整理具身智能领域部分代表企业如下。
1. 英伟达(NVIDIA)
- 主营业务:GPU芯片和AI计算平台
- 应用领域:自动驾驶、智能制造、医疗影像分析等
2. 华为
- 主营业务:通信设备、服务器、AI芯片(如昇腾系列)
- 应用领域:5G、云服务、智能终端
3. 小米
- 主营业务:智能手机、智能家居设备、智能机器人
- 应用领域:家庭助理、陪伴机器人、教育辅助
4. 特斯拉
- 主营业务:电动汽车、自动驾驶系统、人形机器人(擎天柱)
- 应用领域:工业生产、家庭服务
5. 优必选
- 主营业务:人形机器人、伺服驱动器、计算机视觉
- 应用领域:养老、商用服务、教育、家庭陪伴
6.云深处科技
- 主营业务:自主研发的“绝影”系列机器人
- 应用领域:电站、工厂、管廊巡检以及应急救援、消防侦查等多种应用环境
7.达闼
- 主营业务:云端智能机器人开发平台和人形服务云端机器人
- 应用领域:各类清洁、巡检、机械臂、人形机器人产品
8. 汇川技术
- 主营业务:工业自动化控制与驱动技术
- 应用领域:工业机器人、伺服系统
9. 星尘智能
- 主营业务:人形机器人
- 应用领域:家庭生活、教育、酒店等
10. 本末科技
- 主营业务:直驱电机、机器人整机技术
- 应用领域:机器人关节系统、机械狗、机械臂
1. OpenAI
- 主营业务:大模型研发(如ChatGPT、GPT-4)
- 应用领域:智能客服、内容创作、游戏AI
2. 谷歌(Google)
- 主营业务:AI算法、搜索引擎、云计算
- 应用领域:医疗、金融、教育
3. 百度
- 主营业务:AI算法、搜索引擎、自动驾驶技术
- 应用领域:自动驾驶、智能搜索
4. 科大讯飞
- 主营业务:语音识别、自然语言处理、机器人超脑平台
- 应用领域:智能家居、智慧零售、教育
5. 寒武纪
- 主营业务:人工智能芯片
- 应用领域:云边端一体、软硬件协同
1. 擎朗智能
- 主营业务:服务机器人(如配送机器人、清洁机器人)
- 应用领域:餐饮、酒店、医疗康养、工厂、商超
2. 云迹科技
- 主营业务:AI、具身智能研发、应用及平台建设
- 应用领域:酒店、医院、工厂、公寓及楼宇
3. 广和通
- 主营业务:无线通信模组和AIoT解决方案
- 应用领域:云办公、移动宽带、智慧交通、智慧零售、智能机器人
4. 宇树科技
- 主营业务:四足机器人、人形机器人
- 应用领域:科研、教育、娱乐
5. 智元机器人
- 主营业务:人形机器人,由华为天才少年智晖君创办。
- 应用领域:工业制造、服务业、家政服务
1. 阿里巴巴
- 主营业务:电子商务、云计算、AI技术
- 应用领域:智能客服、内容创作、新零售
2. 腾讯
- 主营业务:社交网络、云计算、AI技术
- 应用领域:智能客服、内容创作、智慧零售
3. 苹果
- 主营业务:消费电子产品、软件、AI技术
- 应用领域:智能家居、个人助理
4. 三星
- 主营业务:消费电子产品、半导体、AI技术
- 应用领域:智能家居、个人助理
从工业领域到服务场景,再到养老领域,具身智能展现出了广阔的应用前景。但它仍面临技术能力不足、数据短缺、工程实现复杂等挑战。未来,算法、数据与硬件的深度融合将成为推动具身智能发展与应用的关键趋势 。随着技术的不断突破,具身智能将使得各种物理实体显现出对环境动态变化的自适应能力、多任务行动的泛化能力、交互方式的拟人化表现和更高的任务执行效率,这些能力增长点有望带来更高的应用价值和广阔的市场空间 。
陈女士 0755-88917464