宇树科技王兴兴:具身智能的“ChatGPT时刻”有望在未来两到三年内实现
4月29日,宇树科技创始人、CEO王兴兴在第九届数字中国建设峰会主论坛上表示,如同2022年底ChatGPT的诞生刷新了人们对大语言模型的认知,在具身智能领域,也可以期待未来两到三年内能实现“ChatGPT时刻”。
王兴兴将“具身智能的ChatGPT时刻”定义为:未来,机器人能在80%左右的陌生场景中,通过语音和语言指令,顺利完成80%左右的任务。他认为,一旦人形机器人执行任务的泛化能力达到这一水平,就意味着具身智能真正迈过了落地应用的门槛。
要实现这一目标,王兴兴指出了三大关键突破方向:一是提高模型对任务的表达能力,二是提升模型对数据的利用率,三是改善AI模型与真实机器人的对齐效果。他表示,目前AI模型与机器人的动作对齐效果仍不理想,“是非常需要突破的点”。
在现场,王兴兴还介绍了人形机器人在运动能力和干活能力方面的最新进展。在运动能力方面,近期宇树机器人已突破10米/秒的速度关卡。“我相信未来两到三个月,应该可以用机器人刷新人类的短跑纪录。”王兴兴透露。
在干活能力方面,论坛现场播放的视频中,宇树人形机器人已在工厂中承担机器人关节电机的装配工作。
他表示,宇树科技一直坚持并行推动提升机器人的运动能力和干活能力。运动是机器人干活的先决必要条件,近年来机器人运动能力飞速进步,但干活能力在泛化上仍未得到根本性解决。“目前机器人在单工序单工位的任务上成功率可达100%,但多任务的泛化能力仍需加强。”王兴兴表示。
王兴兴对具身智能的技术路径持乐观态度。他认为,当下具身智能“很可能本质上已经没有底层技术问题了”,剩下的主要是工程问题,但工作量巨大。“这个时代是数据驱动时代,要驱动海量数据,就需要海量算力,而海量算力又需要大量能源。”王兴兴表示。
数据是AI发展的关键。王兴兴认为,现在AI发展都是由数据驱动的,“有多少数据,就有多少AI能力。数据质量越好,AI能力就越强”。他表示,凡是有足够高质量数据的领域,现有的AI技术就能把问题都解决,而人形机器人领域的数据仍极为稀缺。宇树科技将在今年以及未来几年大规模推进全身机器人的运动数据采集,为具身智能飞跃铺路。