Optimus未来有望通过观看YouTube视频来掌握执行任务的能力

8月26日,特斯拉在人形机器人Optimus的训练方法上进行了重大调整。该公司计划完全摒弃传统的动作捕捉服和远程操控技术,转而采用纯视觉方案进行机器人训练。

这一转变标志着特斯拉机器人战略的重大转型。公司内部消息显示,特斯拉已经在6月底向员工明确表示,未来将主要通过记录员工操作视频的方式来训练Optimus。

过去,特斯拉采用动作捕捉服和虚拟现实头显来收集人类操作数据,并远程控制机器人完成任务。但现在,该公司转向了新的方法:让员工佩戴特殊设计的摄像头设备,记录其执行各项任务的视频数据。

据知情人士透露,这种新方法的优势在于能够快速扩大数据收集规模。特斯拉开发了一套包含5个自制摄像头的设备,安装在员工头盔和背包上,从各个角度捕捉操作过程中的细节。

这一技术路线与该公司在自动驾驶系统上的训练方式一脉相承。马斯克曾多次强调,AI可以通过视觉传感器掌握复杂任务。特斯拉的自动驾驶系统正是基于大量真实道路视频数据进行训练。

新方法的实施带来了显著变化。员工现在需要按照详细指令执行特定动作,尤其是在手部动作方面必须尽量接近人类自然形态。有员工表示,完成某些简单动作可能需要耗时数月。

专家指出,要让机器人从视频数据中学习并转化为实际操作能力是一项巨大挑战。佛罗里达州立大学的克里斯蒂安·胡比茨基认为,多角度拍摄有助于获取更精细的动作细节,但建立通用动作库仍是一个关键难题。

与自动驾驶不同,人形机器人需要处理的任务类型更加多样复杂。俄勒冈州立大学的艾伦·费恩表示,Optimus的训练难度可能远超汽车自动驾驶系统。驾驶任务相对单一,而机器人需要理解视频中发生的各种情况,并具备相应操作能力。

尽管面临诸多挑战,特斯拉仍在积极推进这一创新方向。该公司目前暂停了部分招聘工作,但截至8月底仍有多项与Optimus相关的职位开放。