利用 ChatGPT 等大模型训练,波士顿动力将 Spot 机器狗变成“会说话的导游”

2023-10-27 08:18IT之家 - 清源(实习)
感谢IT之家网友 Alejandro86 的线索投递!

IT之家 10 月 27 日消息,波士顿动力公司于数小时前在其官方 YouTube 频道上传了一段视频,展示了波士顿动力机器狗的“语言能力”。视频中,波士顿动力机器狗化身“导游”带领工作人员参观自家公司的各种设施。

这只机器狗目前能够回答问题,在发出声音的同时,“嘴巴”也可以随之张开。据介绍,波士顿机器狗目前之所以可以开口说话,是因为工程师们使用了 ChatGPT 的 API 和一些开源的大语言模型来对其进行训练。同时,工程师们为机器狗配备了扬声器,并添加文字转语音功能。视频中的机器狗使用一口“英国口音”询问员工是否可以开启旅程,并介绍即将参观的充电站。

▲ 图源波士顿动力公司 YouTube 视频截图

据波士顿动力公司的首席软件工程师 Matt Klingensmith 介绍,为了实现上述的“导游”功能,团队为机器狗提供了一个非常简短的脚本,涉及公司设施中每个房间的信息。然后,机器狗将脚本与它身体上的摄像头等硬件获得的图像结合起来,让它在产生反应之前,能够获得更多关于它所见事物的资料。

波士顿机器狗这次能够实现的能力不只是“导游”,它还可以吟出“发电机在没有欢乐的房间里低声哼唱,好像我的灵魂”这样的诗句。当工作人员有一次问及机器狗的“父母”是谁时,它指向了办公室中陈列的旧款机器狗。

综合IT之家此前报道,波士顿动力公司的机器狗已经陆续展现了包括翻跳舞蹈、智能重新规划路线、跑酷、倒啤酒等在内的多种技能。2020 年 12 月,现代汽车宣布以 10 亿美元收购波士顿动力,成为波士顿动力的母公司。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      一大波评论正在路上
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享