集结了 Transformer 作者、前 OpenAI 工程副总裁的创业团队,不到半年就亮出首个大模型 ——
Action Transformer(ACT-1)。
简单来说,这是一个会使用浏览器、Excel 等软件工具的 AI。
基于 Transformer 的自然语言处理能力,它能理解人类给出的命令,并完成相应操作。
比如,想要在 Excel 表格中加上利润、利润率,只需把这段话输入给 AI,它就能自己在对应行列创建公式完成任务了。
想要在网上找房子,也不用自己搜索再设置各种筛选条件了。
只需要告诉 AI:帮我在休斯顿找一套四口之家住的房子,预算在 60 万。
然后 AI 就能一气呵成找到目标范围内的房源了。
整个过程非常丝滑连贯,看上去比自己手动操作要快上很多。
最大的好处就是不用自己来操作了,“吆喝”一声即可,属实是懒癌福音。
团队表示,他们认为人类在电脑上的各种操作,通用人工智能也能搞定,ACT-1 正是他们朝这个方向迈出的第一步。
从官方目前公布的功能来看,这个 AI 像是 Siri、微软小娜的究极加强版。
它的优势在于帮人们省去了很多繁杂的操作,比如在网页上填信息表格,鼠标不操作个十几次很难搞定。
但是如果用 AI,只需输入一句话。
而且 AI 的操作并不局限在一个网页。
让它找个一千块以下的冰箱并联系卖家,AI 先从购物平台上检索,然后自己打开邮箱写邮件。
遇到自己不懂的事情,还知道上维基百科搜索一番。
即便是操作失误了,也能根据人类给出的教程指导快速学习。
这不,一开始弄成乱码的 Excel 表格,在学习了正确的公式后,AI 很快给出了正确的操作。
总之就是把日常我们用电脑时的一些繁琐小事,交给 AI 来办。
正如公司创始人兼 CEO David Luan 所说,他们希望由 AI 来完成一些琐碎的基础电脑操作,让人类更专注于自己的工作。
研发团队表示,他们是通过将 ACT-1 连接在一个 Chrome 扩展程序上,让它来观察浏览器的一些操作,比如点击、输入、滚动等。
目前来看 ACT-1 还有很多进步空间。团队希望它最终的操作速度可以达到人类察觉不到的水平。
值得一提的是,想让 AI 来充当人类电脑操作助手的,并非 Adept 一家。
今年 2 月,DeepMind 发表了一篇论文,表示他们利用数据驱动的方法,让 AI 学习到人类操作电脑的方式,从而让它们完成订机票等任务。
DeepMind 表示,他们训练的 AI 可以完成 100 多项任务,并且都达到了人类水平。
此外,由 DeepMind 联合创始人穆斯塔法等人创立的 Inflection AI,也是想以 AI 的方式,重新定义人机交互。
ACT-1 的打造者是 Adept,今年 4 月官宣成立。
天使轮便拿下 6500 万美元融资,投资人包括 Uber CEO、特斯拉自动驾驶负责人、Airtable 创始人等。
创始团队阵容非常豪华。
首席科学家是 Ashish Vaswani。他是《Attention is all you need》的第一作者,平常看论文时经常出现的“(Vaswani et al., 2017)”就是这位大佬。
他博士毕业于南加州大学,在谷歌大脑工作已有 5 年。
Transformer 的另一位作者 Niki Parmar 也加入了该团队。
她在印度上完大学后,同样在南加州大学读完硕士,在谷歌工作了近 7 年。
创始人兼 CEO David Luan,是前 OpenAI 加州实验室工程副总裁,参与过 GPT-2、GPT-3、CLIP、DALL-E 等模型的开发,后来加入谷歌,曾任谷歌大脑大模型研究的 Director。
除了以上几位,团队人员还包括:
Kelsey Schroeder,斯坦福大学计算数学(computational mathematics )专业硕士,前谷歌大模型生产 infra 的产品负责人;
Anmol Gulati,在谷歌主要做语音识别模型;
Augustus Odena,在谷歌领导大型语言模型相关的工作,也有不少图像合成方面的研究;
Erich Elsen,机器学习和高性能计算交叉领域的研究人员,前 Deepmind 员工,主要研究大模型,在更早之前,还分别在谷歌和百度(硅谷 AI Lab)干了两年;
Fred Bertsch,谷歌数据和协作人工智能系统方面的专家。
最后一位,Maxwell Nye,是刚从 MIT 毕业的一位博士生,研究重点为自动代码生成。
总的来说,可谓大佬云集,且各有专攻。
目前,Adept 的最新成果 ACT-1 还没有对外开放使用,但可以在官网排队了~
以及团队正在招聘人才,感兴趣的小伙伴可以关注一下子。
参考链接:
[1]https://twitter.com/AdeptAILabs/status/1570144499187453952
[2]https://techcrunch.com/2022/04/26/2304039/
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。