放话挑战 GPT-3:以色列推出参数多 30 亿、词条多 5 倍的新语言模型
- 量子位
2021-08-15 13:41
8 月 15 日消息 GPT-3 有多厉害不用多说了吧?
现在,以色列特拉维夫一家 AI 公司 ——AI21 Labs 表示要挑战一下这个巨星在 NLP 领域的主导地位。
他们计划发布一个比 GPT-3 还要大的模型,且目前不用排队苦苦申请,所有人都可以免费“调教”。
大多少呢?
GPT-3 模型拥有 1750 亿个参数,而他们这个叫做 Jurassic-1 (侏罗纪-1) 的模型有 1780 亿个。
GPT-3 模型的词汇表有 5 万个 token,而 Jurassic-1 使用的词汇表则有 25 万个!
对所有人开放,训练只需提供 50-100 个样本
Jurassic-1 模型的训练数据包括 3000 亿个 tokens,由维基百科、新闻出版物、StackExchange(问答网站)和 OpenSubtitles(全球最大的多国语言开放字幕库)上的信息编译而来。
在云上经过数百个 GPU 的分布式训练而成,由于最终存储 1780 亿个参数需要超过 350GB 的内存,这就要求开发团队使用多种策略来尽可能提高流程的效率。
而减少文本表示所需的 token 数就是一个好办法。
Jurassic-1 使用的词汇表不仅包括了完整词和分词(word piece),还挖掘了一些不太常见的词或词组,比如“纽约洋基队”、“run of the mill(习语,平庸的)”、国家元首名字。
这也是 Jurassic-1 成为第一个使用包含多词汇 (muti-word) token 的语言模型。
这就让模型的效率提上来了,比如“Once in a while I like to visit New York City”这句,GPT-3 需要使用 11 个 token 来表示,而 Jurassic-1 只需 4 个。
Jurassic-1 模型的规模大了 30 亿参数,GPT-3 能干的活它自然也“不甘示弱”:生成“人话”自不用说,文本转表格、话题分类、Python 转 JavaScript、从产品描述中生成简短的产品名称、写歌、算数等从简单到复杂的任务都能 hold 住。
▲ Jurassic-1 重新解读商场“黑话”
▲ Jurassic-1 写博客
性能如何呢?
实验显示,Jurassic-1 模型在一系列任务中的表现与 GPT-3 相当或更好 (尤其是在回答学术和法律问题方面)。
下表说明了在几乎所有的语料库中,Jurassic-1 模型的适用性都大幅领先对手 GPT-3。
▲ 各种语料库中每个字节的平均对数概率(log-probabilities)
此外,与 GPT-3 相比,Jurassic-1 在零样本学习中与之性能持平,但在少样本学习中略胜一筹,这也是因为它的 tokenizer 可以在相同的上下文长度中容纳更多的文本,因此可以在 prompt 中包含更多的示例。
▲ 零样本实验结果
▲ 少样本实验结果
现在,Jurassic-1 模型的公测版本已通过 AI21 Labs 的 Studio 平台提供给开发人员使用,大家训练只需提供 50-100 个样本,就能搭建一些诸如聊天机器人的应用程序原型。
无论你是大中小企业、研究员、自由职业者还是什么身份,所有人都可以不用排队申请就能使用。
如果有人希望上线自己搭出来的成果,获得生产规模流量,可申请访问定制模型并获得私有微调版本,在一个“按量付费”(pay-as-you-go )的云服务模式中使用。
ps.多少人申请的 GPT-3 API 一直是 still waiting 的状态?
不过,至于如何将模型定制到新任务上,AI21 Labs 表示这是个秘密,但反正过程会比标准微调技术更具有鲁棒性。
因此,模型不太会容易“大面积失忆”,也就是在新任务上的继续微调不会丢失此前编进去的信息。
虽然自己骂自己,但它的语言偏见略低于 GPT-3
可能你也会说,Jurassic-1 在根本上也没啥大新奇之处。
但复刻了 GPT-3 的开源 AI 研究机构 EleutherAI 表示,这是一项工程壮举,而且他们毫不怀疑 Jurassic-1 能执行出与 GPT-3 相当的效果。
不过问题是此类服务能否在激烈的竞争中盈利,以及如何处理不可避免的安全问题,比如模型的语言偏见。
Jurassic-1 当然也没有解决模型输出潜在的性别、种族和其他形式的偏见。
但团队表示非常重视这个问题,目前正在限制在公开测试版中可以生成的文本数量,并且将人工审查每个微调模型的请求以防止滥用。
不知道能解决多少问题,反正 Jurassic-1 连自己人都骂
!
就比如下面这个,Jurassic-1 生成了歧视犹太人的文本:
最后团队只是“弱弱”地表示,通过 StereoSet(语言系统中与性别、职业、种族等相关的偏见评估基准)测试发现,Jurassic-1 模型的偏见略低于 GPT-3。
关于 AI21 Labs
以色列一家专注于自然语言处理的 AI 公司,2017 年成立,目前从以色列最大的创投机构 Pitango 等公司获得了 3450 万美元资金。
创始人包括斯坦福大学名誉教授 Yoav Shoham,CrowdX 创始人和以色列辅助驾驶系统 Mobileye 的创始人 Amnon Shashua ,目前有 40 多名员工。
Jurassic-1“调教”地址:点击打开
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。