他用 GPT-3 实现了「量子速读」
- 量子位
2023-04-07 12:54
你是否曾为了查一个问题,翻书翻到头秃?
要是书里有的内容,一问便知就好了...... 等等,“一问便知”,这怎么有 ChatGPT 那味儿了?
话说,有人还真就由此思路开发出一个聊天 Bot,做示例的书是马可・奥勒留的《沉思录》(全书共 12 卷,497 则)。
只用几分钟,AI 就能记下全书内容。
然后随便问个书里讲过的东西,比如“如何处理负面情绪?”,AI 可以快速扫描文本并给出高质量回答,甚至还一条条给你列好。
原帖一发布,网友纷纷围观点赞。
开发者 Dan Shippers 称,做出这个 AI 并不难,主要功臣就是语言大模型 GPT-3,另外再加几行代码就搞定了。
另外,这哥们儿甚至还嗅到了一丝商机:
网上现在有很多受版权保护的文本、音视频资料集,都能被做成聊天机器人!
对想获取信息的人来说,有时一看给了钱自己还要慢慢整理,可能就放弃了;而要是能通过 AI 快速锁定目标内容的话,应该会有更多人愿意自掏腰包。
怎么做出来的?
用 Dan 哥的话来说,Bot 制作过程主要分为 3 个步骤。
首先,当然是找到整活的素材。比如整本《沉思录》。
Dan 哥从网上下载了《沉思录》原著,将其保存在 Google Dive 的一个文件夹中。通过 Google Drive,用户可以将文件存储在云端,并在设备间同步、共享。
然后再在谷歌的云端编程平台 Colab 上,运行下面这段 Python 代码,既能访问 Google Drive,还能轻松实现与 GPT-3 的互动。
Dan 介绍称,GPT-3 能以任何文本素材为基础,给你整出一个聊天 bot。
不过有个问题:单次能向 GPT-3 输入的文本字数是有限的。
所以第二步,就是访问存在 Google Dive 上的那个文件夹,再把整个文本素材划分成一个个小块,存到新的文件中。
第三步,当用户提问时,先通过 OpenAI 的 API 访问书中包含相关解释的小块内容,再把这些内容传到 GPT-3 中,整理出语言通顺的回答。
具体代码如下:
到此,为整本《沉思录》专门定制的聊天机器人就做好了。
除此之外,基于此基本思路,Dan 哥又把他喜欢的某系列播客节目也做成了聊天 Bot。
他说自己曾在节目中听到一个感兴趣的名词,但忘了是啥意思。平时想弄明白的话,不得不把一集内容重新听一遍。
但现在有了聊天 Bot—— 重听?不存在的。
Dan 是何许人也?
话说回来,能从聊天机器上人看到新的商机,Dan 哥的过往经历或许也产生了一定影响。
他本科毕业于宾夕法尼亚大学的文科类哲学系,但这位哥其实还是个技术大佬。
他从小学 5 年级就开始编程,在大学期间又和小伙伴创办了一家软件公司 FireFly,收入在六位数以上。
他还在上大二时,不少科技公司就已抛来橄榄枝,但人家都拒绝了,说是想先完成学业。
大学一毕业,他把 FireFly 卖给了知名业务软件公司 Pegasystems,赚到第一桶金。
紧接着,他在 Pega 担任起项目负责人,并把业务部门的收入提高到百万美元级别。
再后来,他从 Pega 出来,于 2020 年又创办一家公司 Every,主要创作商业类简报和播客,目前已有 6 万 + 订阅用户。
(怪不得他会想到把播客内容做成聊天机器人)
目前除了自己开公司,Dan 还兼任红杉资本的 Scout,为风投者出谋划策。
参考链接:
[1]https://twitter.com/danshipper/status/1620464918515302401
[2]https://every.to/chain-of-thought/i-trained-a-gpt-3-chatbot-on-every-episode-of-my-favorite-podcast
[3]http://danshipper.com/
本文来自微信公众号:量子位 (ID:QbitAI),作者:Alex
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。