他用 GPT-3 实现了「量子速读」

你是否曾为了查一个问题，翻书翻到头秃？

要是书里有的内容，一问便知就好了...... 等等，“一问便知”，这怎么有 ChatGPT 那味儿了？

话说，有人还真就由此思路开发出一个聊天 Bot，做示例的书是马可・奥勒留的《沉思录》（全书共 12 卷，497 则）。

只用几分钟，AI 就能记下全书内容。

然后随便问个书里讲过的东西，比如“如何处理负面情绪？”，AI 可以快速扫描文本并给出高质量回答，甚至还一条条给你列好。

原帖一发布，网友纷纷围观点赞。

开发者 Dan Shippers 称，做出这个 AI 并不难，主要功臣就是语言大模型 GPT-3，另外再加几行代码就搞定了。

另外，这哥们儿甚至还嗅到了一丝商机：

网上现在有很多受版权保护的文本、音视频资料集，都能被做成聊天机器人！
对想获取信息的人来说，有时一看给了钱自己还要慢慢整理，可能就放弃了；而要是能通过 AI 快速锁定目标内容的话，应该会有更多人愿意自掏腰包。

怎么做出来的？

用 Dan 哥的话来说，Bot 制作过程主要分为 3 个步骤。

首先，当然是找到整活的素材。比如整本《沉思录》。

Dan 哥从网上下载了《沉思录》原著，将其保存在 Google Dive 的一个文件夹中。通过 Google Drive，用户可以将文件存储在云端，并在设备间同步、共享。

然后再在谷歌的云端编程平台 Colab 上，运行下面这段 Python 代码，既能访问 Google Drive，还能轻松实现与 GPT-3 的互动。

Dan 介绍称，GPT-3 能以任何文本素材为基础，给你整出一个聊天 bot。

不过有个问题：单次能向 GPT-3 输入的文本字数是有限的。

所以第二步，就是访问存在 Google Dive 上的那个文件夹，再把整个文本素材划分成一个个小块，存到新的文件中。

第三步，当用户提问时，先通过 OpenAI 的 API 访问书中包含相关解释的小块内容，再把这些内容传到 GPT-3 中，整理出语言通顺的回答。

具体代码如下：

到此，为整本《沉思录》专门定制的聊天机器人就做好了。

除此之外，基于此基本思路，Dan 哥又把他喜欢的某系列播客节目也做成了聊天 Bot。

他说自己曾在节目中听到一个感兴趣的名词，但忘了是啥意思。平时想弄明白的话，不得不把一集内容重新听一遍。

但现在有了聊天 Bot—— 重听？不存在的。

话说回来，能从聊天机器上人看到新的商机，Dan 哥的过往经历或许也产生了一定影响。

他本科毕业于宾夕法尼亚大学的文科类哲学系，但这位哥其实还是个技术大佬。

他从小学 5 年级就开始编程，在大学期间又和小伙伴创办了一家软件公司 FireFly，收入在六位数以上。

他还在上大二时，不少科技公司就已抛来橄榄枝，但人家都拒绝了，说是想先完成学业。

大学一毕业，他把 FireFly 卖给了知名业务软件公司 Pegasystems，赚到第一桶金。

紧接着，他在 Pega 担任起项目负责人，并把业务部门的收入提高到百万美元级别。

再后来，他从 Pega 出来，于 2020 年又创办一家公司 Every，主要创作商业类简报和播客，目前已有 6 万 + 订阅用户。

（怪不得他会想到把播客内容做成聊天机器人）

目前除了自己开公司，Dan 还兼任红杉资本的 Scout，为风投者出谋划策。

参考链接：

[1]https://twitter.com/danshipper/status/1620464918515302401
[2]https://every.to/chain-of-thought/i-trained-a-gpt-3-chatbot-on-every-episode-of-my-favorite-podcast
[3]http://danshipper.com/

本文来自微信公众号：量子位（ID：QbitAI），作者：Alex

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。