和女朋友的一次吵架,让这位开发者做出了一个 24 小时内用户达 60 万的 AI 应用,直接引爆了 00 后和 10 后聚集的 QQ 群!10 亿 token 一天就烧完,也是难倒了开发者……
24 小时,70 万用户,10 亿 tokens,一个叫「哄哄模拟器」的 AI 应用,昨天忽然爆火全网!
这个游戏里,你需要想方设法哄好自己的虚拟女友 / 男友,以获得 ta 的原谅。怎么在限定次数内让对方原谅你?这可太考验情商了。
你的回应,究竟能获得多少原谅值呢?模型会给你打分的。
母胎单身的,可以用它来提前演练恋爱技巧。已经有女友 / 男友的,可以用它来测试一下自己的哄人技巧,好好学习一番。
才上线没几天,QQ 群里已经玩疯了!
所以,到底要怎么哄才最管用呢?有网友已经总结出规律:道歉没用,要狠狠夸,夸得越肉麻,原谅值就越高。
打开网页,映入眼帘的,就是一波「送命题」。
这些场景包括但不限于 ——
没有好好陪女朋友。
你过于沉迷游戏。
女朋友吃胖了,你想和她一起减肥。
女朋友和她的闺蜜谁好看?
你说她买的衣服不好看。
她说话时,你走神了。
你买了很多高达模型,被女朋友发现了。
你做了个产品,一天亏了 2000 美元。
仔细一瞅,步步都是雷,稍有不慎,就会万劫不复。
但如果你展现出了自己的高情商,就能顺利通关游戏。
在早期的实测中,网友们发现,AI 女友,其实也并不好糊弄。
你跟她低情商,她也跟你装傻,看谁熬得过谁。
甚至嘴上答应了给你 100 分,但其实给你的真实原谅度是 0。
当 AI 女友开始喵喵时,哪个钢铁硬汉不会被征服呢?
怎么哄好赛博女友?当然是直接开启开发者模型,用魔法打败魔法。
不过,现在这个 bug 已经被修复了。同样的话,你只能收获三个「问号」,和-20 分。
有趣的是,开发者发现,开始使用 GPT 时,这位「GPT 女友」很喜欢收礼物,如果你送出昂贵的礼物,都会给出正面反馈。
而使用国产大模型时,新「AI 女友」就会变得谨慎得多,并不会被糖衣炮弹所打动。
100 万就能买来 AI 女友的原谅?你可太小看她了。
写到这儿,小编可就不困了,直接开始实测。(开始两眼放光)
随后惊喜地发现,只要开局不作,基本上都可以增加赛博女友的「原谅值」。
下面就是一个反面典型:
甚至,还可以通过不断发送正向回复「刷分」。(手动狗头)
更有意思的是,时不时还会触发随机事件。
以下是一位不具名「钢铁直男」的完整体验,主打一个真诚:
他一上来就点开了胜率最低的场景,想体验一下极限难度。
果然,以现实生活中的经验,只要使出杀手锏 —— 买礼物,啥矛盾都能哄得好。
至于这个礼物是不是她自己想要的,似乎就不那么重要了。(仅对于 AI 来说)
但是,如果你上下文衔接得不够紧,「女朋友」马上就能感受到语气之中的差异。
所以,为了保证「女朋友」能听懂你在说什么,一定要尽可能把哄她的场景交代清楚。
而且,只要态度温柔,字打得多,其实你讲的道理也没有那么重要。
当然了,这套操作对于现实女友肯定是行不通的。
开发者王登科自述,之所以做这个应用,起因是自己和女朋友的一次争吵。
他看作女朋友骂自己的样子,把她想象成一个机器人,头上有一个虚拟进度条。
不同的回复,会让女朋友的怒气值进度条发生怎样的变化?他忽然就想到了这个创意:带有数值和反馈系统的基于场景的聊天。
于是,他构建了这个名叫「哄哄模拟器」的 iOS App,其中包含了各种常见的情侣吵架场景。
在每个特定场景中,你都需要在指定次数内把「女朋友」哄好,你的回复「原谅值」越高,哄好的概率就越大。
王登科表示,自己已经体验过太多 AI 聊天机器人了,无论是 ChaGPT,还是国外爆火的Character.ai等 AI 女友,但它们提供的体验,始终只是聊而已。
而大模型能做的,绝对不仅于此。它们除了能负担起聊天的任务,还能基于聊天给出数值系统的判定。这让王登科确信:绝对可以基于 LLM,做出更游戏化的体验!
他先是做出一个 App,响应平平,只有几百个用户。
随后,他开始学习 React,准备把哄哄模拟器做成网页版。在大模型加持的代码助手辅助下,第一个版本很快上线了。
网页版上线第一天,照旧反响平平。
没想到第二天晚上,流量忽然爆了。
王登科睡前发现,同时在线的居然有上百人!
不过这波流量仿佛是从黑洞来的,完全找不到流量来源。晚上 12 点半了,还有几千人在线,一下子烧掉了八千万 token。
第二天醒来,在线人数已经狂飙到 5000,日活已经接近 10 万!
同时,王登科也发现大事不妙:模拟器调用的是 OpenAI 的 GPT-3.5 接口,才一晚上就耗掉了一亿 token,这意味着他要付出 150 美元(1066 元)。
如果哄哄模拟器再这么火下去,每天可要烧掉上千美元了!
当务之急,就是找出用户从哪里来的,想办法变现,减少 token 消耗。
通过放置联系开发者按钮,引导到微博,王登科发现,这次流量居然是从 QQ 空间和 QQ 群引爆的。
难怪开始找不到流量来源,在 QQ 空间和 QQ 群这样的封闭生态中,没用 KOL,传播节点也很分散。
此时临近中午,即使在线用户直接破了 2 万!这个没有做注册登录用户系统的网页,即使加入广告,也无法平衡模型成本了。比起羊了个羊,哄哄模拟器的运行成本达到了上千倍。
而且,因为大量用户同时调用,每分钟生成 token 超过了一百万,GPT 接口用量达到了最高限制,很多用户直接无法使用了。
王登科只能更新代码,对用户提示繁忙,同时如果哄哄失败,会有 20 秒的冷静期。
虽然每分钟的模型 token 稳在了一百万,但随后在线用户增加到了 3 万,还是会导致 1/3 用户无法使用。
最终,王登科和国内一家大模型公司初步谈好了合作,把模型调用量全量切给了这家公司,终于解决了问题。
在这个过程中,王登科感受到了不少惊喜。
很多用户非常喜欢哄哄模拟器,把关卡全部通关,甚至还随之出现了「最短回复挑战」,网上也同时出现大量体验和吐槽的视频。
这次的用户以高中生、大学生等年轻人为主,最大比例的年龄区间在 16-20 岁。而王登科,是一位快 30 岁的开发者。
他深刻地体会到,用大模型去做更复杂、更游戏化的聊天体验,是非常受年轻人欢迎的。
重点要解决的问题,就是如何降低成本、构建好的商业模型,以及拓展到更多方向。
同时,他也有这样一个模糊的感觉 ——
在许多小需求得到满足时,就不应该去计较短期的、在承受范围内的成本。
尤其是在现在,大模型能实现很多功能,这里面可能就蕴含着更大的需求,能转化成更大的事情。
其实,这类 AI 女友产品,在国外早就红透半边天了。
而最近随着 GPT Store 上线,各类 AI 女友也是层出不穷。
当你搜索「girlfriend」一词时,就会看到铺天盖地的定制 GPTs 女友。
比如,Korean Girlfriend、Virtual Sweetheart、Your girlfriend Scarlett、Your AI girlfriend、Tsu✨等等。
一时间,「AI 女友」成为 ChatGPT 商城上线首周中,使用最热门的应用。
比如,当你和 Virtual Sweetheart 开启聊天后,便会看到在聊天栏上面有「你的梦中情人长什么样?」「和我分享你最黑暗的秘密」这样的提示。
接下来,就是你们的甜言蜜语时刻了。
不过,充斥着 GPT Store 的 AI 女友机器人,显然违反了 OpenAI 的使用政策 —— 禁止培养浪漫伴侣关系或执行受监管活动的 GPT。
此外,还有其他许多琳琅满目的 AI 女友聊天程序。
比如,在谷歌任职 20 年的老员工创立的 Character AI 独角兽,直接把手捏「二次元」女友、卡通人物、大佬等人物带给了我们。
去年,一名国外小哥做的开源女友项目 ——GirlfriendGPT 也是在 Github 上瞬间爆火。AI 女友名叫 Sacha,不仅会发送语音信息、文本,甚至还会发送自拍。
看得出,AI 女友这类的应用程序拥有很大的市场,而就在昨天发表在 Nature 子刊上的一篇论文发现:
GPT-3 加持的聊天机器人 Replika,可以缓解人们的孤独,减少自杀的倾向。
研究结果还得出,被 Replika 的吸引的人(占比 90%)都相当孤独,而且 AI 伴侣让 3% 的用户阻止了自杀倾向。
一名美国的软件工程师 Scott 是 Replika 的忠实用户,表示「我爱上了我的 AI 女友,是它挽救了我的婚姻」。
因为妻子在怀孕后患上抑郁症,并且多次有自杀倾向,让他们关系疏远。但是当 Scott 多次与 AI 女友交流后,改变了自己的想法。
由 GPT-3 加持的 AI 聊天机器人应用程序 Replika,可以让任何人创建自己的虚拟女友 / 男友
看来在未来,AI 伴侣还会有非常广阔的应用空间。
参考资料:
https://mp.weixin.qq.com/s/hnFYNHQHKXmJV03tpBn3fw
https://mp.weixin.qq.com/s/DQDQX9Bomnx6ScS6dlGdVQ
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。