AI 画画催生新职业:现在出售 DALL・E 2 提示词就能赚钱,平台抽成 20%
- 量子位
2022-08-14 18:46
DALL・E 2、GPT-3 提示词在线交易平台,了解一下?
最近,一家初创公司 PromptBase,允许用户在该平台买卖提示词(Prompt),提示词售价为 1.99 美元。PromptBase 将向卖家抽成 20%。
平台上已上架不少提示词,生成内容范围从新闻标题、运动队标志、针织娃娃到动物的正装照,应有尽有。
▲ 用户尝试用 DALL・E 2 生成包含皮卡丘形象的图片
拿“Knitted Doll”这款来说,它能保证让 AI 生成可爱且风格一致的针织娃娃,但每次生成的具体样式则是随机的。宛如一款 AI 盲盒。
目前,PromptBase 仅托管在 DALL・E 2 和 GPT-3 上测试的提示,但创始人 Ben Stokes 对外称,未来平台将拓展到其它系统,最终目的是服务于一种全新的职业 —— 提示工程师(Prompt Engineers)。
什么是提示工程?
提示工程(Prompt Engineering)是伴随预训练模型和少样本学习诞生的概念,可用很小的代价让 AI 执行全新的任务。
换句话说,就是把任务用文字描述出来喂给 AI,AI 理解之后便能直接执行,无需再次训练。
创建具有特定画家风格的图像就是一个典型案例,比如输入提示“日出时分安坐在田野里的狐狸,莫奈风格”,你将得到:
提示的描述风格没有固定,任君选择。
你想在得到的图像中有一只考拉,有一辆自行车。你可以写作“一幅考拉骑自行车的儿童画”,也可以写“一张考拉骑车的老照片”。
如此自由度,让 GPT-3 的生成文字和 DALL・E 的生成图像等应用风靡一时。
不过对于人类玩家来说,想要让 AI 稳定的生成自己满意的作品也不是一件容易的事。网络上不断有人在分享自己试验出来的技巧,让人眼花缭乱。
猜猜看,使用 DALL・E 返回“一幅非常漂亮的画,画中一座山紧邻瀑布”和“一幅非常非常非常漂亮的画,画中一座山紧邻瀑布”两个提示,哪个输出的结果会更好?
答案是后者。
因为 DALL・E 2 对“非常”这个词赋予了极高的权重。
2022 年斯隆研究奖获得者,MIT 电子工程与计算机科学系助理教授 Phillip Isola 在 Twitter 上做了个有趣的试验。用 0 个 very 和 22 个 very 分别修饰了“一幅画,画中一座山紧邻瀑布”这一提示。
最终结果对比如下:
▲ 0 个 very(1、2 行)和 22 个 very(3、4 行)修饰提示后分别输出的图像
果然,“very”数量越多,图像就更精美。
另外得克萨斯大学奥斯汀分校的一项研究中,研究人员记录了大量使用 DALL・E 2 生成图像的提示词,其奇怪程度堪称“魔咒”。
拿这俩不知所云的词组举例:
1、Apoploe vesrreaitais(以下简称词组 1)
2、Contarra ccetnxniams luryca tanniounons(以下简称词组 2)
是真・不知所云,翻译软件看了都能原地懵圈。
但在 DALL・E 这儿,词组 1 的代表着“鸟”,词组 2 代表着“虫子 / 害虫”。如果告诉 DALL・E“词组 1 eat 词组 2”,你会获得这样的图:
现在是否能够理解,为啥把提示比作“咒语”了 —— 一些不知道在说啥的词,恰好对应着系统的一些内部逻辑。
总的来看,提示一定程度上快捷地满足了“所需”。但要玩转这些 AI 还需要讲究很多技巧,对懒人来说,在 PromptBase 这类平台上购买提示,省事儿多了。
提示卖钱,这个商业模式成立么?
来正经说说买卖提示这事儿。
此前,以 DALL・E 为主,许多研究人员和爱好者已经发布过免费的流行 AI 系统提示词资源。
作为最早将提示词商业化的公司之一,PromptBase 饱受争议。实际上,AI 社区内部一直存在着关于哪些研究应该或可以商业化的争论。
出售提示并不违反任何 AI 提供商的服务条款,也没人能阻止 PromptBase 客户使用购买的提示。
不过,由于背后涉及一系列道德和法律问题,不乏有人将其视为不该打开的“潘多拉魔盒”。
首先是信息泄露问题。
研究表明,在大量公共数据(如 GPT-3)上训练的语言系统在输入某些提示时,会“泄漏”更人信息,包括姓名和地址等。
再者,如果提示 DALL・E 2 生成“宝可梦的 3D 模型”,就难免涉及对任天堂公司的侵权问题。
▲ 用户尝试用 DALL・E 2 生成包含皮卡丘形象的图片
研究人员还推测,DALL・E 2 的“咒语”,可以绕过其违禁词过滤器,从而生成一些原本禁止的图像,比如暴力图像。
以及,虽然 PromptBase 表示会严格审查,确保提示不违反任何“AI 生成规则”,但如果业务增长、市场扩大,严格的审查水平可能难以维持。
德国萨尔州学院的计算语言学家 Vagrant Gautam 也认为提示商业化可能会导致提示滥用。
同时,她也觉得这是一把双刃剑。毕竟,提示可以卖钱,懂技术的人可以把副业搞起来了。
“提示商业化指出了提示工程的重要性,以及创造力、耗时、对抗性思维等所需技能的重要性。”Gautam 说。
用户对提示商业化的抱怨,主要集中在免费调整提示的次数太少。
但转头一想,人们又必须采取这种反复试验、对抗性的方法来搞明白怎么促使生成模型,完成自己的“所需”。
看到这里,你是否会购买提示词呢,或者会不会考虑出售提示词赚点外快?
参考链接:
[1]https://promptbase.com
[2]https://techcrunch.com/2022/07/29/a-startup-is-charging-1-99-for-strings-of-text-to-feed-to-dall-e-2/
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。