15 秒语音片段就能合成某人声音,OpenAI 小规模开放 Voice Engine 模型
IT之家 3 月 30 日消息,OpenAI 公司近日发布公告,有限开放 Voice Engine 的访问权限,该模型可以根据某人的 15 秒语音片段创建合成语音。
OpenAI 在新闻稿中表示:“通过开放小规模部署,有助于我们按照现有方法、保障措施等推进产品落地,并在不断磨合、探索过程中思考,如何将 Voice Engine 用于各行各业”。
OpenAI 公司表示,目前已经向教育技术公司 Age of Learning、视觉故事平台 HeyGen、前线健康软件制造商 Dimagi、人工智能通信应用开发商 Livox 和健康系统 Lifespan 等公司开放访问。
在 OpenAI 发布的这些样本中,你可以听到 Age of Learning 利用该技术生成预制 voice-over 内容,以及向学生朗读由 GPT-4 撰写的“实时、个性化回复”。
IT之家附上参考地址
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。