OpenAI 官宣将发布自 GPT-2 以来的首个开放权重语言模型,并具有推理功能
IT之家 4 月 1 日消息,OpenAI CEO 萨姆・奥尔特曼今日官宣,将在未来几个月发布一个“强大的新开放权重语言模型”,并具有推理功能。
我们计划发布自 GPT-2 以来的首个开放权重语言模型。
我们考虑这件事已经很久了,但其他优先事项占了上风。现在感觉做这件事很重要。
发布前,我们将根据准备的框架评估这个模型,就像我们会对任何其他模型做的那样。鉴于我们知道这个模型将在发布后进行修改,因此还会做额外的工作。
我们还有一些决定要做,所以将举办开发者活动来收集反馈,并在之后尝试早期原型。我们将在几周内在旧金山开始(举办开发者活动),随后在欧洲和亚太地区举行会议。
我们很期待看到开发者们将如何构建,以及大型公司和政府如何使用它,在他们更愿意自己运行模型的地方。
到目前为止,用户只能通过 OpenAI 的界面或将其 API 密钥集成到他们的应用中来使用其模型,这意味着模型本身保持秘密和专有。
然而,开放权重模型是不同的。这些模型中预训练的参数(定义模型如何响应的“权重”)是向公众公开共享的。开发人员和研究人员可以下载它们,在本地运行它们,针对特定用例进行微调,或将它们插入到自定义应用中。IT之家提醒,仅仅因为权重是开放的并不意味着就是开源的,训练代码、数据集和详细日志可能仍然保持专有或未公开,因此可能并不是完全的开源。
Meta 和 Mistral 等公司已经发布了 Llama 和 Mixtral 等强大模型,而 DeepSeek、阿里巴巴和百川等新玩家也在推出可以与其匹敌的开源模型。从学术研究人员到独立开发者,许多人开始拥抱开放权重模型,OpenAI 也是时候做出改变了。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。