IT之家 10 月 2 日消息,OpenAI 公司昨日(10 月 1 日)发布博文,宣布为 GPT-4o 模型引入视觉微调(vision fine-tuning)功能,除了文本之外还支持微调图像。
OpenAI 表示自开放微调 GPT-4o 以来,数十万开发者使用数据集(仅文本)微调了该模型,从而提高了驾驭某些特定任务的能力。
OpenAI 在博文中展示了一些合作伙伴的微调案例:
Garb :通过视觉微调,提升了交通标志定位准确性 20% 和限速标志定位 13%。
Automat:成功率从 16.60% 提升至 61.67%,并在信息提取任务中 F1 分数提升 7%。
Coframe:通过微调提升了网站生成的一致性和布局正确性 26%。
OpenAI 宣布项所有付费用户开放视觉微调功能。
在 2024 年 10 月 31 日之前,每天免费提供 100 万训练 token,用于针对 GPT-4o 模型进行图片微调。
2024 年 10 月 31 日之后,GPT-4o 微调训练收费,每 100 万训练 token 收费 25 美元(IT之家备注:当前约 176 元人民币)
推理每 100 万 token 输入收费 3.75 美元(当前约 26.3 元人民币)
推理每 100 万 token 输出收费 15 美元(当前约 105 元人民币)。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。