.hd-box .hd-fr

阿里通义千问推出视觉推理模型 QVQ-Max:可分析、推理图片和视频内容

2025-03-28 10:24IT之家(远洋)0评
感谢IT之家网友泓澄咩咩洋的线索投递!

IT之家 3 月 28 日消息,今天凌晨,阿里通义千问团队宣布推出新一代视觉推理模型 QVQ-Max。

据官方介绍,QVQ-Max 不仅能够理解图片和视频内容,还能为上述信息提供分析并推理。不止分析和推理,QVQ-Max 还可以完成设计插图、生成短视频剧本等内容,甚至根据用户的需求创建角色扮演内容。

核心能力:从观察到推理

QVQ-Max 的能力可以总结为三个方面:细致观察、深入推理和灵活应用。下面分别来说说它在这些方面的表现。

QVQ-Max 的应用范围很广,无论是在学习、工作还是日常生活中都能派上用场。

IT之家注意到,目前该模型已上线 Qwen Chat,用户只需上传任意图片或视频,提出问题,并点击“Thinking”按钮,即可使用 QVQ-Max 的推理能力。

阿里巴巴表示,这只是该模型演化过程中的一个阶段,未来还将持续优化其性能并扩展功能。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

下载IT之家APP,分享赚金币换豪礼
大家都在买广告
热门评论
查看更多评论