马斯克 xAI 展示首个多模态模型 Grok-1.5V:可将流程图转成 Python 代码

2024-04-13 13:35IT之家 - 故渊
感谢IT之家网友 四文鱼 的线索投递!

IT之家 4 月 13 日消息,马斯克旗下人工智能公司 xAI 于 3 月下旬推出 Grok-1.5 大语言模型之后,近日再次推出首个多模态模型 Grok-1.5 Vision。

xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision(Grok-1.5V),不仅能理解文本,还能处理文档、图表、截图和照片中的内容。

xAI 表示:“Grok-1.5V 在多学科推理、文档理解、科学图表、表格处理、屏幕截图和照片等多个领域都能媲美现有的前沿多模态模型”。

xAI 在官方新闻稿中演示了 7 个 Grok-1.5V 案例,,包括将白板上的流程图草图转化为 Python 代码、根据孩子的绘画生成睡前故事、解释流行语、将表格转化为 CSV 文件格式等等。

xAI 还分享了 Grok-1.5V 的跑分情况,在 RealWorldQA 基准测试中,比 GPT-4V、Claude 3Sonnet、Claude 3 Opus 和 Gemini Pro 1.5 等主流竞争对手更为优异。

IT之家附上参考地址

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      请登录后查看评论
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享