70 亿 / 130 亿参数,微软研究院发布 Orca 2 LLM:性能媲美 10 倍参数模型

2023-11-22 08:37IT之家 - 故渊

IT之家 11 月 22 日消息,微软研究院(Microsoft Research)近日发布新闻稿,推出了相比较主流语言模型更小的 Orca 2 LLM,不过依然可以回答一些复杂问题。

微软 Orca 2 共有 70 亿和 130 亿两种尺寸,部分融合了 Llama 2 LLM 参数,通过融合定制的高质量合成数据,提供更准确、更优秀的合成数据。

微软表示 Orca 2 使用扩展的、高度定制的合成数据集进行训练。Orca 2 支持分步处理、回忆然后生成、回忆-原因-生成、提取-生成和直接回答等各种推理技术,同时还能为不同的任务选择不同的解决方案策略。

Orca 2 模型相比较 Llama 2 和 WizardLM 等大型语言模型,在痛苦理解、常识推理、多步推理、数学问题解决、阅读理解等方面更为优秀。

微软表示:“我们的初步结果表明,Orca 2 的性能明显优于类似尺寸的模型。它还达到了与至少大 10 倍的模型相似或更好的性能水平,展示了为较小模型配备更好推理能力的潜力。”

IT之家附上微软 Orca 2 模型的介绍链接,感兴趣的用户可以深入阅读。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      一大波评论正在路上
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享