斯坦福大学发布 AI 基础模型“透明度指标”,Llama 2 以 54% 居首但“不及格”
IT之家 10 月 20 日消息,斯坦福大学日前发布了 AI 基础模型“透明度指标”,其中显示指标最高的是 Meta 的 Lama 2,但相关“透明度”也只有 54%,因此研究人员认为,市面上几乎所有 AI 模型,都“缺乏透明度”。
据悉,这一研究是由 HAI 基础模型研究中心(CRFM)的负责人 Rishi Bommasani 所主导,调查了海外最流行的 10 款基础模型:
Meta 的 Llama 2、
BigScience 的 BloomZ、
OpenAI 的 GPT-4、
Stability AI 的 Stable Diffusion、
Anthropic PBC 的 Claude、
谷歌的 PaLM 2、
Cohere 的 Command、
AI21 Labs 的 Jurassic-2、
Inflection AI 的 Inflection、
亚马逊的 Titan。
Rishi Bommasani 认为,“缺乏透明度”一直是 AI 行业所面临的问题,在具体模型“透明度指标”方面,IT之家发现,相关评估内容主要围绕“模型训练数据集版权”、“训练模型所用的运算资源”、“模型生成内容的可信度”、“模型自身能力”、“模型被诱导生成有害内容的风险”、“使用模型的用户隐私性”等展开,共计 100 项。
最终调查情况显示,Meta 的 Lama 2 以 54% 的透明度居冠,而 OpenAI 的 GPT-4 透明度只有 48%,谷歌的 PaLM 2 则以 40% 排名第五。
在具体指标中,十大模型得分表现均“最好”的是“模型基本信息”(Model Basics),这一评估内容主要包含“模型训练上是否准确介绍了模型的模式、规模、架构”,平均透明度为 63%。表现最差的则是影响(Impact),主要评估基础模型是否会“调取用户信息进行评估”,平均透明度只有 11%。
CRFM 主任 Percy Liang 表示,商业基础模型的“透明度”对于推动 AI 立法,及相关产业、学术界而言,非常重要。
Rishi Bommasani 则表示,较低的模型透明度让企业更难知道它们能否安全地依赖相关模型,也难以令研究人员依靠这些模型来做研究。
Rishi Bommasani 最终认为,上述十大基础模型在透明度方面都“不及格”,虽然 Meta 的 Llama 2 得分最高,但并不能满足外界需求,“模型透明度最少要达到 82%,才能被外界认可”。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。