阿里云 CTO 周靖人:GPT-4 处于领先地位,通义千问每周迭代进步

2023-04-12 14:41凤凰科技 - 蒋浇

4 月 11 日,在 2023 阿里云峰会上,阿里版 ChatGPT 通义千问正式亮相。阿里云智能首席技术官周靖人提出,所有的软件都值得接入大模型升级改造,阿里将开放通义千问的能力,帮助每家企业打造专属大模型。

在如火如荼的生成式 AI 浪潮面前,国内已有不少科技企业顺势推出大模型,这些大模型免不了与 ChatGPT 做比较。

谈及这一话题,周靖人接受凤凰网科技等媒体采访时表示,圈内人对于 ChatGPT 的走红并不感到意外,阿里在 19 年就启动了大模型的研发,通义千问并不是为了针对 ChatGPT 而做的,它并不是终态,未来还会有更多的预训练大模型出现。

此前,阿里云已推出“通义”系列模型,包括通义-M6、通义-AliceMind 和通义-视觉模型,而近期发布的超大规模语言模型通义千问,也是该系列的延续。据悉,通义千问具备多轮对话能力、文案创作能力,包括小说续写、邮件编写、企业策划等,同时具备多语言能力和多模态能力。

周靖人坦言,OpenAI 是目前全球大模型领域的引领者,GTP-4 在各个方面都处于一个领先地位,尤其在推理、数学方面都有非常不错的表现,通义千问还不能及而在文本对话、阅读理解方面,通义千问较为擅长,它每周都在迭代,每周都有进步

在他看来,AI 技术竞争处于一个你追我赶的态势,这是科技进步的一个必然阶段,大家需要取长补短,阿里希望在下一阶段能够贡献自己的技术创新。

同时,周靖人表示,阿里体系所有产品完成 AI 升级改造未有明确时间表,目前还有许多探索性的工作。可以确定的是,天猫精灵、钉钉会率先接入测试,将在评估认证后发布新功能。

AIGC 竞赛中,算力通常被认为科技企业比拼的重点。周靖人对此表示,不要迷信参数,打造一款人工智能大模型,并不是依靠算力芯片的简单堆叠,这是囊括了底层算力、存储、大数据、AI 框架的系统性工程,需要 A + 云计算的全栈技术能力。阿里是全球少有在几个领域都有深入布局和积累的科技公司之一。

对于科技大厂而言,除了继续追赶大模型训练和进行安全评估外,如何降低成本也是难题,这也是阿里云需要重点攻克的方向。

周靖人表示,如何对专属模型进行进一步成本的降低,能够有效的把真正解决行业问题所需要的那部分智能保留,把其他部分的智能能够节省下来,这中间有非常多的技术的创新和技术的突破,这正是阿里云在这方面比较有优势的地方。

云计算能带来极大的算力资源节约,周靖人指出,当前国内数据中心的 CPU 平均利用率在 10% 左右,而云数据中心内的 CPU 平均利用率,可以达到传统数据中心的 5 到 10 倍。阿里云对主售产品价格的大幅调低,将会促进云计算渗透率进一步提升,更好地满足智能化时代对的算力需求。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      请登录后查看评论
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享