智谱发布新一代基础模型，清言 App 国内率先面向 C 端开放视频通话服务

2024-08-29 23:23 IT之家 - 问舟

感谢IT之家网友有鲫雪狐的线索投递！

IT之家 8 月 29 日消息，智谱 AI 在 KDD 2024 大会上发布了新一代基础模型，自称在相应领域均达到了国际第一梯队的水准，并宣布在 MaaS 平台上免费开放 GLM-4-Flash API：

语言模型 GLM-4-Plus：在语言理解、指令遵循、长文本处理等方面性能得到全面提升。
文生图模型 CogView-3-Plus：具备与当前最上面的 MJ-V6 和 FLUX 等模型接近的性能。
图像 / 视频理解模型 GLM-4V-Plus：具备卓越的图像理解能力，并具备基于时间采集的视频理解能力。该模型将上线开放平台（bigmodel.cn），并成为国内首个通用视频理解能力模型 API。
视频生成模型 CogVideoX：在发布并开源 2B 版本后，5B 版本也正式开源，其性能进一步增强。
GLM-4-Flash API：推理服务免费，并提供完全强大的服务。

除此之外，智谱还宣布在清言 App 上线了视频通话功能，这是国内首个面向 C 端用户开放的视频通话服务。

智谱表示，GLM-4-Plus 基础模型在各项指标上，实现与 GPT-4o 等第一梯队模型持平。此外，在 GLM-4-Plus 模型的训练过程中，智谱通过采用更精准的长短文本数据混合策略，显著增强了模型在长文本推理方面的表现。

对于 CogView-3-Plus，智谱采用 Transformer 架构替代了传统的 UNet 架构来训练扩散模型，并深入研究了扩散模型的噪声规划，其效果目前接近一线水平的 MJ-V6 和 FLUX 等模型。

目前 GLM-4-Plus 模型已正式上线开放平台（IT之家注：bigmodel.cn），对外提供 API 服务；同时也即将在清言 App 中上线；CogView-3-Plus 模型已经正式上线清言 App 供大家使用。

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。