微软借 AI 改善 Win11/10 版 Teams 网络通话质量:可填补高达 80 毫秒音频空白
IT之家 10 月 2 日消息,微软 Teams 是工作场所中使用最多的在线协作工具之一,特别适合混合或在线模式办公场景。微软定期对 Teams 软件进行改进,同时也增加新的功能。现在,微软公司详细介绍了一项由人工智能(AI)驱动的新举措,可以使得 Teams 通话听起来更好,特别是在恶劣的网络条件下。
用户在微软 Teams 通话中的音频内容是通过本质上是“数据包”的方式发送。而这些数据包可能由于网络连接不畅而丢失,导致音频失真。
虽然微软不能真正解决用户的互联网连接问题,但该公司在 Teams 中利用“数据包丢失隐藏”(PLC)的技术,人为让用户的声音在具有挑战性的网络环境中听起来更好。在非常高的水平上,PLC 使用人工智能模型来识别音频传输中丢失的数据包,然后通过预测来填补任何空白。
微软表示,使用了深度学习技术来完成这一改进。该公司声称,传统的模型可以填补 20-40 毫秒的空白,但其 PLC 模型对 Teams 来说明显更好,因为这可以填补高达 80 毫秒的音频空白。
IT之家获悉,尽管微软在 600 小时的开源数据上训练了 PLC 模型,但引人注意的是,还收集了“数以百万计的匿名网络样本”,或者是来自真实 Teams 呼叫的“痕迹”,以测试其模型。在 PLC 模型发布后,网络条件差的参与者报告说,其性能提高了约 15%。
微软强调,其 Teams PLC 模型完全在本地运行,而且只在网络质量不佳的情况下运行。最近,Teams PLC 模型已经适用于 Windows 客户,目前正在 Mac 上进行测试,而且将很快就会进入移动端领域。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。