世界最大 AI Agent 生态系统,微软推出全新“自主 AI 智能体”
- 新智元
2024-11-21 13:18
微软正在悄悄改变企业 AI 的游戏规则!现在,微软已经悄悄组建了世界最大的 AI 智能体生态系统,
自推出以来,已经有超过 10 万家公司,用 Copilot Studio 创建了自己的 AI 智能体。
比如,麦肯锡通过自动化的流程分配智能体,将项目受理流程从 20 天缩短至仅 2 天;Pets at Home 在不到两周内部署了防欺诈智能体,每年节省数百万美元……
「这个增长速度远超我们的预期,也远超我们发布的其他任何前沿技术的表现,」微软智能体负责人 Charles Lamanna 透露道,「仅仅一个季度,就实现了 2 倍的增长。」
在昨天的 Ignite 大会上,微软更是重磅宣布:企业可以在智能体中,使用 Azure 目录中 1800 个 LLM 中的任何一个模型了!这就意味着,微软不再依赖于 OpenAI 的独家模型。
同时,微软还全新推出了可以独立工作的自主 AI 智能体,它们可以检测事件,在最低程度的人为干预下,来参与进我们复杂的工作流。
这些 AI 智能体能自主推理,还能操作执行特定任务的软件。从此,企业的生产力又将更进一步。
Copilot
Word
在 Word 中,Copilot 将帮助你查找相关的来源和额外的内容,以便进行草拟。
当开始撰写新文档时,Copilot 会找到相关的文件、电子邮件和会议记录,并基于它们创建草稿。在撰写文档过程中,Copilot 会在整个文档中显示这些来源,并让你选择是否在草稿中保留引用。
该功能从 11 月开始在 Word 网页版中提供,并于 2025 年初在桌面端推出。
Copilot 还会根据语气、结构和故事性等方面提供改进建议,帮助你提升文档质量。该功能目前提供公共预览版。
只需在 Copilot 聊天窗格中输入提示,它就可以在文档中智能检索并添加 SharePoint 组织资源库中的相关图像,也可以使用 DALL-E 3 生成相关的新图像。该功能将于本月推出。
Excel
无论是创建项目预算、库存跟踪器还是销售报告,从零开始创建一个符合需求的电子表格可能既令人畏惧又耗时。
现在,Copilot 可以帮你解决。只需告诉 Copilot 想要创建什么,Copilot 就会根据你的需求建立一个模板。该功能将于年底前开始向拥有 Microsoft 365 Copilot 许可证的 Windows 和网页用户推送。
例如,你可以快速创建一个公司销售团队的表格。Copilot 可以添加列、应用条件格式,甚至按指令更改表格颜色。只要你对表格满意,你就可以将其插入页面并继续使用 Copilot。
在 Excel 中,Copilot 可以引用企业内部数据中的 Word、Excel、PowerPoint 和 PDF 文件了。
如果让 Copilot 在 Excel 中列出 Word 文档中草拟的新闻稿中的公告,它会给出一个列表,让我们插入到新表格中,或者复制粘贴到现有的表格中。
在专注于工作流的同时,我们就可以轻松获得企业信息,比如让 Copilot 提供某位特定经理的所有直属员工名单,将其插入到电子表格中。
另外,我们还可以在 Excel 的 Copilot 中无缝进行网络搜索,在不打乱工作流的情况下,查找日期、统计数据,或者查找各国汇率的表格,把这些信息复制粘贴到自己的表格中。
你还可以用自然语言从 Excel 文件中查找和导入表格。
对于文本密集型的 Excel 表格,例如客户反馈和调查结果,Copilot 的文本分析功能可以帮助你更深入地理解这些数据。只需让 Copilot 总结你的文本数据,它还会附上引用信息,帮助你了解数据来源。
Copilot 还可以将文本数据按主题分类和排序,帮助你更快速地分析非结构化的文本数据。例如,如果你有数千条客户评论,Copilot 可以将它们划分为多个主题,如质量、服务和价格,帮助你快速确定需要进一步关注的主题。
你还可以将这些主题插入表格中的新列,保留分析结果,并创建数据透视表和图表,直观呈现主题的数量和趋势。
PowerPoint
和 Word 的部分功能类似,Copilot 也支持优化文本、插入图片。
此外,Copilot 的 Presentation Translator 功能可以将演示文稿翻译成 40 种语言,可翻译的内容包含文本框、形状、表格、图表、演讲者备注、评论以及 Smart-Art 中的文字。
Copilot 会自动为所有幻灯片生成演讲者备注,为你提供一个可靠的初稿,你可以根据需要进一步修改。
通过简单的提示和一个 Word 文件,Copilot 的 Narrative Builder 能够依据它们起草一个 PPT 初稿。
Copilot Pages 新增功能
在 9 月,微软发布了 Copilot Pages—— 一个为多人 AI 协作设计的动态、持久画布。
除了文本,Pages 现在还支持更多内容类型,如代码、互动图表、表格、图示和数学公式。
这些组件可以基于网页或工作数据在 BizChat 中创建,并且它们可以进行实时交互和动态修改,能够在通过 Outlook、Teams 等 Microsoft 365 应用分享时保持同步。
Copilot Pages 还增加了多页面支持,你可以在单个聊天会话中创建多个新页面,或者将来自多个聊天会话的内容添加到单个页面中。
此外,你还可以在移动设备上编辑和分享 Pages,从而实现多端多人协作。
所有这些功能将在 2025 年初正式推向 Pages。
微软全家桶的其他成员
在 Outlook 中,通过 Copilot,用户可以使用自然语言来安排会议。Copilot 还能帮助你起草会议议程,包括摘要和关键要点。
在 OneNote 中,借助 Copilot Chat,你可以通过自然语言命令,总结笔记内容、创建任务列表或重写笔记内容。
此外,Copilot 还能帮助你在几秒钟内整理笔记本的章节。在 OneNote 应用中打开 Copilot,输入「整理这个章节」,Copilot 就会自动整理您的笔记页面。
而 Facilitator 智能体将在 2025 年初支持 Teams 会议室功能,能够为会议室内外的所有与会者实时记录并显示笔记。
Facilitator 智能体还支持说话者识别的功能。这一功能将支持更多会议场景,从 Teams 会议室到自带设备(BYOD)的会议室,能够识别房间内的声音和人员,让每位发言者清晰可见。说话者识别还使 Copilot、Facilitator 以及智能会议回顾能够正确识别发言人,确保会议记录和行动项归属准确无误。
此外,微软还推出了一款新的 AI 翻译器,可以模拟发言者的声音,在 Teams 平台上提供九种语言的近实时语音翻译,包含中文(普通话)、英语、法语、德语、意大利语、日语、韩语、葡萄牙语(巴西)和西班牙语。
目前该功能正在一小部分用户中进行测试,预计将在 2025 年向拥有 Microsoft 365 Copilot 许可证的账户广泛开放。
Copilot Studio
正如开篇所述,微软对于 Copilot Studio 的更新可谓是相当重磅。
1. 扩展知识管理功能
开发者可以使用最新的生成模型,实时更新并引用第三方数据源,利用检索增强生成(RAG)功能,提升其智能体的质量。
2. 新增分析功能
开发者可以根据特定结果筛选图表,以了解关键绩效指标(KPI)和客户满意度。
3. 新增语音和图像功能
现在可以加入语音解决方案,包括互动语音应答(IVR)系统;或者将智能体部署到应用程序中,让用户通过语音与智能体互动。用户不仅可以与智能体进行语音交流,还可以上传图片并要求智能体分析并回答有关该图片的问题。
4. 定制自主智能体功能进入预览阶段
开发者可以创建无需人工提示的智能体,它们检测到特定事件后可随时做出响应,并触发一系列业务操作。
5. Microsoft 365 Agents SDK 进入预览阶段
有了 SDK,开发者如今可以通过代码扩展智能体的功能,构建企业级、可扩展的多渠道智能体。
知识管理
Copilot Studio 正在扩展知识管理和 RAG(检索增强生成)能力。该功能已进入预览阶段。
平台引入了连接器功能,可以接入全新的知识源。开发者现在可以让智能体从多个第三方数据源(如 Salesforce、ServiceNow 和 Zendesk)获取实时知识。Copilot Studio 仅对这些表格的元数据进行语义索引,无需数据移动,就能帮助回答来自这些第三方源的复杂问题。
你还可以将某些数据来源标记为「权威」,以确保智能体优先使用这些数据,提供可靠的相应。
除了接入新知识,Copilot Studio 还使用了最新的 GPT 模型并优化了 RAG 策略,以获取高质量答案。
通过高级知识调优功能,开发者可以更好地控制数据源。对于每个问题,开发者现在可以清楚地看到哪些数据源被使用、哪些还尚未解答。知识调优功能还会建议从组织中添加额外知识,并提供指导性方法来筛选和优先考虑知识源。
智能体上线之前,开发者还可以进行测试,查看其响应的准确性如何。
此外,平台还提供详尽的分析数据,如数据源使用率等,以了解是否需要调整某些数据源。
Copilot Studio 的知识管理功能还整合了 Azure AI Foundry,以支持更复杂、更定制化的场景。
开发者通常会在 Azure AI 中存储大量数据。
现在可以直接将这些数据作为知识源用于 Copilot Studio,可以在 Azure AI Search 中构建的向量化索引上执行搜索操作,以访问非结构化数据。
开发者还可以将这些数据与定制的 RAG 策略结合到 Copilot Studio 中,以获得更准确的结果。通过连接所有数据源,组织可以确保智能体更加贴合其业务数据,提供具体且高质量的响应。
这还不是全部。Copilot Studio 中还引入了更高级的 Azure AI 功能。开发者很快就能访问 Azure AI 模型目录中的模型,其中包括超过 1800 个模型。他们还可以直接在 Copilot Studio 中访问并调用自己定制微调的模型。
全新分析
通过全新的分析功能,开发者能够了解其生成式 AI 系统的运行情况。
除了前面提到的知识库数据源的分析外,用来衡量系统或业务整体表现的顶层指标也得到了全面升级。这些指标将更完善、更高效,并能够展示长期趋势。
开发者可以根据特定结果筛选图表,以了解关键绩效指标(KPI)和客户满意度。
语音和图像
Copilot Studio 现已加入语音功能。企业可以将智能体集成到交互式语音应答系统(IVR)中,让原本僵化的语音菜单变身为灵活的 AI 助手。
只需指定知识来源,智能 IVR 即可在电话中轻松应对大量复杂问题,显著减少问题升级至人工处理的情况。这些智能语音助手还能识别语音、处理用户打断、检测静音、并进行重新提示。
不仅限于 IVR 系统,支持语音的智能体还能嵌入应用程序、独立终端、礼宾系统等场景。
例如,一家酒店的应用程序可以使用一个接入相应知识库的 Copilot 智能体,充当客房内的专属礼宾服务,为宾客提供贴心帮助。
除了语音功能,Copilot Studio 还新增了图像处理能力。
用户现在可以上传图片,并向智能体提问。例如:「为什么我这个月的账单更高?」
此外,图像上传还能用来录入数据。销售人员可以对智能体说:「把这些手写笔记添加到 CRM 系统中。」
自主智能体
定制自主智能体的功能早在 10 月底宣布,如今终于开启预览。
自主智能体可以独立代表用户、团队或组织,自动化处理那些复杂又耗时的业务任务。
开发者可以设计智能体检测特定事件(例如新邮件到达),这些智能体可随时做出响应,并利用生成式 AI 触发一系列操作,自动化复杂的业务任务。
例如,智能体可以一口气执行以下操作:
1. 评估邮件意图
2. 查找发件人详细信息及账户信息
3. 查看以往通信记录
4. 检查库存情况
5. 回复发件人并询问其偏好
6. 采取适当行动关闭工单
开发者既可以从零开始构建自主智能体,也可以在 Copilot Studio 中配置预构建好的特定功能的智能体。
智能体 SDK
Microsoft 365 Agents SDK 目前已经提供预览版。
这意味着 Copilot Studio 的开发者如今可以通过代码扩展智能体的功能,构建企业级、可扩展的多渠道智能体。
开发者拥有完全的灵活性,可以连接任意 AI 服务,包括 Azure AI Foundry、Semantic Kernel、Copilot Studio 等。
使用 SDK 构建的智能体还可以部署到多种渠道,如 Microsoft 365 Copilot、Microsoft Teams、Web,以及十多个第三方消息平台。
两款定制芯片,专为数据处理和安全打造
大会上,微软推出了两款专为数据中心基础设计设计的芯片:Azure Integrated HSM 和 Azure Boost DPU。
Azure Boost DPU 是微软的第一个数据处理单元,专为以数据为中心的高效率和低功耗工作负载而设计。
微软预计未来配备 DPU 的 Azure 服务器,将以现有服务器 4 倍性能运行,但同时也要消耗 3 倍的电力。
这款芯片的设计,可能起源于微软去年 12 月,以 1.9 亿美金收购的 DPU 制造商 Funcible。
另一款芯片是专为安全而打造的 Azure Integrated HSM。
它可以将前签名钥和加密密钥放在一个安全模块中,而不会影响性能,或增加延迟。
它是继 Pluton 之后,微软第二颗安全芯片。Pluton 是一款内置于英特尔、AMD 和高通处理器中的以消费者为中心的芯片。
从明年开始,Azure Integrated HSM 将配备在微软数据中心的每一台服务器上,以增加 Azure 硬件对机密和通用工作负载的保护。
迷你 PC 仅需 2500 元,但不能运行本地应用
在硬件方面,微软发布了一款自称比 Mac mini 还要小的 PC——Windows 365 Link,售价 349 美元(2526 元)。
这款 mini PC 计划在明年推出,并搭配 Windows 365 云服务使用。
也就是说,它将不会在设备上运行任何本地内容。
Link 被设计成一款紧凑、无风扇、易于使用的云电脑,可连接显示器和外部设备。
通过 Windows 365 服务,企业可以让员工使用存在于云端的虚拟机,这些虚拟机可以安全地串流到多个设备上。
它可以在几秒内启动,能够即时从睡眠状态唤醒,并使用自己的芯片来处理 Microsoft Teams 或思科 Webex 的视频。
它有两个 USB-A 3.2 端口和一个 USB-C 3.2 端口,以及一个 DisplayPort 和 HDMI 端口和以太网连接。在前面,有一个 USB-A 3.2 端口,还包括 Wi-Fi 6 E 和蓝牙 5.3 无线连接。
参考资料:
https://www.microsoft.com/en-us/microsoft-copilot/blog/copilot-studio/copilot-studio-is-enhancing-its-platform-with-knowledge-improvements-azure-ai-integration-and-more/
https://venturebeat.com/ai/microsoft-quietly-assembles-the-largest-ai-agent-ecosystem-and-no-one-else-is-close/
本文来自微信公众号:微信公众号(ID:null),作者:HYZj,原标题《世界最大 AI Agent 生态系统!微软推出全新「自主 AI 智能体」,10 万企业工作流被改变》
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。