微软推出多智能体框架 Magnetic-One:赋能企业 AI 应用
在企业部署多个 AI 智能体时,往往需要一个框架来管理它们。微软研究人员最近发布了一个名为 Magnetic-One 的全新多智能体基础架构,它允许单个 AI 模型驱动多个辅助智能体协同工作,以完成不同场景下的复杂多步骤任务。
微软将 Magnetic-One 称为一个通用的智能体系统,它可以“充分实现长期以来对智能体系统的愿景,即提高我们的生产力,改变我们的生活。”
该框架是开源的,并根据自定义的微软许可证提供给研究人员和开发人员,包括商业用途。与 Magnetic-One 的发布同时,微软还发布了一个名为 AutoGenBench 的开源智能体评估工具,用于测试智能体系统,该工具建立在其之前发布的用于多智能体通信和协作的 Autogen 框架之上。
通用智能体系统的理念是探索如何让自主智能体解决需要多个步骤才能完成的任务,这些任务通常出现在组织的日常运营中,甚至在个人的日常生活中。
从微软提供的示例来看,该公司希望 Magnetic-One 能完成一些几乎是日常的任务。研究人员将 Magnetic-One 指向诸如描述标准普尔 500 指数趋势、查找和导出缺失的引用,甚至订购沙威玛等任务。
Magnetic-One 依赖于一个协调器智能体,它指挥另外四个智能体。协调器不仅管理智能体,指示它们执行特定任务,而且在出现错误时还会重新分配任务。
除了协调器之外,该框架还包含四种类型的智能体:
- 网络冲浪智能体可以控制基于 Chromium 的网络浏览器,并导航到网站或执行网络搜索。它还可以像 Anthropic 最近发布的 Computer Use 一样点击和输入,并总结内容。
- 文件冲浪智能体可以读取本地文件、列出目录并遍历文件夹。
- 编码智能体可以编写代码、分析来自其他智能体的信息并创建新的工件。
- 计算机终端提供一个控制台,编码智能体的程序可以在其中执行。
协调器指挥这些智能体并跟踪它们的进度。它首先规划如何处理任务。它创建了微软研究人员称为任务账本的东西,用于跟踪工作流程。随着任务的继续,协调器构建了一个进度账本,“它会自我反思任务进度并检查任务是否已完成。”协调器可以分配一个智能体来完成每个任务或更新任务账本。如果智能体仍然卡住,协调器可以创建一个新的计划。
“总而言之,Magnetic-One 的智能体为协调器提供了解决各种开放式问题的工具和能力,以及自主适应动态且不断变化的网络和文件系统环境并采取行动的能力,”研究人员在论文中写道。
虽然微软使用 OpenAI 的 GPT-4o 开发了 Magnetic-One——OpenAI 是一家微软投资的公司——但它是与 LLM 无关的,尽管研究人员“建议为协调器智能体使用强大的推理模型,例如 GPT-4o”。
Magnetic-One 支持智能体背后的多个模型,例如,开发人员可以为协调器智能体部署一个推理 LLM,并将其他 LLM 或小型语言模型混合部署到不同的智能体。微软的研究人员尝试了不同的 Magnetic-One 配置,“使用 OpenAI 01-preview 用于协调器的外部循环和编码器,而其他智能体继续使用 GPT-4o”。
随着越来越多的部署智能体的选项出现,从现成的智能体库到可定制的组织特定智能体,智能体系统正变得越来越流行。微软在 10 月份宣布了其针对 Dynamics 365 平台的 AI 智能体套件。
科技公司现在开始在 AI 编排框架上展开竞争,特别是那些管理智能体工作流程的系统。OpenAI 发布了其 Swarm 框架,该框架为开发人员提供了一种简单而灵活的方式,允许智能体指导智能体协作。CrewAI 的多智能体构建器也提供了一种管理智能体的方式。与此同时,大多数企业一直依赖 LangChain 来帮助构建智能体框架。
然而,企业中的 AI 智能体部署仍处于早期阶段,因此确定最佳的多智能体框架将是一个持续的实验。大多数 AI 智能体仍然在自己的游乐场中玩耍,而不是与来自其他系统的智能体进行交流。随着越来越多的企业开始使用 AI 智能体,管理这种扩展并确保 AI 智能体能够无缝地将工作传递给彼此以完成任务变得更加重要。