MAS-Zero–Salesforce推出的多智能体系统设计框架

MAS-Zero是什么

MAS-Zero是 Salesforce 推出的多智能体系统(MAS)设计框架,能在无需人类监督的情况下自动设计和优化MAS。框架基于元级设计,在推理时动态地对每个问题实例生成、评估和改进MAS配置。MAS-Zero的核心在于元迭代过程,包括任务分解、生成对应的MAS实现及基于可解性和完整性的元级反馈。基于自验证从所有候选解决方案中选择最合适的结果。MAS-Zero在数学推理、研究生水平问答和代码基准测试中表现出色,且不依赖任何外部监督。

MAS-Zero

MAS-Zero的主要功能

  • 自动设计多智能体系统(MAS):无需人类手动设计智能体角色和通信协议,根据具体问题自动生成适合的MAS结构,提高系统对新任务的适应性和性能。
  • 动态适应问题:在推理阶段针对每个问题实例进行动态的智能体组合和问题分解,让MAS更好地应对复杂多变的任务。
  • 无需验证集监督:不依赖于预先标注的验证集调整和优化MAS配置,降低对数据的需求,提高系统的灵活性和实用性。
  • 性能优化:基于元级设计和自验证机制,不断迭代改进MAS设计,提升系统在复杂任务上的准确率和效率,保持成本效益。
  • 自进化能力:在推理过程中,jiyu 自我反馈和评估,自动学习和进化,逐步优化MAS的设计和性能,无需外部监督信号。

MAS-Zero的技术原理

  • 元迭代(Meta-Iterations)
    • 任务分解与MAS生成:将复杂问题分解为多个子任务,为每个子任务生成对应的MAS实现(用可执行代码形式)。将MAS设计视为代码生成问题,基于元代理(meta-agent)动态地调整任务分解和MAS配置。
    • 元级反馈:评估生成的MAS设计的可解性和完整性,基于执行MAS代码获取中间输出,分析输出判断当前MAS是否能有效解决问题。根据评估结果生成反馈,指导后续的迭代改进。
  • 自验证(Self-Verification):在多次元迭代后,从所有候选解决方案中选择最合适的结果。对比不同迭代产生的候选答案,结合一定的验证策略(如多数投票、排除无效答案等),确定最终的输出答案。
  • 基于LLM的元代理:基于大型语言模型(LLM)作为元代理,赋予理解和生成自然语言指令的能力。元代理在元迭代过程中负责任务分解、MAS生成、反馈生成及最终结果的验证,与LLM的交互实现对MAS设计的优化和改进。
  • 自我监督学习:整个过程不依赖外部验证集或人类监督,基于系统自身的执行结果和反馈信号进行自我监督学习。元代理根据中间输出的可解性和完整性来调整MAS设计,逐步提高系统的性能和适应性。

MAS-Zero的项目地址

  • 项目官网:https://mas-design.github.io/
  • GitHub仓库:https://github.com/SalesforceAIResearch/MAS-Zero
  • arXiv技术论文:https://arxiv.org/pdf/2505.14996

MAS-Zero的应用场景

  • 复杂问题求解:在数学、科学计算等领域,将复杂问题分解为多个子任务,提高求解效率和准确性。
  • 自然语言处理:用在高级问答系统和文本生成编辑,生成高质量的自然语言处理结果。
  • 软件工程:在代码生成、优化和软件测试中,将任务分解为多个子任务,提高软件开发和测试的效率与质量。
  • 医疗健康:应用在疾病诊断和治疗方案制定,提高医疗决策的准确性和个性化水平。
  • 教育领域:用在个性化学习和智能辅导,根据学生需求分解学习任务,由不同智能体提供定制化的学习路径和辅导内容,提升学习效果。

相关文章