Kimi-Researcher–Kimi推出的深度研究Agent模型

Kimi-Researcher是什么

Kimi-Researcher 是月之暗面旗下的 Kimi 推出的基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代 Agent 模型,专为深度研究任务而设计。能自主规划任务执行流程,通过澄清问题、深入推理、主动搜索和调用工具等步骤,最终交付高质量的研究成果。

Kimi-Researcher 的核心能力包括:主动反问以构建清晰问题空间、平均 23 步推理以深入思考、通过 74 个关键词和 206 个网址筛选出高质量信息,调用工具处理原始数据并生成分析结论。能输出万字以上的深度研究报告,引用约 26 个高质量信源,生成可交互的动态可视化报告,方便用户快速把握核心结论。

Kimi-Researcher

Kimi-Researcher的主要功能

  • 澄清问题:通过主动反问,帮助用户构建更清晰的问题空间。
  • 深入推理:每个任务平均进行 23 步推理,自主梳理并解决需求。
  • 主动搜索:平均规划 74 个关键词,筛选出信息质量最高的前 3.2% 内容。
  • 调用工具:自主调用浏览器、代码等工具,处理原始数据并生成分析结论。
  • 生成深度研究报告:输出万字以上、引用约 26 个高质量信源的报告,所有引用可溯源。
  • 动态可视化报告:提供结构化排版和思维导图,便于快速把握核心结论。
  • 异步执行:采用异步方式,确保输出质量和信息覆盖度。

Kimi-Researcher的技术原理

  • 端到端自主强化学习:Kimi-Researcher 采用端到端的强化学习方法,模型在训练过程中自主试错,将整个任务视为一个整体进行学习。模型能应对复杂的推理、工具切换和环境变化,无需依赖预设的流程或人类设计的提示词。
  • 零结构设计:Kimi-Researcher 是零结构 Agent,没有复杂的提示词或预设流程。模型在训练中自行形成推理模式,所有策略、路径和判断都是通过反复试错自然形成的。
  • 结果驱动的强化学习算法:模型的唯一驱动力是任务是否被真正解决。只有在任务完成并得到正确结果时,模型才会获得奖励。确保了模型在面对复杂任务时能自主优化其行为。
  • 轻量化长时记忆机制:Kimi-Researcher 没有固定的记忆模块,是自主决定哪些信息值得记住以及如何在推理中调用这些信息。使模型能高效地处理长序列任务。
  • 面向 Agent 的训练基础设施:Kimi-Researcher 的训练基础设施支持异步执行和灵活接口,通过“分步回滚”等机制优化长序列任务的学习效率。
  • 多模态能力与长思维链推理:Kimi-Researcher 的技术框架还涉及多模态能力的提升,通过联合文本和视觉数据的训练,增强模型在多模态任务中的表现。通过长思维链推理训练,模型能处理复杂的逻辑推理任务。

Kimi-Researcher的项目地址

  • 技术论文:https://moonshotai.github.io/Kimi-Researcher/

如何使用Kimi-Researcher

  • 访问入口:访问 Kimi 官方网站,或者在微信小程序中搜索“Kimi 智能助手”。
  • 申请内测:或点击申请内测权限,提供需要让 Kimi-Researcher 帮你研究的问题。
  • 使用功能
    • 深度研究:Kimi-Researcher 会自主规划任务执行流程,包括澄清问题、深入推理、主动搜索和调用工具,最终生成深度研究报告。(每月 20 次额度,同时支持 1 条任务并发)
    • 动态可视化报告:生成结构化排版的可视化报告,方便快速把握核心结论。
    • 联网搜索:Kimi-Researcher 可以联网搜索最新信息,整合并总结相关内容。
  • 输入问题或指令:在对话框中输入你的问题或具体需求,Kimi-Researcher 会根据你的指令进行深度研究。
  • 上传文件:支持上传多种格式的文件(如 PDF、Word、Excel、PPT、TXT 等),最多可上传 50 个文件,每个文件不超过 100M。
  • 指定任务:明确告诉 Kimi-Researcher 你需要的操作,比如提取关键内容、总结、翻译等。
  • 使用技巧
    • “继续”功能:在处理长篇内容时,点击“继续”按钮,确保模型保持思路连贯。
    • 常用语功能:设置常用语或快捷指令,快速触发特定任务。
    • 角色扮演:让 Kimi-Researcher 扮演特定角色(如面试官、专家等),帮助完成特定任务。
  • 验证与校验:对于 Kimi-Researcher 提供的分析或结论,建议结合自身专业知识进行判断和核实,确保结果的准确性。

Kimi-Researcher的基准测试

  • “人类最后一次考试”(Humanity’s Last Exam, HLE)
    • Pass@1 准确率:26.9%
    • Pass@4 准确率:40.17%
    • 这一表现超过了 Claude 4 Opus(10.7%)、Gemini 2.5 Pro(21.6%),略高于 OpenAI Deep Research(26.6%),与 Gemini-Pro 的 Deep Research Agent(26.9%)打平。
  • 红杉中国 xbench 基准测试在 DeepSearch 任务中,Kimi-Researcher 的平均通过率达到了 69%,领先于该榜单中的其他模型。

Kimi-Researcher的应用场景

  • 实时研究支持:用户可以询问最新的研究进展,Kimi会搜索并提供相关论文、数据和分析报告。
  • 市场趋势分析:分析市场趋势、消费者行为和竞争对手策略,提供详尽的市场分析报告。
  • 教案编写:教师可以用 Kimi-Researcher 编写教案,生成完整的教学结构。
  • 法律政务场景:自动识别风险条款并生成修订建议。证据链自动梳理与法律条文匹配,生成带法律依据的案情摘要报告。

相关文章