Qwen3Reranker–阿里通义开源的文本重排序模型

Qwen3 Reranker是什么

Qwen3 Reranker是阿里巴巴通义千问团队发布的文本重排序模型,属于Qwen3模型家族。采用单塔交叉编码器架构,输入文本对后输出相关性得分。模型通过多阶段训练范式,基于高质量标注数据和大量合成训练对进行训练,支持超过100种语言,涵盖主流自然语言及多种编程语言。性能表现上,Qwen3 Reranker-8B在MTEB排行榜上取得了72.94的高分,Qwen3 Reranker-0.6B也已超越Jina和BGE Rerankers。

Qwen3 Reranker的主要功能

  • 文本相关性评估:Qwen3 Reranker可以接收用户查询和候选文档等文本对作为输入。模型会计算并输出两个文本之间的相关性得分,得分越高表示文本对之间的相关性越强。
  • 文本重排序:根据相关性得分,Qwen3 Reranker能对候选文本进行排序,将与用户查询最相关的文本排在前面。
  • 优化检索结果:在语义检索场景中,该功能可帮助用户更快地找到最相关的信息,提高检索效率和准确性。
  • 支持多种语言:Qwen3 Reranker支持超过100种语言,包括主流自然语言和多种编程语言。

Qwen3 Reranker的技术原理

  • 单塔交叉编码器架构:Qwen3 Reranker采用单塔交叉编码器架构,将查询和候选文档拼接后共同输入模型。架构可以同时处理文本对,进行深度交互分析,更准确地评估文本对之间的相关性。
  • 指令感知能力:模型支持通过指令动态定义任务目标,例如“判断法律文档相关性”,使模型能根据不同任务和场景灵活调整相关性评估标准。
  • 输入输出格式:输入格式为特定的聊天模板,包含指令、查询和文档。模型输出为相关性得分,通过计算“是”或“否”的概率来确定。
  • 多阶段训练范式:Qwen3 Reranker的训练过程包括多个阶段。在监督微调阶段,直接使用高质量标注数据进行训练,提升训练效率。会利用合成数据进一步提升模型性能。
  • 高质量数据筛选:在训练数据的选择上,Qwen3 Reranker使用了多种高质量标注数据集,如MS MARCO、NQ、HotpotQA等。通过余弦相似度筛选出高质量的合成数据对。
  • 模型融合技术:采用球面线性插值(SLERP)技术对微调阶段保存的多个模型检查点进行参数融合。能更好地保留模型参数的几何特性,提高模型在不同数据分布中的鲁棒性和泛化性能。
  • 监督微调损失(SFT Loss):Qwen3 Reranker优化的是监督微调损失函数,通过最大化正确标签(“yes”或“no”)的概率,模型学习区分相关和无关文档。这种二分类方式简化了重排序任务,基于Qwen3模型的指令跟随能力。

Qwen3 Reranker的项目地址

  • HuggingFace模型库:https://huggingface.co/collections/Qwen/qwen3-reranker

Qwen3 Reranker的应用场景

  • 语义检索:在搜索引擎、问答系统等场景中,对检索结果进行重排序,使最相关的内容优先展示。
  • 文本分类:通过评估文本与类别标签的相关性,辅助进行文本分类任务,提高分类精度。
  • 情感分析:在情感分析中,对评论或文本与情感标签的相关性进行排序,辅助情感倾向判断。
  • 代码搜索:在代码库中,对代码片段与用户查询的相关性进行排序,帮助开发者快速找到相关代码。

相关文章