ST-Raptor是什么
ST-Raptor 是用在半结构化表格问答的工具,仅需一个 Excel 格式的表格和一个自然语言问题作为输入,能产生精确的答案。工具能处理多种半结构化表格布局,结合视觉语言模型和树构建算法,能灵活集成不同的大型语言模型。ST-Raptor 有两阶段验证机制,确保结果可靠。ST-Raptor 提供包含 102 个表格和 764 个问题的 SSTQA 基准测试,用在评估其性能。

ST-Raptor的主要功能
-
精确问答:仅需输入Excel格式的表格和自然语言问题,能生成精确答案。
-
多样化表格支持:支持多种半结构化表格布局,如个人信息表、学术表格、财务表格等。
-
多格式输入:支持从Excel、HTML、Markdown、CSV等多种格式输入表格。
-
无需微调:无需对模型进行额外的微调即可使用。
ST-Raptor的技术原理
-
视觉语言模型(VLM):结合视觉语言模型,能理解和处理表格中的视觉信息。
-
树构建算法(HO-Tree):通过树构建算法对表格结构进行分析和理解,提高对复杂表格的处理能力。
-
灵活集成大型语言模型(LLM):支持灵活集成不同的大型语言模型,如Deepseek-V3、GPT-4o等,提升问答性能。
-
两阶段验证机制:通过两阶段验证机制,确保生成的答案准确可靠,避免错误答案的产生。
ST-Raptor的项目地址
- GitHub仓库:https://github.com/weAIDB/ST-Raptor
ST-Raptor的应用场景
-
企业财务管理:财务人员输入预算表,能快速获取答案,助力财务成本控制。
-
学术研究数据管理:科研人员输入实验数据表,能查询特定结果,加速研究进程。
-
人力资源管理:HR输入绩效表,能查询员工绩效,为管理决策提供支持。
-
金融风险评估:分析师输入风险数据表,能识别高风险客户,降低信贷风险。
-
物流供应链管理:管理人员输入物流订单表,能查询库存和运输情况,优化供应链。