赛题解析|大模型驱动多粒度知识统一抽取的技术剖析与军事应用实践

2026-01-06


多粒度知识统一抽取技术作为大模型落地军事场景的关键桥梁,通过融合监督微调(SFT)与检索增强生成(RAG)的混合架构,实现了精度与召回率的协同优化。


其技术优势体现在突破单一模型局限,构建多模型融合体系,提升对高噪声、多语种、细粒度情报的适应性,赋能作战决策、情报研判和模拟推演,形成从数据抽取到智能决策的闭环,为军事智能化提供核心驱动力。


在近日闭幕的2025全国大数据与计算智能挑战赛中,渊亭科技“渊行者”团队凭借SFT-RAG混合驱动知识抽取方案,在“大模型驱动多粒度知识抽取”赛题中荣获一等奖。该方案的核心价值在于其出色的可迁移性,能够直接应用于军事场景,为作战辅助AI决策、交互式情报研判等关键系统提供了坚实的技术底座。


本文将对本次比赛技术方案进行深度解析,阐述其如何与军事大模型、RAG(检索增强生成)及多智能体技术融合,切实推动军事智能化的实践进程。






团队的设计理念源于“SFT保精度,RAG扩召回”的算法策略,构建了监督微调(SFT)与检索增强生成(RAG)并行的混合驱动架构。


该系统针对每个测试样本同时发起SFT和RAG抽取任务,最终通过融合模块汇聚结果,实现优势互补。


图-技术Pipeline


流程概述>>


🔹准备阶段:

包括SFT监督微调和RAG索引构建。SFT部分构建多模型训练体系(Qwen3-4B、Qwen2.5-7B、Llama3.1-8B),结构互补以减少单一模型偏差;训练策略采用全参数微调+FP8混合精度优化。RAG部分构建FewShot示例向量库、粗细粒度映射表以及EntitySchema向量库(支持中英文),用于后续的两阶段推理。


🔹推理阶段:

输入测试数据并行分发至SFTGroup和RAGGroup。SFT流水线执行多模型推理、多样化采样和投票机制,输出高精准率三元组。RAG流水线采用两阶段知识抽取,输出高召回率三元组。


🔹融合输出:

结果合并后经过合法性校验,生成最终输出。


这种架构的优势在于,SFT通过全参数微调确保核心指标的稳定性,而RAG借助检索机制拓展系统边界,有效平衡了精度与召回率。


在比赛测试中(14115条测试集数据),该方案将F1分数从单模型的0.4636提升至0.5601,证明了其鲁棒性






SFT模块是方案的主干,旨在通过全参数微调确保高精确度。其训练及推理流程分为模型训练优化与实际推理应用两大阶段。


图-大模型训练过程


训练优化闭环>>


🔹数据输入TRAIN/DEV数据集后,经提示词设计、指令数据生成、数据清洗和校验转化为微调格式。


🔹多模型并行微调针对Qwen3-4B-Base、Qwen2.5-7B和Llama3.1-8B-Base进行,底层由FP8训练引擎驱动,结合BF16(主计算)和FP8(权重存储)的精度管理,动态执行损失检查与检查点选择。


🔹模型评估基于准确率、召回率和F1值,形成优化迭代闭环,最终筛选出最优抽取模型。在推理阶段,系统引入多模型融合与投票机制,进一步提升鲁棒性。


图-多模型融合推理过程


推理创新点>>


🔹多样化采样:每个微调模型进行N次独立采样,产生3N个候选结果。


🔹加权投票机制:使用算法,其中权重基于模型验证集性能调整,确保高置信度输出。


🔹过滤不合格样本:通过规则约束剔除不可靠预测。


多模型体系(Qwen3-4B轻量快速、Qwen2.5-7B中文理解强、Llama3.1-8B英文泛化好)有效降低了单一模型偏差,为军事场景中的多语言情报处理奠定了基础。





RAG模块针对SFT在未见领域泛化能力不足的问题,通过两段式知识抽取提升召回率


团队分析发现,测试集中来自CMeIE的医学数据未出现在训练集中,因此启用RAG流水线增强泛化能力。RAG使用Qwen3-4B作为大模型,bge-m3作为嵌入模型。


准备阶段:索引建库>>


🔹FewShot示例向量库:从训练数据构建,用于第一阶段实体、关系、粗粒度类型检索相似上下文示例。


🔹粗细粒度映射表:构建粗粒度到细粒度的映射字典,用于第二阶段细粒度类型判断。


🔹EntitySchema向量库:针对粗细粒度不匹配时的回退处理重选择机制。


推理阶段:两段式抽取>>


🔹第一阶段:

实体、关系、粗粒度三元组抽取。根据输入句子从FewShot库检索相似示例,采用混合检索模式(稠密向量、稀疏向量和全文检索),输出包含主语、关系、宾语的三元组。


🔹第二阶段:

细粒度类型抽取。遍历第一阶段实体,判断细粒度类型,并基于LLM区分处理机制。若不匹配,则回退至EntitySchema向量库重新选取类型。


这种分层策略的优势在于,即使模型未接触过特定领域实体,也能借助上下文和定义实现准确抽取。


图-两段式抽取部分环节





融合模块采用基准确立(优先SFT结果)、增量补充(补充RAG独有三元组)和去重机制(基于五元组匹配),并结合类型约束与关系约束进行合法性校验。


这一过程确保了输出结果既高精度又高召回,为军事应用中的数据一致性提供了保障。





基于SFT-RAG混合驱动知识抽取技术,我们已在多个军事关键场景实现深度应用,形成了一套完整的智能化军事产品技术体系。



该系统将多粒度知识抽取的技术核心迁移迭代到军事决策场景,实现了从"数据抽取"到"决策建议"的闭环。


🔹多源情报融合处理:

系统接入情报融合系统、侦察报告等多模态数据,利用SFT模块的Qwen2.5-7B模型(中文理解优势)处理文本情报,Llama3.1-8B模型(英文泛化优势)解析外军资料,实现多语言情报的精准抽取。


🔹实时态势构建:

通过RAG两段式抽取技术,第一阶段快速识别敌我兵力、装备、位置等粗粒度要素,第二阶段结合军事知识图谱进行细粒度类型判定(如具体装备型号、战术编成)。


🔹智能推理预警:

基于多模型投票机制,对抽取的战术要素进行置信度评估,当识别到"某区域出现防空导弹阵地+电子战部队集结"等关键模式时,系统自动生成战术预警。


图-智能电子干扰目标分配





该平台将知识抽取技术与可视化研判深度结合,为情报分析人员提供直观高效的工作环境。


图-智能蓝军情报挖掘融合


技术创新亮点有:


🔹动态知识图谱构建:

基于FP8优化训练的大模型,能够实时从海量开源情报中抽取实体关系,自动构建和更新军事知识图谱。


🔹智能问答交互:

结合RAG检索增强技术,支持自然语言查询,如"展示某海域近期舰艇活动轨迹",系统自动关联相关情报片段生成可视化报告


🔹多维度关联分析:

利用粗细粒度映射技术,实现从战术单位到战役军团的层级关联分析,揭示深层次作战规律。





这一系统将知识抽取技术应用于模拟训练领域,构建了逼真的蓝军知识体系。


图-蓝军知识体系构建


技术特色优势在于:


🔹战术知识自动化抽取:

通过SFT-RAG混合架构,从外军条令、战史战例、装备手册等非结构化文本中自动抽取战术知识。


🔹动态行为建模:

基于抽取的战术知识,结合多智能体技术构建蓝军行为模型,实现智能决策和自适应对抗


🔹战法创新支持:

系统能够发现传统分析难以察觉的战术规律,为新战法研究提供数据支撑





本方案的核心技术优势在于:


🔹SFT-RAG双线并行:通过精度与召回的协同优化,适应军事场景中高噪声、多粒度的数据特性。


🔹多模型融合与FP8优化:在有限算力下实现高效训练,支撑实时决策需求。


🔹两段式知识抽取:提升对未知领域的情报适应力,如处理新型装备或战术术语。


🔹知识图谱与多智能体集成:将抽取结果转化为可推理的知识,增强系统智能性。


在军事实践中,该技术有效解决了传统方法难以兼顾精度与泛化的痛点,直接赋能于战场态势感知、辅助决策和模拟推演,体现了“技术驱动战斗力生成”的核心理念。





基于本次技术突破,渊亭科技将持续推进核心产品的落地,扩大技术红利:



作为2026年即将推出的核心产品,本产品将深度融合军事大模型知识抽取、多智能体协同与知识图谱增强生成技术


平台能够快速完成从任务受领到作战行动序列(COA)的自动化生成与模拟执行,支持陆、海、空、网等多域作战数据协同分析。其创新点在于将抽取-研判-决策闭环能力实战化,通过动态环境适配与实时推演,大幅提升作战规划效率与准确性。





KGAG平台将多粒度知识抽取技术进阶为知识图谱的实时构建与增强生成能力。系统基于SFT-RAG混合架构,实现从多源情报中自动抽取实体关系,并通过图谱推理生成战术洞察,支持动态威胁关联与策略推荐,为指挥决策提供深层知识支撑。





CMAS平台聚焦多智能体协同场景,将知识抽取结果转化为智能体行为模型。平台通过分布式智能体协作,实现大规模战场元素的并行分析与决策模拟,特别适用于复杂环境下的战术推演与效果评估,提升体系作战能力。




渊行者团队的SFT-RAG混合驱动知识抽取方案,不仅在军事技术竞赛中荣获冠军,更通过军事场景的实践验证,展现了人工智能技术在国防领域的巨大潜力。


其多粒度、高鲁棒的技术内核,正成为构建作战辅助AI决策助手、交互式情报研判平台等智能系统的核心引擎。随着技术产品化进程的加速,这套体系将持续为军事革新注入智能动力,助力智慧国防建设迈上新台阶。

关键字:
大模型
辅助决策
多粒度知识抽取