首批!渊亭科技「大模型检索增强生成平台」通过信通院评估

2024-06-18

近日,在中国信通院组织的首轮检索增强生成评估中,渊亭科技「大模型检索增强生成平台」顺利完成了相关评估,获得4+级证书(当前最高评级),成为全国首批通过检索增强生成评估的企业。

本次检索增强生成评估依据《检索增强生成技术要求与评估方法》标准,共涉及2个能力域、6个能力子域、20余个能力项。评估重点关注知识接入能力的增强、检索质量的提升、生成答案的相关性加强、优化技术的运用及实施,以及应用成熟度应用稳定性的提高等维度的测评。此次率先通过评测,标志着渊亭科技技术研发实力、产品综合性能等达到行业领先水平。

​中国信通院检索增强生成评估范围

随着大模型技术飞速发展,其浪潮已席卷千行百业,尤其在金融服务、政务咨询、学术科研、行业智库等知识密集型领域得到了广泛运用。但在实际业务中,大模型在准确性、稳定性等问题上仍表现出一些不足。RAG(检索增强生成)技术在此背景下应运而生,成为大模型落地应用的重要范式之一。

渊亭科技基于多年自主研发和项目落地经验,顺利推出「大模型检索增强生成平台」。该平台可以帮助企业安全高效地构建、部署、应用RAG系统,实现更加便捷、精准的智能对话,进而提高业务决策效率和质量。

在实际应用中,平台通过领先的处理技术(如问题重构、扩写和拆分等),结合独创的搜索算法,能够深度理解、分析用户的查询意图。在信息整合阶段,平台会高效整合多源异构数据与互联网资源,对信息进行合理的分类、排序和编排,确保用户获取的结果具有强大的逻辑性和高度的相关性。

​渊亭科技「大模型检索增强生成平台」界面

渊亭科技自研的「大模型检索增强生成平台」具有强大的知识库构建体系,能够进行多维度的检索优化和持续表征优化,可有效增强生成模型的内容输出,提高生成文本的准确性、丰富性和相关性。

1、强大的知识库构建体系

平台整合了多样化的数据源,采用灵活的数据分段策略,支持静态与动态数据表征的嵌入模型。支持多种索引技术,包括分层索引和倒排索引,动态更新知识库,通过反馈数据微调嵌入模型,不断迭代优化,提升检索质量。

2、多维度检索优化

平台可基于已知的知识脉络对问题进行扩展、重写、拆分等操作,结合全文检索、关键词检索、实体检索、向量检索等多种方法,实现多维度数据检索。平台会对检索结果进行智能重排序,优先展示最相关的内容,融合并对齐多源检索结果,给出最佳检索结果。平台还能通过幻觉检测和错误信息筛查,修正内容,输出精准结果,确保信息的准确性和可信度。

3、持续表征优化

平台支持对回流数据整理成训练集,对词嵌入模型进行微调,可以通过调整超参数来实现更大的多样性,以某种形式限制输出词汇表,通过调节解码器的温度来平衡结果的多样性和质量。

作为一个基于检索增强生成技术的智能平台,渊亭科技「大模型检索增强生成平台」能显著提升搜索的精准度和个性化水平,在情报研究等领域具有较大潜力和广阔前景。

​渊亭科技「检索增强生成平台」亮相2024北京军博会,吸引广大客户体验使用

2024年北京军博会期间,渊亭科技曾在活动现场开放无人主题的「大模型军研Copilot」产品体验,展现了「大模型检索增强生成平台」在国防军事领域应用的典型场景,获得客户广泛关注和认可。

此外,「大模型检索增强生成平台」在学术研究智慧政务金融服务教育科学等领域亦具备广泛的应用价值。

渊亭科技「大模型检索增强生成平台」区别于传统搜索引擎的检索和呈现模式,进行了对话式搜索和生成模式的有力探索,在落地应用上具有强劲潜力。

未来,渊亭科技将持续优化技术支持体系,完善产品性能指标,带来更高水准的产品和解决方案,促进大模型在各行业、各企业落地的灵活性和应用范围。

关键字:
渊亭产品评测