# 双曲RAG框架:从表示空间几何特性重构检索增强生成流程

发布时间:2026/7/5 13:59:37
# 双曲RAG框架:从表示空间几何特性重构检索增强生成流程 引言:当RAG撞上几何的天花板检索增强生成(RAG)已经成为大模型落地的标准配置——根据百度开发者中心2026年5月的技术分析,当前超过70%的企业级AI应用已经在生产环境中部署了某种形式的RAG方案。然而,一个越来越被广泛认知的问题是:为什么明明相关文档就在知识库里,检索环节却总是找不到?2026年上半年,这个问题迎来了一个从几何底层出发的系统性回答。中国科学院软件研究所在2026年6月被数据挖掘顶会ACM SIGKDD 2026接收的论文中,提出了HyRAG(Hyperbolic Retrieval-Augmented Generation)框架,首次系统性地从表示空间的几何特性出发重构RAG流程。几乎同期,耶鲁大学、香港科技大学(广州)联合NetApp团队在ICML 2026上发表了HypRAG,实现了全链路双曲密集检索。这两篇工作的核心洞察惊人一致:RAG检索失真的根源,不在模型规模,而在几何空间的选择。本文将从几何视角出发,系统拆解双曲RAG框架的技术原理、架构设计、工程实践与安全考量,帮助读者理解这一正在重塑RAG底层逻辑的新范式。一、问题:欧氏空间为什么装不下语言的层级结构?1.1 一个被忽视的几何缺陷传统RAG系统的工作流程高度标准化:将文档切块,用嵌入模型编码为稠密向量,在欧氏向量空间中做最近邻检索,最后将检索