ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

悦数Graph RAG:领跑向量与图数据库融合新赛道

时间:2025-02-13 07:52:47来源:雷峰网leiphone编辑:快讯团队

在数据库技术的浩瀚星空中,向量数据库近年来犹如一颗璀璨新星,迅速吸引了业界的广泛关注。其核心优势在于高效检索高维向量数据,这对于大型模型的训练和推理而言,无疑是一项至关重要的技术突破。特别是在2023年,随着大模型的蓬勃发展,向量检索技术,特别是作为检索增强生成(RAG)技术的重要组成部分,更是被推到了数据库技术的风口浪尖。

然而,正如所有新兴技术一样,RAG技术也面临着其固有的局限性。它虽然能够将知识本身进行向量化处理,但在理解和呈现独立信息之间的链接方面却显得力不从心。换句话说,RAG技术难以结合关系和语境,处理那些需要更深层次语义关系和上下文细微差别的复杂查询。这一缺陷,无疑限制了RAG技术的进一步发展和应用。

面对这一困境,杭州悦数科技有限公司(以下简称悦数)的CTO叶小萌带领团队,在2023年与LlamaIndex携手,提出了Graph RAG的设想,并迅速分享了这一概念的初步验证结果。Graph RAG结合了图数据库的优势,通过知识图谱能够更精确、全面地检索相关信息,使模型能够关联上下文给出答复。这一创新性的想法,虽然起初在国内并未引起太多关注,但悦数团队并未因此气馁,而是持续推动其落地。

叶小萌表示,悦数一直致力于技术创新,以技术为核心竞争力。在大模型兴起的背景下,悦数敏锐地捕捉到了RAG技术的潜力,但同时也看到了其局限性。因此,悦数团队决定结合图数据库的优势,打造一款全新的RAG产品。这一决定,不仅体现了悦数对技术趋势的敏锐洞察,更展现了其敢于创新、勇于挑战的精神。

经过一年的努力,悦数RAG产品终于面世。这款产品实现了基于图的检索增强生成,能够帮助企业有效应对知识孤岛问题。与此同时,微软也在去年7月2日开源了Graph RAG研究项目,使得这一概念真正受到了大众的广泛关注。然而,值得注意的是,悦数提出Graph RAG概念的时间要早于微软。这一事实,无疑进一步证明了悦数在技术创新方面的领先地位。

在悦数RAG产品的研发过程中,团队遇到了诸多挑战。由于这是一个全新的领域,没有现成的经验和方案可供借鉴,因此团队只能摸着石头过河。叶小萌回忆道,在研发初期,团队规模有限,上层RAG团队甚至只有一个人——古思为。然而,正是凭借着对技术的热爱和执着追求,古思为带领团队克服了一个又一个困难,最终成功推出了悦数RAG产品。

除了技术创新之外,悦数还积极参与国际标准制定工作。在国际标准化组织(ISO)发布的国际标准图查询语言GQL的制定过程中,悦数一直跟踪投入研发。在GQL标准发布后的同年11月,悦数推出了全球首款原生支持GQL的分布式图数据库产品——悦数图数据库v5.0。这一举措,不仅进一步巩固了悦数在图数据库领域的领先地位,也为其未来的发展奠定了坚实的基础。

在信创领域,悦数同样表现出色。叶小萌认为,信创的核心在于自主可控。悦数图数据库的每一行代码都是团队亲手写下,拥有自主知识产权和代码自主权。因此,悦数具备成为信创品牌的良好土壤。虽然目前图数据库尚未被收录在信创名录之中,但悦数已经在积极适配各种信创操作系统和硬件,为进入信创名录做好充分准备。

悦数的客户群体中,有一半以上都有信创需求。叶小萌观察到,目前愿意出高价购买产品的企业,大多是国央企或具有国资背景的企业。因此,在政企领域的客户竞争中,悦数面临着激烈的竞争。然而,悦数始终坚持避免卷入价格战,而是专注于提升产品质量和技术水平。叶小萌相信,只有真正有价值的产品才能得到客户的认可和信赖。

回顾悦数的发展历程,叶小萌感慨万分。他从2010年进入Facebook开始接触图数据库领域,到如今带领悦数团队在图数据库领域不断创新和突破,经历了无数的挑战和困难。然而,正是凭借着对技术的热爱和执着追求,悦数团队才能够在激烈的市场竞争中脱颖而出,成为图数据库领域的佼佼者。


更多热门内容