11月18日,OceanBase正式发布并开源其首款AI数据库OceanBase seekdb(简称seekdb),标志着数据库领域向AI原生时代迈出关键一步。这款产品通过深度融合AI推理与数据处理能力,支持向量、全文、标量及空间地理数据的统一混合搜索,开发者仅需三行代码即可快速构建知识库、智能体等应用,轻松应对百亿级多模数据检索需求,真正实现“开箱即用”的AI数据基座。
OceanBase CEO杨冰在接受采访时表示,seekdb并非传统数据库的功能叠加,而是专为AI时代重构的AI原生数据库。它继承了OceanBase的分布式架构与高可用设计理念,同时更轻量、更敏捷,目标成为大模型与私有数据融合计算的“实时入口层”。据Gartner预测,到2028年,支持生成式AI的数据库支出将达2180亿美元,占市场74%,但MIT研究显示,超95%的企业AI项目因多模态数据割裂、系统链路冗长、权限管理复杂而难以落地。seekdb的推出,正是为了解决这些核心痛点。
seekdb的核心突破体现在三大方面:首先,其AI原生混合搜索能力支持在一个查询中融合向量检索、全文搜索与标量过滤,采用“粗排+精排”多阶段检索机制,在低延迟的同时提升精度。依托成熟的事务引擎,它支持实时写入与ACID一致性,并兼容MySQL生态,可统一存储与检索标量、向量、文本、JSON和GIS等多模数据。例如,在反欺诈场景中,可直接查询“近7天交易超5万元、位置异常且行为类似历史欺诈样本”的复合条件,无需跨系统调用,兼顾性能与安全。
其次,seekdb的极简部署特性大幅降低了AI应用的工程门槛。产品最低仅需1核CPU、2GB内存,支持pip install一键安装、秒级启动,兼容嵌入式与客户端/服务器双部署模式,可轻松集成至智能Agent、开发工具链或本地应用。seekdb以Apache 2.0协议全球开源,开发者可自由使用、修改和扩展,全面兼容HuggingFace、Dify、LangChain等30余种AI框架及MCP大模型协议,并提供SQL及Python SDK,适配不同开发习惯。同期开源的PowerRAG智能文档解析框架与PowerMem分层记忆架构,后者在LOCOMO Benchmark上以73.70分登顶SOTA,Token消耗降低96%,显著节省推理成本。
作为OceanBase“Data×AI”战略的关键一环,seekdb既可独立使用,也可平滑融入新发布的OceanBase 4.4一体化融合版本。该版本首次将TP(事务处理)、AP(分析处理)与AI能力集成于单一内核,兼具分布式扩展、多云部署与金融级高可用特性,帮助企业避免后期架构重构风险。商用LTS版本将于2026年2月2日推出,进一步满足企业级需求。
目前,OceanBase的混合搜索能力已在多个行业成功落地。中国联通基于该技术构建统一AI知识库,有效解决了私有文档的权限管理与高效检索难题;蚂蚁百宝箱则通过实时在线搜索功能,显著提升了智能体信息获取的精准性与响应效率。杨冰强调:“传统数据库只‘存’数据,而seekdb能‘理解’数据语义,混合搜索正是AI原生数据库的关键分水岭。”过去十五年,OceanBase在“双11”等极限场景锤炼出的工程化能力,正转化为AI时代的底层优势,持续在多模融合、TP/AP/AI一体化、多云原生等方向突破。
自2010年起步、2020年开启商业化以来,OceanBase已交出一份亮眼成绩单。杨冰透露,全球客户数已突破4000家,连续五年年均增速超100%,技术深入金融、政务、通信、零售、制造、互联网等十余领域,服务覆盖16个国家和地区、60多个地域、240多个可用区。这一增长源于“专有云+公有云”双轮驱动,更根植于15年技术深耕与工程化能力实践。“我们的目标始终明确,打造一款世界级数据库,不仅要技术领先,更要赢得全球主流市场和顶级客户的信赖。”杨冰表示。
随着seekdb的开源与新域名的启用,OceanBase正加速推动行业迈向“智能原生”架构。杨冰指出,未来数据库必须同时服务“人”与“智能体”,在一个数据库中支撑事务、分析与AI混合搜索,在数据源头驱动实时、可信的智能。全球开发者现已可通过GitHub免费下载使用seekdb,这一举措不仅为全球智能化转型提供了更普惠、可落地的数据底座,也标志着OceanBase在迈向世界级数据库的道路上迈出坚实一步。




