零门槛数据库:OceanBase seekdb D0 为 AI Agent 而生
Agent 应用正在爆发可以写代码、做分析、搭应用——但它做不了一件事注册一个数据库账号。这不是玩笑。我们的 AI 架构师在客户交流中反复听到同一个故事让 Agent 帮忙搭原型应用30 秒写完代码然后卡在数据库配置上——它没有邮箱没有手机号过不了任何云服务的注册流程。最后还是人类手动建库、复制连接串、粘回 Agent 的上下文。不是这些事多难而是它打断了 Agent 的工作流。本来一口气跑完的事情到数据库这里断了。后来我们开始想为什么会这样其实原因很朴素——传统数据库是为人类设计的不是为 Agent 设计的。控制台是给人看的注册流程是给人走的文档是给人读的。Agent 在这个链条里插不进去它不会填表单也不会等邮件验证。我们习惯性地给 Agent 设计 Prompt、设计工具、设计工作流却很少停下来问数据库这层基础设施是不是可以有 Agent 友好的设计理念甚至 Agent-First 的版本基于这些思考我们在开源数据库 seekdb 之上做了一个探索——seekdb D0。立即试用 OceanBase 企业版体验国产数据库能力180 天免费试用零门槛开通传统数据库为什么对 Agent 不友好要理解 seekdb D0 在解决什么问题我们得先看看现有数据库服务对 Agent 有多不友好。传统数据库服务的设计假设是使用者是人类而且是会阅读文档、手动配置的人类。这个假设在过去二十年是成立的。但当我们把 AI Agent 引入开发流程问题就暴露了。身份认证是第一道坎。几乎所有云数据库服务都要求注册账号、验证邮箱甚至绑定手机号或信用卡。这对人类来说是一次性的麻烦但对 Agent 来说是不可逾越的障碍。配置复杂度是第二道坎。选择实例规格、配置网络安全组、设置访问白名单……这些操作需要领域知识和上下文理解。即使是经验丰富的开发者也经常在这些配置选项中迷失。对于试图自主完成任务的 Agent 来说这种复杂度几乎是灾难性的。启动延迟是第三道坎。传统云数据库的实例创建通常需要 3-10 分钟。在人类的时间感知中这是「可接受的等待」。但在 Agent 的工作流中这是一个需要特殊处理的异步操作增加了编排的复杂度。最后是文档与接口的割裂。传统数据库的文档是为人类编写的——PDF、HTML、视频教程。Agent 无法直接「阅读」这些内容并转化为操作。它需要的是结构化的、可直接调用的接口描述。这些问题的本质是传统数据库是为「人机交互」设计的而不是为「机机交互」设计的。seekdb D0 要做的就是把这个设计假设翻过来。一个 URL 解决所有问题理解了问题seekdb D0 的设计思路就很清晰了。典型痛点是这样的你想让 Agent 帮你分析库里的数据它往往要先装驱动、配客户端、折腾连接串——环境里没有 MySQL 客户端任务直接黄掉。累而且不现代。seekdb D0 的思路很直接把一个 URL 丢给 Agent几秒后它就有了自己的数据库。不需要注册账号不需要配置实例不需要等待启动。Agent 访问 d0.seekdb.ai/SKILL.md拿到一份机器可读的自描述文件——创建实例、连接、查询的完整操作说明。读完就知道该调什么接口、怎么传参不需要人类再写 Prompt 教它。这和化妆品「小样」的逻辑一样seekdb 是开源数据库你可以从 GitHub 拉代码、本地部署、生产环境跑。但在那之前你可能只是想快速验证一个想法。D0 就是这个小样Free trial0 配置启动跑通了再决定要不要深集成。对于 AI Agent 来说只需要一句提示词Read https://d0.seekdb.ai/SKILL.md and follow the instructions to create a database using seekdb D0.而对于人类开发者来说也很简单一行命令用 HTTP 请求就够了curl -X POST https://d0.seekdb.ai/api/v1/instances没有控制台没有注册没有等待。Agent 自己完成全流程。零门槛是怎么落地的seekdb D0 的系统分三层控制面实例管理、路由分配、回收、MySQL ProxyMySQL 协议兼容直连体验、HTTP Proxy无客户端时用 JSON 查数。在这个架构上对外暴露四个关键接口创建实例POST /api/v1/instances、HTTP 执行 SQLPOST /api/v1/query、Agent 说明书GET /SKILL.md、以及 ForkPOST /api/v1/instances/:id/fork。SKILL.md服务自描述Agent 怎么知道怎么用 seekdb D0靠服务自己暴露的 /SKILL.md——一份机器可读的自描述文件包含创建实例、连接、查询等完整操作说明。Agent 拉到这个文件就知道该调什么接口、怎么传参不需要人工再写一段 Prompt 教它。Fork Instance 毫秒级分叉对 Agent 来说这意味着可以在毫秒内把一份完整的数据库状态交给下一个环节而不需要 mysqldump 再导入。但零配置只是入场券。Agent 连上数据库之后能干什么才是关键。这就要说到 seekdb 引擎本身的能力了。装在「小样」里的三件事seekdb 在一个引擎里装了三件事D0 直接继承。这三件事对应的是 Agent 场景下最常见的三类需求连接兼容性、混合搜索能力、以及安全的数据操作空间。MySQL 兼容接上就能用首先是连接兼容性这是基本盘。PyMySQL、mysql2、JDBC不换驱动、不改连接串标准 SQL 全部照跑。如果 seekdb D0 只是「快速创建 MySQL 实例」那它的价值就有限了。很多人用云数据库的第一个动作是 SELECT 1;验证连接成功就完事了。但 Agent 的场景不一样——它需要的是一个能真正支撑 AI 工作负载的数据引擎。seekdb 在兼容层上额外扩展了几个 Agent 场景里真正用得到的能力全文检索支持 IK、jieba 等中文分词器向量搜索提供 HNSW 和 IVF 两个系列的索引类型以及原生的数据 BranchFORK / DIFF / MERGE。不是另一套 API就是 SQL。AI Search一张表三种搜索其次是混合搜索能力这是 seekdb 和「MySQL 加向量插件」方案最直接的差异。传统的 AI 应用技术栈往往是碎片化的。你可能需要用 MySQL 存储结构化业务数据用 Elasticsearch 提供全文搜索能力用 Milvus 或 Pinecone 存储和检索向量。这意味着一个完整的 RAG 应用可能需要维护 3-4 个不同的数据存储系统处理它们之间的数据同步、一致性保证和运维复杂度。seekdb 把这些能力统一到单一系统中。纯向量搜索APPROXIMATE 一个词切换到近似最近邻SELECT id, title, cosine_distance(embedding, [0.12, 0.34, ...]) AS score FROM documents ORDER BY score APPROXIMATE LIMIT 10;纯关键词中文直接上 IK 分词器SELECT id, title, MATCH(content) AGAINST(向量数据库) AS score FROM documents WHERE MATCH(content)AGAINST(向量数据库) ORDER BY score DESC LIMIT 10;两者都要混合搜索一次出结果boost 调权重SET params { query: { query_string: { fields: [content], query: 向量数据库, boost: 2.0 } }, knn: { field: embedding, k: 10, query_vector: [0.12, 0.34, ...], boost: 1.0 } }; SELECT JSON_PRETTY(DBMS_HYBRID_SEARCH.SEARCH(documents, params));单一查询、单一事务、单一结果集。这不仅简化了应用代码更重要的是保证了数据一致性——你不需要担心向量库和关系库之间的同步延迟。让我用一个具体场景来说明这种统一的价值。假设你在构建一个智能客服系统的 RAG 模块用户问「上海徐汇区附近有哪些关于退款政策的文档」这个查询包含三个维度语义理解层面需要向量检索找到与「退款政策」语义相关的内容关键词匹配层面需要全文搜索确保不遗漏包含「退款」关键词的文档地理过滤层面需要筛选「上海徐汇区」相关的内容。在传统架构中这需要三次不同系统的查询然后在应用层做结果合并和排序。而在 seekdb 中你可以用一条 SQL 完成SELECT doc_id, title, content, cosine_distance(embedding, [0.1, 0.2, ...]) as semantic_score, MATCH(content) AGAINST(退款 政策) as keyword_score FROM knowledge_base WHERE ST_Distance_Sphere(location, ST_GeomFromText(POINT(121.4 31.2))) 5000 ORDER BY semantic_score * 0.6 keyword_score * 0.4 LIMIT 10;D0 开放 IVF 系列索引完整的 HNSW 系列在自部署的 seekdb 中可用。更多参数和示例见 seekdb-search skill:https://d0.seekdb.ai/skills/seekdb-search.mdBranch给 Agent 一个安全的沙箱最后是安全的数据操作空间。Agent 写数据是比读数据危险得多的操作。给 Agent 一个真实数据库让它随便改等于在生产环境里跑实验——知识库更新错了、Schema 改坏了、批量写入出 bug怎么办传统方案是复杂的权限控制和操作审计。但权限控制只能限制 Agent 能做什么不能让它在「安全的环境里自由探索」。Branch 解决的就是这个问题给 Agent 一个完全隔离的沙箱改坏了直接丢掉确认没问题再合进主表。数据分支的概念来自 Git 的版本控制你可以从当前数据状态创建一个「分支」在分支上进行任意修改而不影响原始数据。seekdb 的答案是三条 SQL-- 毫秒级克隆写时复制不占额外存储 FORK TABLE knowledge_base TO knowledge_base_branch; -- 看清楚改了什么再决定要不要合进去 DIFF TABLE knowledge_base AGAINST knowledge_base_branch; -- 合并三种冲突策略按场景选 MERGE TABLE knowledge_base_branch INTO knowledge_base STRATEGY THEIRS;Agent 在 Branch 上随便折腾主表稳如狗。Diff 之后人工确认再 Merge 回去——既给了 Agent 充分的自主空间又保留了人在关键节点介入的能力。这类似于 Git 的 Pull Request 工作流但应用于数据层面。实例级的 Branch克隆整个数据库直接调 APIPOST /api/v1/instances/:id/fork毫秒出一个完全独立的新实例新 credentials、新 TTL互不影响。完整工作流见 seekdb-branch skillhttps://d0.seekdb.ai/skills/seekdb-branch.md。说到这里你可能会问Branch 这个能力听起来不错但具体能用在哪些场景让我展开讲几个。Branch 的几个实用场景数据分支在 AI 开发中有几个特别有价值的应用场景这里展开说说。Prompt 工程的 A/B 测试假设你在优化 RAG 系统的检索策略有两个候选方案方案 A 使用纯向量检索方案 B 使用向量 全文混合检索。传统做法是准备两套测试数据集或者顺序执行测试。使用 seekdb 的分支能力你可以快速创建两个并行测试环境-- 创建两个并行测试环境 FORK TABLE knowledge_base TO kb_test_a; FORK TABLE knowledge_base TO kb_test_b; -- 对 test_a 应用方案 A 的索引策略 CREATE VECTOR INDEX ON kb_test_a(embedding) USING HNSW; -- 对 test_b 应用方案 B 的混合策略 CREATE VECTOR INDEX ON kb_test_b(embedding) USING HNSW; CREATE FULLTEXT INDEX ON kb_test_b(content);两个测试环境共享底层数据但索引策略完全独立。测试完成后删除不需要的分支即可。Agent 工具链的安全沙箱当你让 Agent 自主执行数据库操作时一个核心问题是如何防止 Agent 的错误操作破坏重要数据使用分支能力你可以给 Agent 提供一个「沙箱」在 Agent 执行复杂操作前自动创建数据分支让 Agent 在分支上执行所有操作人类审核后再决定是否合并到主分支或直接丢弃。快速回滚与数据快照AI 应用经常需要进行数据修正——比如更新知识库、调整向量嵌入、修改元数据。传统方案需要手动备份或依赖复杂的事务管理。使用分支能力操作前先执行 FORK TABLE knowledge_base TO knowledge_base_backup; 创建快照执行批量更新后如果出问题可以直接恢复。为什么 Fork 可以这么快seekdb 的数据分支能力基于 LSM-Tree 存储引擎的天然优势。LSM-Tree 的特点是数据按照时间顺序追加写入历史版本天然保留。当执行 FORK 操作时系统记录当前的日志序列号LSN作为分支点新分支共享分支点之前的所有数据文件只有在分支上发生写入时才会产生新的数据文件。这就是为什么 FORK 操作可以在毫秒级完成——它不需要复制任何数据只需要创建一个逻辑标记。这和 mysqldump 再 source 的传统做法完全不同后者需要实际复制数据时间和存储成本都随数据量线性增长而 FORK 的成本几乎是常量。seekdb D0 的定位与边界讲完了能力我们来聊聊 seekdb D0 的定位。任何产品都有它的边界seekdb D0 也不例外。理解一个产品不仅要知道它能做什么还要清楚它不适合做什么。seekdb D0 最适合的场景AI 应用的原型验证快速验证 RAG、Agent 工具链等想法Demo 演示与教程为技术分享、客户演示准备临时环境技术选型评估在正式采购前体验 seekdb 的能力学习与实验探索向量数据库、全文搜索等技术。但 seekdb D0 也有明确的限制每个实例有消费上限和 7 天的有效期。出于安全因素AI 函数AI_EMBED、AI_COMPLETE 等在试用实例中已被禁用。作为免费试用服务seekdb D0 不提供 SLA 保障不建议用于生产环境。如果需要生产级部署可以部署开源 seekdb 或使用 OceanBase 云服务。写在最后如果你正在做 Agent 应用想快速验证一个想法可以现在就试试Read https://d0.seekdb.ai/SKILL.md and follow the instructions to create a database using seekdb D0.你的 Agent 会知道接下来该怎么做。seekdb D0 提供 7 天免费试用如果试下来觉得合适有两条路可以走本地部署 seekdb开源、Apache-2.0GitHub 上拉源码直接跑完整能力不受限制联系 OceanBase 团队如果你的场景需要云服务、更大规模或定制化支持我们愿意一起探索更多可能性如果只是好奇也没关系。7天够你的 Agent 跑不不少实验了。立即试用 OceanBase 企业版体验国产数据库能力180 天免费试用零门槛开通

相关新闻