产业家 12小时前
2025年,数据库迎来新一轮变革
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

产业互联网第一媒体。产业家

数据库的角色正在被彻底重写:不再只是数据仓库、事务账本、分析引擎,而是智能系统中真正可信的核心。AI 成为组织大脑,数据库就是数据调度的中枢——谁掌握数据流,谁就掌握智能流。

作者 | 斗斗

编辑 | 皮爷

出品 | 产业家

数据库,这个长期 " 藏在后台 " 的基础设施,正被 AI 时代推向台前。

客服想更精准地回答用户问题,推荐系统希望更快做出响应,风控模型则需要更实时地识别风险——这些智能能力的背后,离不开数据库提供持续、结构化、具备上下文的数据支撑。

" 以前数据库是仓库,现在更像是中枢。"Databend CEO 张雁飞这样对产业家形容。

这一角色转变,正重新定义数据库在企业系统中的位置:它不仅要存数据,还要参与推理、支撑决策、响应模型调用,成为智能系统的 " 实时大脑 "。

与此同时,问题也随之而来。

" 原先的权限系统正在失效。" 某上市企业数据安全产品部总经理陈宇耀对产业家直言。

一个事实是,性能跟不上、权限不好管、安全边界模糊……尤其在AI大量接入后,传统数据库架构和管理方式正面临重压。

数据库,正在经历一次深层的升级。

这一轮变化,对厂商、客户、产品、安全体系,都是一次重新洗牌。

AI,让数据库正在 " 走向前台 "

" 过去数据库偏向后台静态数据仓库,而今天,它更像一个前台实时系统。" 张雁飞告诉产业家," 数据库,终于有新故事了。"

过去,数据库的核心职责是存储和查询,主要被用于记录订单、交易、库存等结构化数据。但随着 AI 模型进入客服、搜索、推荐、分析等业务流程,数据库的角色正在发生变化。

越来越多企业意识到,要让 AI 系统 " 理解业务 ",必须让它获取实时的、结构化的数据上下文。而这些数据,大多存放在数据库中。数据库逐渐成为 AI 模型背后的信息源,也成为支撑企业自动化流程的关键基础设施。

在搜索增强生成(RAG)、Agent 系统、实时推荐等场景中,数据库被用于:存储模型调用所需的上下文信息,如用户历史、商品属性、产品知识;支持向量检索,用于语义搜索、相似内容匹配;记录 AI Agent 的状态和决策流程,确保自动化行为可追踪、可回溯。

数据库的调用方式也在变化。

以往是人操作系统时触发数据库查询,现在是模型或 Agent 自动生成请求。这些请求频率高、链路复杂、语义模糊,对数据库的性能和响应能力提出更高要求。

多位数据库从业者跟产业家提到,客户正在要求数据库 " 不仅能存数据,还要能理解语义 "。这意味着数据库需要支持更丰富的索引结构、更灵活的数据格式,以及与 AI 系统之间更高效的接口。

" 一个客户将数据库接入 AI 客服系统,每一次用户提问,模型都需要查询产品信息、用户偏好、订单状态等多个字段。过去一分钟调用几次数据库就足够,现在几秒钟可能就要处理上百次请求。" 张雁飞告诉产业家。

除了性能压力,客户也希望数据库能兼容多种数据类型

一些新应用需要同时处理结构化数据(如用户表)、非结构化数据(如文本记录)、向量数据(如语义嵌入)。数据库产品也开始集成更多原本由搜索引擎、缓存系统、特征平台承担的功能。

这种变化不只是企业需求上的提升,也带动数据库产品形态的演进。传统数据库的设计假设是 " 人操作系统 ",现在则必须适应 "AI 操作系统 " 的需求。

一些主流数据库产品已开始做出回应。

例如,PostgreSQL 社区涌现出多个兼容 LLM 的扩展模块;Databend 等云原生数仓则在底层集成向量与结构化数据的混合检索能力。

尤其是 Databend,其优势在新一轮洗牌中愈发凸显。

张雁飞告诉产业家:" 我们并不是在给传统数据库加 AI 插件,而是在为 AI 生态造数据库。"

在研发一线,这种变化也体现在团队讨论方式的转变。

过去数据库团队主要关注写入性能、查询优化、事务一致性,现在越来越多话题围绕 " 模型能不能读得快、Agent 调得稳、上下文能否持续更新 "。

总的来说,数据库的 " 用户 " 已经从人,变成了模型和 Agent。

这是一个看似细微、实则根本的变化。

它不仅改变了数据库的访问方式,也意味着数据库必须承担更多 " 推理辅助 " 和 " 协同管理 " 的责任。

技术转型的挑战和安全隐忧,

集体爆发

数据库 " 走向前台 " 的转变,不只是性能优化的问题,更是一场架构重构和安全重塑的系统性挑战。

在 AI 时代,数据库厂商面临的核心问题不再是单点能力的提升,而是如何适应更复杂、更动态的智能应用需求。

首先,数据库形态正在发生根本性变化。过去,系统按 " 专一能力 " 划分——做事务处理就专注 OLTP,做分析就服务于数据仓库。

但今天的企业,越来越倾向于 " 一库多能 "。既要结构化查询,也要图谱检索、向量搜索、流式处理,甚至希望能原生支持 Prompt 编排与自然语言接口。

" 客户经常问我们,能不能一个数据库同时做推荐、搜索,还能配合 Copilot。" 张雁飞说," 这不是简单的功能叠加,而是要求我们从内核设计上支持多模态融合。"

为了支撑 AI 系统复杂的调用链,数据库厂商正在底层架构上做出调整。例如,在索引体系中引入倒排索引、向量索引和混合检索模块;在查询引擎中兼容 SQL 与自然语言解析;在执行逻辑上牺牲部分一致性,以保证实时响应。

张雁飞表示:" 客户不关心数据库叫什么名字,他们关心的是,这个数据库能不能支撑 AI 系统实时运行。"

但这让一些问题逐渐显现。

一个事实是,尽管国内数据库厂商在 OLTP 与 OLAP 领域已有突破,但面对 AI 原生场景,依然存在架构短板。向量检索、多模融合、Agent 友好型接口等新需求,对厂商的系统设计灵活性和技术积累提出更高要求。

" 我们一开始就以 Serverless 和云原生为基础,这才让我们有机会在底层集成向量和图谱等能力。" 张雁飞坦言," 如果从关系型出发,中途再转,几乎不可能。"

与此同时,数据库的安全模型也面临前所未有的挑战。

过去,安全重点是 " 防人出错 " ——通过权限配置、访问控制、加密等手段保护数据。但如今,数据库频繁被 AI 模型与 Agent 程序调用,这些系统具备 " 类人 " 的主动性,传统的权限体系正在失效。

" 以前权限是基于角色或岗位来配置的。但现在,一个 Agent 可能同时代表多个角色,每秒发起成百上千次请求,我们根本不知道它在查什么。" 陈宇耀对产业家说。

权限失控已不再是预警,而是现实问题。

许多企业在部署 AI 系统时,忽略了对 Agent 行为的审计和限制。例如,在 RAG 系统中,若缺乏权限过滤,用户可能通过 Prompt 调取数据库中的敏感信息。

" 问题不在模型本身,而在于数据库缺乏识别‘访问者身份’与‘访问动机’的能力。" 陈宇耀指出。

更值得警惕的是,向量数据库还引入了新的安全风险:攻击者可能反推训练语料,或通过注入 " 污染数据 " 操控检索结果,进而影响模型输出。

" 我们已经看到一些攻击案例:在知识库中混入歪曲内容,让模型输出出现偏差。" 陈宇耀告诉产业家," 传统的数据防泄漏系统在这里几乎无效,因为它无法识别语义层的攻击。"

这也意味着,数据库安全的定义正在被重写。

过去关注的是 " 存储安全 ",而 AI 时代,更需要关注调用链路的可见性、访问行为的可解释性,以及上下文权限的动态调整能力。

" 数据不再固定在一个库里,它在多个 Agent 之间流动。" 陈宇耀总结道," 未来需要一种新型安全组件,它不再围绕‘系统边界’,而是围绕‘数据本体’建立权限策略——权限要随数据走。"

数据库 +AI 怎么走?

走到哪了?

面对 AI 引发的结构重构与安全冲击,企业开始尝试通过 " 补能力、调权限、改架构 " 的方式应对,但这些尝试大多仍处在探索初期。

第一步尝试,集中在产品能力的扩展上。

企业希望数据库能原生支持文本、图像、向量等多模数据处理,减少对中间件的依赖。" 客户越来越希望一个系统处理多种数据结构,而不是东拼西凑。" 张雁飞直言。

然而,从实际来看,这一能力尚未标准化。

一些系统仅支持简单的向量相似度计算,难以胜任复杂语义检索;也有厂商虽引入向量模块,但与主查询引擎耦合度低,存在性能瓶颈与一致性问题。" 数据库 + 向量 " 更多是 " 接上了 ",距离 " 融合好用 " 仍有距离。

与此同时," 上下文管理 " 机制也尚不成熟。当前多依赖缓存或临时表来提供上下文信息,缺乏一套高效统一的调用模型。多位业内人士坦言,目前尚无数据库在 AI 上下文支持方面形成行业共识。

第二类应对,聚焦于安全模型的重构。

AI 系统频繁调用数据库,但原有权限设计与审计机制并未同步升级。一些企业尝试通过 Agent 侧的访问白名单、上下文窗口等方式,限制其可访问字段范围。

" 以前权限是‘人对人’,现在得变成‘ Agent 对字段’。但很多企业甚至搞不清自己用了多少数据库调用、有哪些 Agent 在跑。" 陈宇耀说道。

虽然部分企业已引入运行时加密、动态权限调整、审计网关等机制,但这些组件多为外挂,无法与数据库主系统统一策略、协同运行,反而增加了系统复杂度。

更大的问题在于,大多数数据库并不具备原生的 " 身份链路 " 和 " 行为路径 " 可视能力。AI 调用链路层层嵌套、日志分散,企业即使发现风险事件,也难以准确追溯全过程。

第三类尝试,则是在整体架构上做取舍与隔离。

部分企业选择将敏感数据保留在本地,仅在云端运行非核心 AI 任务;也有企业部署数据库一体机,封闭 Agent 接口以强化管控。

" 一家金融客户把 Agent 的访问范围限制在每日自动销毁的只读表内,虽然安全,但代价是灵活性和实时性大打折扣。" 张雁飞说。

当前,混合部署与权限隔离是相对可行的务实策略,但也带来数据同步压力、接口维护成本高、系统响应延迟等一系列副作用。而要真正实现 " 安全与效率兼顾 ",企业还需在数据库引擎层构建具备策略调度能力的原生机制,目前这一能力尚属空白。

更现实的问题是,即使某些数据库在功能上实现替代,仍可能在复杂 SQL 优化、多模协同、Agent 状态一致性等细节上出现不稳定。这种技术缺口导致 AI 应用在测试阶段表现良好,但一旦接入真实业务流量,常常暴露出查询卡顿、语义漂移、权限错配等问题。

"AI 改变了数据库的角色,但技术体系还没跟上。" 一位制造企业 CIO 对产业家直言,公司目前采用的是 " 加一层、补一段、设几个限 " 的方案。

他还说:" 这听起来安全,其实只是感觉安全。"

未来走向,

谁能造出 AI 时代的 " 数据引擎 "?

目前,业界普遍认为,AI 时代的数据库将沿着三个方向持续演进:一体化、智能化、安全内生化。

具体来看,首先是数据库将走向架构一体化。

过去,企业往往需要部署多个数据库来分别处理结构化、日志、向量或图谱数据。这不仅造成架构冗余,还带来数据同步、权限治理和审计合规的额外负担。

" 未来的数据库,应该能统一处理结构化、文档、图数据和向量数据,并提供一致的查询接口与权限体系。"Databend CEO 张雁飞表示," 我们希望把过去五个工具才能完成的任务,压缩成一个产品来实现。"

然而,这种一体化仍面临技术挑战。

不同数据类型在存储格式、索引结构、查询语义上差异显著,要在同一引擎内高效支持并不容易。目前多数所谓的 " 融合型数据库 ",仍是关系型架构上外挂功能模块,缺乏真正的底层融合。

其次,数据库将更加 " 懂 AI",也将 " 用 AI"。

AI 正倒逼数据库 " 前台化 ",同时也成为其自身能力升级的关键工具。目前,已有厂商借助大模型生成 SQL、构造测试用例、优化查询计划,大幅提升开发与运维效率。

" 我们已经用 AI 自动生成上万组查询语句,覆盖各种业务场景,这在人力时代几乎不可能。" 张雁飞指出,未来数据库优化器的演进也将依赖大模型,"AI 会成为数据库研发流程中的标配工具。"

但 " 懂 AI" 还不够,数据库必须 " 适配 AI",解决上下文管理、Agent 状态维护、调用路径压缩等新场景问题。目前,行业尚缺乏统一的接口规范和调用语义标准,数据库之间的协同能力仍有壁垒。

第三,安全能力必须内嵌进数据库系统本身。

AI 应用对数据访问模式的改变,使 " 外挂式安全 " 逐渐失效。频繁自动化调用、行为不透明、权限动态变化,要求数据库具备原生的权限管理、行为审计、访问透明和运行时加密等能力。

" 权限系统不能只是配置文件或外置引擎,它必须嵌入数据库核心逻辑。" 陈宇耀指出。真正 " 安全内生 " 的数据库,应深度融合身份体系、行为模型与策略引擎,为 AI 调用提供全过程可控的信任机制。

目前,仅有少数产品尝试将权限、调用路径与敏感字段识别 " 绑定 " 在引擎层,大多数仍停留在网关封堵、合规对接阶段,距 " 安全即设计 " 还有不小差距。

谁能率先完成这三重转型,有望成为 AI 时代新的基础设施提供者。

值得注意的是,这场变革也为新兴玩家提供了窗口。传统数据库厂商架构包袱沉重、演进缓慢,而一些新项目则从 AI 场景出发,绕过旧范式,直接构建面向 Agent、向量与上下文的底层逻辑。

"AI 对数据库的重构,不是插件升级或功能扩展,而是理念转变——从存储转向协同,从记录转向参与。" 张雁飞强调。

从这个视角看,数据库的角色也在彻底重写:不再只是数据仓库、事务账本、分析引擎,而是智能系统中真正可信的核心。AI 成为组织大脑,数据库就是数据调度的中枢——谁掌握数据流,谁就掌握智能流。

当然,这一进化仍在进行中。一体化架构仍在调试,智能能力受限于应用场景,安全机制尚未标准化落地。要真正成为 AI 系统的 " 实时引擎 ",数据库还需穿越长坡厚雪。

最新视频号内容推荐

产业 AI 大模型

产业数字化

数字化大势下,科创板 IPO 的 " 紧箍咒 "

透视京东,和隐藏起来的 200 个上升密码

云上管车背后:透视数字化时代的企业内功

透视云测试:技术、产业、降本增效下的数字化之战

产业 SaaS

《2021 年 SaaS 行业八大趋势 | 盘点》

美团阿里鏖战,餐饮 SaaS 无「终局」

产业供应链

产业互联网时代,谁在重写供应链?

牵手国资背后,再看苏宁的零售产业边界

产业硬科技

《云从「敲门」科创板》

《物联网,一场上云的巨型战役》

《华为:用鸿蒙 HarmonyOS2.0 讲的新故事》

《国产芯片战场:掣肘、决心和看得见的未来十年》

©  往期回顾

产业家网全新上线

© THE END

/

欢迎爆料

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

数据库 ai 基础设施 自动化 互联网
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论