日前, 中国通信标准化协会、中国信通院等权威机构联合主办的“TDBC 2025 可信数据库发展大会”在京拉开帷幕。
TDBC 2025 活动现场
会上, 上半年“可信数据库”评估测试结果公布, 值得关注的是百度智能云向量数据库 VectorDB 顺利完成了向量数据库产品性能测试, 成为国内首批完成测试的向量数据库产品。
该测试参考国内首个向量数据库性能技术标准《向量数据库性能测试方法》, 覆盖稠密向量检索、多向量检索、标量向量融合检索三种常见场景, 评估指标涵盖索引构建时间、QPS、平均时延、最大时延、CPU 占用、内存占用等多个维度, 对性能进行综合评判, 为产品选型提供权威参考。测试中, 百度智能云 VectorDB 完成了所有向量检索场景 (例如稠密向量检索、多向量检索、标量向量融合检索) 的性能测试。从测试结果来看, 在百万和亿级稠密向量检索性能测试中, 产品性能表现优异, 满足企业生产要求。印证了其在数据基础设施领域的技术领先性。
测试证书
作为一年一度数据库领域的专业盛会, 本次 TDBC 大会以“自主・创新・引领”为主题, 聚焦数据库技术创新与应用实践, 基于此百度智能云数据库与大数据产品总架构师朱洁在『人工智能与数据库融合发展』分论坛的深度分享中总结道:超过 50% 的 AI 项目时间并非消耗于算法优化, 而是深陷数据治理的复杂迷宫中。当业界追逐千亿参数模型时, 数据正成为制约 AI 价值落地的隐形瓶颈。在大模型技术高歌猛进的表象之下, 数据困境呈现多维绞杀态势。文本、图像、音频、视频等多模态数据如同破碎拼图, 传统工具难以实现有效治理; 数据工程师、算法科学家、业务专家在割裂的系统中各自为战, 协作效率在跨团队摩擦中持续损耗还不能保障安全; 更棘手的是, 手工主导的数据治理流程与割裂的技术栈, 不但带来成本虚高更让数据价值转化陷入低效循环。这不仅是技术挑战, 更是组织协作与成本控制的系统性难题。“真正的数据工程需要构建从数据源头, 最终形成 Data + AI + App 的数据闭环, 实现从数据到价值交付的高速公路”, 朱洁指出。
百度智能云数据库与大数据产品总架构师朱洁
面对困局, 百度智能云以“智能数据基座”为核心, 重塑数据与 AI 的连接方式, 将原来散落在各处数据统一管理和治理, 实现数据变现并提升业务决策效率。广泛应用于大模型训练、AI 能力应用以及传统大数据升级等场景。例如处理各种类型的数据, 例如文本、文档、图片、语音、视频等, 提供数据抽取、清洗、去重等处理, 采用先进的湖仓一体架构, 大幅提升了准备 AI 训练数据的效率。在资源利用上, 智能调度 CPU 和 GPU 算力, 预测资源需求并进行优化分配, 既保证了 AI 训练的稳定性, 又有效降低了计算成本; 提供优质的在线协作环境, 让数据工作流程, 从处理到 AI 应用都可以在统一界面完成, 确保高效和安全, 方便用户可靠地执行复杂任务, 有序管理数据、资源和人员。有行业预测指出, 到 2028 年, 大多数生成式 AI 应用将直接基于企业数据平台构建, 这表明“智能数据基座”正从技术支撑转变为企业关键的战略基础设施, 最终目标是释放数据价值。
百度智能云的实践表明, 当数据治理从成本中心转化为价值引擎, 企业将获得敏捷性跃迁、成本重构、创新解锁等三重收益。在数据即生产力的新时代, 百度智能云打造的不仅是一套技术方案, 更是重构了“数据-模型-价值”的转化范式。当行业困于数据迷局时, 这种以统一治理为基石、智能处理为引擎、协同创新为纽带的数据基座, 正成为企业穿越大模型深水区的核心导航, 在 AI 竞争的下半场, 智能数据基座的建设已从技术选项升级为生存必需。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。