推广 热搜: 采购方式  甲带  滤芯  气动隔膜泵  减速机型号  减速机  履带  带式称重给煤机  链式给煤机  无级变速机 

中国AI数据基础设施白皮书(2025)

   日期:2026-02-05 00:43:15     来源:网络整理    作者:本站编辑    评论:0    
中国AI数据基础设施白皮书(2025)

出品  |  陈博观察 (ID: Drchenobservation)

编辑  |  Will Chan

当前,全球正经历地缘政治重塑与人工智能技术革命双重驱动的深刻变革,两大趋势交织重构世界经济与社会发展格局。在全球化向区域化、供应链向本土化转型的外部环境,以及人工智能从前沿技术向核心生产力跃迁的内部需求下,中国处于关键历史转折点。在 AI 新时代,中国在通信、互联网、人工智能等领域已涌现引领全球的创新成果,Data&AI 数据基础设施作为这些优势领域的交叉地带,成为中国保持 AI 竞争优势、赢得智能革命的必争之地。基于此背景,甲子光年智库发布了《2025年中国 Data&AI 数据基础设施研究报告》,系统梳理中国 Data&AI 数据基础设施的发展现状、技术路径与实践经验,为大型组织提供前瞻性参考。

来源:陈博观察AI工作站(Doubao AI)创作

一、新趋势:AI 时代数据范式的演进

1.1 数智融合成为时代特征

数据应用与人工智能虽已出现多年,但早期处于 “各自为政” 的相互独立状态。随着社会信息化程度提升,数据资源持续增长,依赖数据的深度学习等人工智能算法崭露头角,数据分析也不断吸纳人工智能算法模型发展出数据挖掘技术,二者开启融合之路。

互联网、移动互联网的普及推动全社会数据爆炸式增长,大数据和数据平台概念应运而生,人工智能进入依赖海量数据的深度学习阶段,数据应用与人工智能迈入深度融合阶段。在数据作为生产要素被广泛认知后,二者融合进程进一步加速:高质量数据集的积累加快了大模型的成熟,大模型又反过来帮助各组织机构更好地发挥数据要素的生产力,推动二者从深度融合走向一体化。

来源:甲子光年,中国Data&AI数据基础设施研究报告2025

支撑数据应用和人工智能的关键基础设施同步演进,先后经历了关系型数据库、数据仓库、分布式数据库及数据湖、湖仓一体等多个发展阶段,不断适配二者融合的需求升级。

1.2 双向互动成就范式跃迁

数据应用与人工智能技术的发展呈现协同演进态势,每一次 AI 范式跃迁均建立在数据范式进化基础之上,共同推动架构与能力实现三次范式跃迁。

人工智能技术发展的三次范式跃迁:

  • 感知智能阶段:核心是让机器感知和理解外部世界信息(图像、声音、文本等),依赖相互独立的非结构化数据。

  • 生成式 AI 阶段:重心转向逻辑推理与新内容生成,处理复杂抽象任务,依赖结构化、单 / 多模态数据集。

  • Agentic AI 阶段:当前最新趋势,核心是让 AI 具备规划、决策和执行复杂任务的能力,主要依赖融合的多模态数据。

来源:甲子光年,中国Data&AI数据基础设施研究报告2025

数据应用发展的三次范式跃迁:

  • 数据库阶段:以传统关系型数据库、数据仓库为主,辅以分布式文件系统、NoSQL 数据库等,数据形态以结构化为主,与感知 AI 数据形态融合度低。

  • 数据平台阶段:出现云数据仓库、数据湖等新载体,核心是打破数据孤岛,通过统一数据治理和建模,以服务形式向业务部门输出数据能力。

  • 数据基础设施阶段:采用 “湖仓一体” 与 AI 原生融合的新型架构,将数据全生命周期管理与 AI 模型全生命周期管理融合到同一平台,支撑企业 AI 应用场景持续稳定落地服务。

架构层面,从分离架构、融合架构逐步演进至一体化架构:数据接入覆盖社会运行、企业经营、物理世界等多领域实体对象,数据形态从数值文本、音频图像扩展至多模态数据;数据处理层从数据库、数据平台 / 云升级为数据基础设施;模型模式层从业务规则、量化模型、小模型发展到大语言模型、代理式智能体;业务应用层从业务报表、对象识别拓展至 AIGC、数字员工、业务辅助等场景,更新频率从离线长周期更新、在线短周期更新升级为在线实时更新。其中,Agentic AI 需与真实世界实时动态交互,不仅要处理文本、图像、音频、视频等多模态数据,还需处理实时流数据并实现动态调度,这成为数据基础设施的核心能力要求。

来源:甲子光年,中国Data&AI数据基础设施研究报告2025

1.3 应用深化推高融合要求

中国数字化进程持续推进,经历了不同发展阶段:2000-2010 年为业务数据化阶段,实现企业级信息化与业务流程数字化,解决特定业务场景问题,代表产品为数据集市 / BI,数据量级达 10TB 级别,核心需求是数据处理分析2011-2020 年为产业数字化阶段,实现业务全流程数字化与产业级数字化,数据平台成为核心支撑,数据量级提升至 100TB 级别,需求聚焦数据业务化2021-2030 年为数据智能化阶段,打造生态级数智化体系,推动全业务数智化,企业级数据基础设施成为关键,数据量级达 3PB 级别,核心是数据资产化与 Data&AI 一体化融合2030 年以后将进入数据要素化阶段,数据成为生产经营必备基本资料,形成国家级数据基础设施与数智生态,数据量级无上限,核心是数据要素化与数据生产力释放

来源:甲子光年,中国Data&AI数据基础设施研究报告2025

随着数字化迈向智能化阶段,人工智能开发和应用对数据能力提出更高要求,尤其在多模态、高质量、实时反馈等方面。产业数字化阶段的传统数据平台以存储和分析为核心,难以支撑模型训练、智能体部署等新型智能化场景,促使数据平台从支撑性、辅助性工具向 AI 原生融合的智能底座演进,数据基础设施也从 “支撑决策” 升级为 “协同驱动智能”,成为组织机构实现数据价值流转与智能闭环的 “核心生产工具”,其先进程度成为衡量社会数字化、智能化发展水平的核心标志。

在国家加快培育数据要素市场、推动人工智能工程化应用的背景下,数据资源价值释放与 AI 能力转化面临关键瓶颈,典型问题可归结为三类:需求拉动型障碍数据 “拿不出、调不动”)、供给推动型失焦数据 “起什么作用、怎么用”)、供需定向型低效数据 “范围窄、复用差”)。同时,还存在行业数据规模化聚集、治理、资产化及模型训练落地难,各行业异构数据统一接入与集中管理,多类型 GPU/CPU 异构算力调度,数据合规性与算法可信性保障等技术难题。在此背景下,城市级人工智能数据应用开发平台应运而生,通过构建监管沙盒、打通 “产品交易 - 模型调优 - 合规评测” 全流程闭环,集成制度资源、平台能力与数据场景,破解数据价值释放与 AI 能力落地的断链问题。

来源:甲子光年,中国Data&AI数据基础设施研究报告2025

1.4 数智一体化成行业共识

市场需求推动数据平台定位从 “被动的容器” 升级为 “主动的生产力载体”,其核心作用不再局限于存储数据,更要生产、处理面向 AI 原生的数据,成为数据的 “产地” 与 “工艺”。在此背景下,Data&AI 一体化成为行业共识,全球多家领先厂商通过战略性收购持续增强自身 AI 能力,构建从数据接入、处理到数据与 AI 融合开发、应用部署的一体化能力。

国际代表厂商中,Databricks 从非结构化数据出发,向结构化数据和 AI 能力扩展;Snowflake 则以结构化数据处理为核心优势,逐步向非结构化数据和 AI 能力延伸。国内代表厂商中,阿里云通过自研 + 收购(如 Data Artisans)构建起 Data&AI 一体化端到端全栈能力;科杰科技主要通过自研完善 Data&AI 一体化端到端基础软件能力,这些厂商的布局清晰展现了 Data&AI 深度融合的行业趋势。

来源:甲子光年,中国Data&AI数据基础设施研究报告2025

二、新定义:Data&AI 数据基础设施的核心内涵

2.1 赛道定义:AI 时代的 “核心数字底座”

国家数据基础设施是从数据要素价值释放角度出发,面向社会提供数据采集、汇聚、传输、加工、流通、利用、运营、安全服务的新型基础设施,是集成硬件、软件、模型算法、标准规范、机制设计等在内的有机整体。在国家统筹下,它由区域、行业、企业等各类数据基础设施共同构成,网络设施、算力设施与之紧密相关,并通过迭代升级支撑数据的流通和利用。

来源:甲子光年,中国Data&AI数据基础设施研究报告2025

Data&AI 数据基础设施是为支撑人工智能规模化落地而构建的一体化基础软件平台,核心目标是打通数据存储、治理、计算与 AI 模型开发的全链路,实现 “Data for AI” 和 “AI for Data” 的双向赋能,融合开发 Data 工程和 AI 工程。其本质是传统大数据平台的升级形态,通过 AI 原生架构重构数据处理范式,满足企业智能化转型的底层需求,是 AI 时代的 “核心数字底座”。

来源:甲子光年,中国Data&AI数据基础设施研究报告2025

2.2 核心特征:AI 原生的一体化架构驱动

Data&AI 数据基础设施的核心特征是 AI 原生的一体化架构,构建 “Data for AI” 和 “AI for Data” 的动态持续双向就绪平台体系,实现 Data 与 AI 全链路无缝衔接。云原生的存算分离是其架构上的关键技术特征,多模态计算引擎和异构资源调度引擎是平台核心技术实现;低代码 / 自然语言交互是其交互体验上的突出特点,业务人员可通过自然语言生成 SQL 或代码,大幅降低数据使用和 AI 应用开发门槛。具体能力体现在以下五大方面:

  • 资源接入:实现动态异构智能调度,按需弹性分配 CPU/GPU 资源,突破传统平台仅支持单一数据类型的局限,适配多源多模态输入需求。

  • 数据管理:实现多模态数据融合处理,支持对非结构化数据进行实时提取、治理与标注,生成高质量训练数据集;利用机器学习算法进行数据分类分级、标注、校验、异常检测等。

  • 开发能力:融合 Data&AI 工程,实现 AI 模型训练、推理一体化,基于融合数据降低推理延迟,面向应用需求对各类模型进行运营管理。

  • 智能应用:支持一体化闭环落地,提供低代码开发模式,允许企业开发者灵活调用数据与 AI 工具链(如标注、训练、Agent 开发);搭建智能体市场,实现场景化智能体交付。

  • 安全运营:保障高可用性、安全合规性与运营运维效率,确保业务连续性和数据安全,在追求性能的同时有效控制综合成本。

来源:甲子光年,中国Data&AI数据基础设施研究报告2025

2.3 边界厘清:与传统大数据平台的差异

Data&AI 数据基础设施处在数据应用的第三代,与前两代产品及传统大数据平台存在显著差异,核心区别在于数智一体和 AI 原生特性。

第一代数据应用产品以关系型数据库为代表,国际厂商如 Oracle;数据形态以结构化为主,数据模型固定(ER 图预定义表结构);应用处理以批处理为主,数据量级为 GB 级,无实时性要求;技术架构以烟囱式架构为主(单机数据库 + 应用服务器)。

第二代数据应用产品以混合存储服务为代表,国际厂商如 Snowflake;数据形态中半结构化 / 非结构化数据占比提升至 50%+,采用混合存储(SQL+NoSQL,如 HBase+Phoenix);应用处理以分布式批处理为主,数据量级达 PB 级,实时计算开始萌芽;技术架构采用分布式架构(Hadoop 生态 + 微服务)及云原生架构(容器化 + K8s),传统大数据平台多属于这一代。

第三代数据应用产品以湖仓一体为代表,代表厂商如 Databricks科杰科技;数据形态中非结构化数据占比超 80%(含音视频等多模态数据),采用多模态数据统一存储与处理、高维矩阵与张量存储、多模态复杂数据预处理及统一 Unity Catalog;应用处理以批流一体为主,支持万亿参数模型与实时推理计算;技术架构采用数据湖仓一体、分布式弹性扩展架构,即 Data&AI 数据基础设施。

与传统大数据平台相比,Data&AI 数据基础设施在资源接入(存算分离 vs 存算一体、动态调度 vs 静态调度)、数据管理(原生支持多模态 vs 以结构化为主、并行处理 + 实时动态处理 vs 批量处理为主 / 延迟高)、AI 集成(Data&AI 一体化 vs 需外接 ML 平台 / 模型开发独立)、工程化能力(支持 AutoML / 训推一体 / 大模型运营 / 智能体 vs 缺乏相关支持、低代码生成场景化智能体 vs 依赖代码开发 / 周期长、AI 驱动自动化治理 vs 规则引擎 + 人工标注 / 成本高、端到端全局可追溯 vs 局部追溯 / 跨系统难打通)、智能应用(实时决策 / 生成式 AI / 智能体应用 vs BI 报表 / 历史数据分析、需求交付周期短 / 自动化智能化程度高 vs 周期长 / 依赖人工开发)、平台架构(分布式湖仓一体 + 向量数据库 vs 中心化数据仓库 / 数据与 AI 割裂、全域动态生产资料 / 主动驱动模型优化 vs 静态资产 / 被动调用)、运维成本(全链路监控 + 自动弹性伸缩 vs 多系统独立运维 / 复杂度高)等方面均实现全面升级,能原生贴合 Agentic AI 时代企业基于数据的智能化业务需求。

来源:甲子光年,中国Data&AI数据基础设施研究报告2025

2.4 价值体现:“点 - 线 - 面 - 体” 五级价值体系

Data&AI 数据基础设施的核心价值的是通过湖仓一体架构统一纳管全域数据资产,以 AI 原生设计支撑模型的高效训练与实时推理,实现数据到智能的闭环转化,驱动业务持续创新,最终形成支撑未来智能社会的国家战略,成为智能革命的核心引擎。其价值链条呈现 “点 - 线 - 面 - 体” 递进的五级价值模型:

  • 用户效率价值:以 AI 原生特性降低智能应用门槛,解决 “用数难” 问题,满足用户数字化升级需求,提升各业务环节运行效率。

  • 用户创新价值:通过 AI 规模化应用推动用户构建多模态实时处理能力,成为支撑模型训练、Agent 开发的核心底座,满足用户 AI 落地需求,实现业务智能化创新。

  • 行业协同价值:推动行业整体技术能力升级,提高 AI 数据协同能力;作为底层支撑产品,覆盖各类用户和场景,实时响应业务场景变化,满足跨组织的数据流通需求和安全管控要求。

  • 产业带动价值:促进数据与 AI 规模化应用,带动算力服务、算法开发、数据治理等相关产业发展;激发数据资产运营商、数据交易平台等新兴业态不断涌现。

  • 国家战略价值:以可信流通与基础设施赋能,加速数据要素市场化进程;融合 AI、大数据、云计算、边缘计算等技术,形成新型基础设施和新型生产工具;构建自主可控的数据基础设施体系,保障关键领域安全,支撑国家治理体系与治理能力现代化。

来源:甲子光年,中国Data&AI数据基础设施研究报告2025

三、新范式:技术架构与产业格局

3.1 能力模型:五大关键能力要素

Data&AI 数据基础设施将数据平台和 AI 智能工具融合成为统一系统性底座,其关键能力主要体现在融合开发、平台架构、资源调度、智能原生、安全运营五个方面,各能力要素的核心内涵如下:

  • 融合开发能力:作为 AI 应用的基石,指系统对多源、多模态数据进行集成、处理、智能治理、模型训推、Agent 开发,以及系统化建设 Data&AI 融合工程化的能力,涵盖数据集成、数据开发、智能数据治理、模型训推、Agent 开发等具体环节。

  • 平台架构能力:指平台采用湖仓一体、Data&AI 一体化等新型架构的程度,核心包括是否支持多模态数据 Unity Catalog、Unity Format、Unity Processing、存算分离、Data Fabric 等先进技术能力,以及架构的开放与兼容性。

  • 资源调度能力:直接影响 AI 模型开发和应用的效率与成本,指系统对底层计算资源(包括 CPU 和 GPU)的调度效率和成本控制能力,具体涵盖异构计算资源调度、存算分离、弹性扩展、效率成本优化、资源隔离与稳定性保障等能力。

  • 智能原生能力:是 “Data&AI 一体化” 的核心体现,指系统原生支持 AI 开发与应用的深度和广度,以及实现数据与 AI 闭环互动的能力,包括数据与 AI 闭环、内置 AI 能力(AI in-Lakehouse)、低代码 / 自动化、智能体生态支持等关键特性。

  • 安全运营能力:是 AI 在企业侧落地的保障,指系统在企业级部署中所需的高可用性、安全合规性和运营运维效率,具体包括数据隐私合规、数据加密与访问控制、审计与溯源、容灾与高可用、总体拥有成本(TCO)控制、投资回报(ROI)提升等能力。

来源:甲子光年,中国Data&AI数据基础设施研究报告2025

3.2 架构范式:4+1 架构体系

Data&AI 数据基础设施采用 4+1 架构体系,下接硬件和数据源,上承各类业务应用,各层级功能定位如下:

  • 资源接入层:作为 “入口”,负责从各种来源摄取数据,并进行初步的流式或批量处理,为上层提供可用的数据资源,核心功能包括数据摄取、数据接入连接器、数据同步、非标准化终端适配、数据合规与隐私增强等。

  • 数据管理层:作为 “核心仓库”,对接入的原始数据进行存储、治理、加工和组织,形成干净、可信、易用的数据资产,涵盖数据处理和数据工程、数据标注、高质量数据集构建、元数据管理、数据治理、向量数据库、数据湖、湖仓一体、MPP 数据库、数据质量管控等功能模块。

  • Data&AI 工程化层:作为 “智能引擎”,直接利用治理好的高质量数据集,进行机器学习模型、大模型的训练、推理与运维,核心功能包括特征工程、机器学习、大语言模型、多模态模型、行业模型开发、模型运维管理、智能体开发工厂等。

  • 智能应用层:作为 “价值出口”,通过低代码、智能体等方式,将数据和 AI 能力封装成最终用户可直接使用的应用或工具,具体包括代码助手、智能助手、智能体市场、智能检索、知识库、智能工厂、数字人、用户支持等应用形态。

  • 安全运营层:作为 “安全底线”,保障数据与 AI 资产的全生命周期安全,满足合规要求;确保平台稳定、高效、经济地运行,持续实现业务价值,核心功能包括模型安全管理、数据合规管控、审计与溯源、容灾备份、全链路监控等。

来源:甲子光年,中国Data&AI数据基础设施研究报告2025

3.3 厂商类型:四类主体差异化竞争

从全球和中国市场整体智能化需求来看,企业亟需一体化、低代码、AI 与数据原生融合的基础软件平台工具,以灵活处理多模态数据、开展场景化模型训练和智能体开发,支撑 AI 应用全面落地。当前提供 Data&AI 数据基础设施产品及服务的厂商主要分为四类,各自专注不同的产品服务层次:

  • 智能应用厂商:以围绕数据或 AI 场景提供定制化服务、工具的厂商为代表,如爱数、数新智能、数势、Dify 等。这类厂商缺乏体系化的数据基础设施技术产品和服务经验,主要业务是服务客户数据或 AI 场景的快速落地,长期将成为 Data&AI 数据基础体系中聚焦某个细分领域的专业类厂商。

  • 数据平台厂商:以传统大数据平台厂商为代表,如 Snowflake、星环、明略、东方金信等。这些厂商拥有较多的大数据平台项目和客户积累,目前处于融合 AI 能力的转型期,尚未形成 Data&AI 一体化产品,缺少基础设施一体化建设的实施经验和案例,在 Data&AI 数据基础体系中处于探索期。

  • 专业平台厂商:以 Databricks、科杰科技为代表,基于长期在头部客户的落地实践和技术积累,率先实现了面向 AI 原生的 Data&AI 一体化基础设施软件成熟产品,加之多个行业的标杆案例和长期实践形成的成熟方法论,在 AI 时代 Data&AI 一体化基础设施赛道取得先发优势,且该优势将随客户侧落地不断扩大。

  • 综合平台厂商:阿里、华为、腾讯为代表,具备较强的品牌力,基于丰富的产品线整合形成 Data&AI 基础设施产品体系化服务能力。但由于产品各模组分属不同团队,服务内部不同业务,对外架构仍存在割裂,落地服务往往依赖三方,整体性易产生偏差,且常对客户选型有垄断性要求。

来源:甲子光年,中国Data&AI数据基础设施研究报告2025

3.4 类型能力:各有侧重的能力布局

四类厂商的技术路线、市场侧重存在差异,因此在核心能力表现上各有侧重:

  • 综合平台厂商:能力最为均衡,其中资源调度能力最为突出。但由于其产品是集团旗下各产品线整合而成,在客户侧深度场景应用服务上的能力略显不足。

  • 专业平台厂商:在 AI 原生架构、融合开发(Data 工程和 AI 工程融合开发)能力上表现最为突出,其能力最能体现 Data&AI 数据基础设施的发展重点和趋势。

  • 数据平台厂商:在融合开发和资源调度能力上相对较强,其能力体现了客户对大数据平台服务的核心需求。

  • 智能应用厂商:以 AI Agent 场景应用服务厂商为主,智能原生能力表现相对较强。该类厂商主要解决客户场景侧的 Agent 开发、AI 数据来源和数据质量需求,因此能力建设更聚焦于应用端。

来源:甲子光年,中国Data&AI数据基础设施研究报告2025

3.5 行业图谱:两类厂商主导发展大势

从行业图谱来看,Data&AI 数据基础设施行业厂商主要集中于资源接入层和数据管理层,而该领域的核心竞争力集中在资源接入层、数据管理层、Data&AI 工程化层这前三层

以阿里云为代表的综合平台厂商业务覆盖全行业每个层次,业务范围广泛;以 Databricks、科杰科技为代表的专业平台厂商在 Data&AI 数据基础设施的核心域(尤其是 Data&AI 工程化层)布局最深,技术实力突出。这两类厂商凭借全面的布局或核心技术优势,主导了 Data&AI 数据基础设施行业的发展大势。其他类型厂商则在特定层级或细分领域形成补充,共同构成了多元化的行业生态。

来源:甲子光年,中国Data&AI数据基础设施研究报告2025

四、新应用:典型场景落地实践

4.1 应用场景:大型组织的核心痛点与需求

Data&AI 数据基础设施已在各类大型组织中得到广泛应用,不同组织面临的核心痛点存在差异,但均对数据整合、智能赋能、安全合规等有着迫切需求

  • 大型国央企:拥有海量高价值数据,但面临最严格的数据安全合规要求(如等保、国资监管、司库相关规定)发展历史长,老信息系统多,跨时期、跨部门、跨子公司、跨地域的数据孤岛问题突出,数据整合难度大

  • 大型金融企业:监管要求高,数据系统厂商复杂,维护和切换升级难度大;数据质量要求高,业务部门用数流程复杂、成本高;业务场景细分,对数据实时性要求极高,跨区域业务协同需求强烈,用户规模大,需不断提升投入产出比。

  • 跨国外企:业务遍布全球,IT 架构复杂,常采用多云或混合云策略,需整合多种异构数据源和 AI 工具链,实现全球数据流动与协同分析,技术整合与生态互通难度大;面临特殊的数据治理挑战,需在全球统一治理框架下满足本地化合规要求,契合各国数据主权法规(如 GDPR)

  • 城市政府:作为城市数据的最大拥有者、使用者和数据应用生态的关键建设者,面临行业标准缺失、生态难以互通的问题;需提供公共数据开放服务,降低企业(尤其是中小企业)使用数据和 AI 技术的门槛,促进产业生态繁荣,核心痛点集中在数据流通与数据使用成本控制

4.2 大型国央企:破解数据孤岛与业务智能化诉求

中国石油化工集团有限公司(世界第一大炼油公司、第二大化工公司,连续多年位列《财富》世界 500 强前列)为例,其为响应国家数字经济发展政策号召,加快国有企业数字化转型,推动人工智能与实体经济深度融合,面临三大核心挑战:一是数据孤岛与集成挑战,数据资源体系不完善、治理机制缺失、共享模式缺乏;二是技术架构与整合挑战,历史遗留系统整合难度大、历史数据仓库性能低、新架构建设扩展难且兼容性差;三是数据统计难,时效性差,集团整体经营分析报表需人工汇总,数据错误频出,报表需求响应周期长。

解决方案聚焦 AI 赋能数据管控,构建数据资产化运营保障机制及支撑体系:一是打破数据孤岛,构建统一数据资源池,提升数据共享复用能力;二是基于科杰科技 KeenData Lakehouse Data&AI 产品体系,实现多源分散数据统一管控;三是依托模型的自动化数据处理加工能力,极大提升报表查看效率;四是构建高质量数据集和语料库,为勘探领域垂类模型的构建奠定基础。

落地效果显著,成功支撑勘探业务数字化、智能化转型:一是打造高质量数据资源池,围绕勘探 9 大核心业务构建勘探开发数据资源目录,支撑集团 61 套业务系统用数服务需求;二是推动国内上游数据资源管理模式变革,构建 “数据管理制度化、管理组织齐全化、治理规则标准化、数据架构一体化” 的新型数据资源管理体系;三是搭建国内上游 Data&AI 平台,实现对结构化数据、图形文档、实时数据、音视频、体数据等海量数据的管理应用,支撑勘探开发构建 “便捷接入、快速流通、实时处理、统一汇聚” 的核心能力。

来源:甲子光年,中国Data&AI数据基础设施研究报告2025

4.3 大型金融企业:释放多模态数据价值,响应实时决策需求

中信银行(全国性股份制头部商业银行,境内外分支机构超 1400 家,业务覆盖零售金融、公司金融、资金业务、风险管理等核心领域,服务海量个人与企业客户,综合实力稳居全球银行百强)为例,其面临的核心痛点是决策实时性不足,制约规模创新:战略决策层存在数据标准不统一、数字化能力难以规模化推广、AI 驱动的应用预测准确率低、“数据驱动战略” 在零售和对公领域难落地等问题;技术支撑层缺乏统一的实时处理架构、全域数据标准与治理机制,高可信的实时经营与风险数据不足,数据开发依赖专业技术人员;业务应用层数据孤岛问题突出,信贷审批、风险交易拦截等核心场景响应延迟高,会员精准服务、实时资产监控等 AI 驱动场景难以落地。

解决方案为构建场景融合实时数据体系,核心举措包括:一是打通数据壁垒,构建适配规模需求的实时数据体系;二是提速核心场景响应,匹配金融业务 “低延迟、高可信” 诉求,实现信贷全周期管理(信贷审批响应时间降至分钟级)、实时反欺诈(流批一体实时数据联动)、智能报表与监控(自助式分析秒级刷新数据);三是降低智能应用门槛,推动企业内数智化能力的规模化应用。

落地效果实现全域实时智能支撑服务转型:数据底座能力实现从 “分散处理” 到 “全域实时” 的质变,构建起湖仓一体、存算分离架构的金融级全域实时数据全链路体系;业务价值释放实现效率与风控的双向突破,通过 DataOps 驱动全流程实时管控,覆盖产品、风险、信贷、交易等核心业务环节;转型支撑力显著增强,基于科杰科技 Data&AI 产品体系,成功构建 “数据 - 服务 - 应用” 的数字化生态。

来源:甲子光年,中国Data&AI数据基础设施研究报告2025

4.4 跨国外企:契合本地化与国际化的统一

以亚洲领先的综合零售及服务企业集团 AEON 为例,其布局日本、中国、东南亚三大总部,全球拥有约 300 家企业、19094 家店铺(中国近 500 家),基于 “Digital AEON” 战略,聚焦 To C(顾客)、To B(内部经营)、To P(合作伙伴)三大方向,推动数字化能力建设与 AI 应用场景落地(如智能定价、个性化推荐、会员运营等)。其核心痛点是数据孤岛与智能不足制约创新:战略决策层缺乏全局数据支撑、标准不统一、数字化能力难规模化复制;技术支撑层存在高质量全维度数据不足、算力瓶颈、架构缺陷、实时性不足、数据管理低效等问题;业务应用层报表响应速度慢,会员运营、智能营销等 AI 场景难以落地。

解决方案为构建一体化 Data&AI 基础设施:数据体系层面,覆盖采购、门店、供应商等十大主题域,整合近 5 年 300 + 表、100 亿 + 数据,定义 128 个核心指标与 19 类标签,通过数据质量管理实现数据标准化稽核;技术架构层面,采用分布式、高可用、可扩展的存储架构,构建 “数据源 - 采集 - 处理 - 存储 - 分析运维” 全流程体系,实现 “离线 + 实时 + AI” 三位一体;场景赋能层面,落地客户 360° 画像、库存自动化预警、智能化商品推荐、智能定价、CDP 会员运营等应用。

落地效果显著,数据智能驱动业务价值释放:基础设施能力大幅提升,基于科杰科技 KeenData Lakehouse 数据智能平台,实现数据全生命周期管理,支撑集团 19000 + 店铺及多业态业务需求;业务效率显著改善,核心报表响应速度提升 10 倍,业务决策周期缩短 50%,KVI 商品销量提升 9%,会员复购率提升 8.45%,缺货率下降 12%;AI 场景规模化落地,成功支撑会员运营、智能营销等核心业务场景的智能化转型。

来源:甲子光年,中国Data&AI数据基础设施研究报告2025

4.5 城市政府:打通数字化产业生态的关键堵点

某市数据集团(在市委市政府推动下重组成立,采用 “政府授权 + 企业运营” 模式,负责整合公共数据、行业数据和社会数据资源,参与国家数据基础设施建设)为例,其核心驱动来自国家战略(数据要素市场化、数联网、区块链、隐私保护计算、可信数据空间)与国家任务要求,需解决数据流通、数据安全、生态互通等关键问题。

解决方案采用 AI 原生设计,实现数据与 AI 双向赋能:技术架构上践行云原生、湖仓一体、批流一体、存算分离等先进理念,基于 KeenData Lakehouse(Keen TDS)构建核心底座;核心功能覆盖数据汇聚、加工处理、交易撮合、标注评测、模型训练、部署服务、数据服务等全流程,实现供需智能匹配与高效对接、安全可控的数据流转与计算、动态风险管控与智能化审计、智能数据治理与资产化管理;生态建设上完善技术生态,为该市各行业提供支撑数据要素市场化配置的关键底座。

落地效果显著,构建起城市智能的数据底座:一是践行 “供得出、流得动、用得好、保安全” 为核心的新业务范式;二是推动数据从 “资源” 向 “生产要素” 的跃迁,为城市数字经济发展注入新动能;三是夯实城市智能化发展新底座,通过数据与 AI 双向赋能,支撑应用开发、智能辅助、模型评估等各类场景,为城市产业生态繁荣提供坚实支撑。

来源:甲子光年,中国Data&AI数据基础设施研究报告2025

五、总结与展望

在 AI 创生时代,地缘政治重塑与技术革命双重驱动下,Data&AI 数据基础设施已成为支撑人工智能规模化落地、推动数字经济高质量发展的核心底座。其发展呈现清晰的演进逻辑:数据应用与人工智能从相互独立、初步融合、深度融合迈向一体化,推动数据基础设施从数据库、数据平台演进至 Data&AI 一体化基础设施阶段,形成 “湖仓一体 + AI 原生” 的核心技术路径与 “点 - 线 - 面 - 体” 的价值递进体系。

从技术架构来看,4+1 架构体系实现了资源接入、数据管理、Data&AI 工程化、智能应用与安全运营的全链路协同,五大关键能力(融合开发、平台架构、资源调度、智能原生、安全运营)成为厂商核心竞争力。产业格局上,综合平台厂商与专业平台厂商主导行业发展,数据平台厂商与智能应用厂商在细分领域补充,形成差异化竞争生态。

应用落地层面,Data&AI 数据基础设施已在大型国央企、金融企业、跨国外企、城市政府等各类组织中取得显著成效,有效破解了数据孤岛、实时决策不足、合规治理复杂、生态互通困难等核心痛点,成为推动业务智能化转型的关键支撑。

展望未来,随着 Agentic AI 的持续发展与数据要素市场化进程的加速,Data&AI 数据基础设施将朝着更深度的一体化、更灵活的弹性调度、更全面的安全合规、更便捷的低代码开发方向演进。中国在通信、互联网、人工智能等领域的领先优势,为 Data&AI 数据基础设施的发展奠定了坚实基础,其作为优势领域的交叉地带,必将成为中国在全球 AI 竞争中保持领先、赢得智能革命的核心阵地。当数据与 AI 在新底座支撑下实现真正融合,将为智能社会的建设注入无限可能,推动人类社会迈向更高阶的智能化发展阶段。

—The End—

【特别声明】本文为陈博观察原创内容,如需转载或引用请注明上述版权信息文中相关插图已标注来源单位,版权完全归相关单位以及原作者所有;未标注的插图为本公众号绘制(部分素材借助AI工具完成)或来源于网络公开资料,如涉及侵权,请联系我们处理(yujianchenwei@163.com)。此外,本文仅供研究参考用,在任何情况下,文中的任何信息和结论均不构成对任何个人的投资与决策建议。
 
打赏
 
更多>同类资讯
0相关评论

推荐图文
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  皖ICP备20008326号-18
Powered By DESTOON