389页报告 | 行业细分垂域AI智能体研发项目立项申报范例
基于数据中台的策划经营垂域AI大模型申报书
一、背景和需求介绍
1.1 背景概述
为解决传统勘察咨询行业数据孤岛化、决策经验依赖、管理效率较低的痛点,前期XX工程有限公司依托自主研发的新OA系统(数字化综合管理系统),整合办公、生产、研发全链路数据,构建了企业级数据中台。但是可以看到,虽然系统基本完成了企业数据的结构化治理和汇集,但尚未进行AI能力的植入和高频场景智能体的训练,海量数据价值尚未得到充分的挖掘和释放,离公司“中联大脑”的建设目标仍有较大差距。在此背景下,XX以“通用AI中台+垂直小模型+专业场景业务应用”为路径,开始进行企业AI能力建设:- 建立AI中台框架,开发算力调度系统(Iaas)、模型应用系统(Maas)和智能体应用系统(Aaas)。最大限度的整合利用公司既有服务器硬件资源和外接的算力资源,确保目前有限算力资源最大化支持模型训练和推理,并能满足后期的敏捷扩容需求。快速响应不同部门不同用户新的功能需求。
- 在数据安全应用的前提下整合XX自研(如AI智绘平台)和行业内成熟的AI应用,打造企业AI办公助手,全面赋能公司日常生产和工作。
- 聚焦公司目前的高频价值场景,自主进行垂域小模型的训练,逐步构建优势行业垂域智能体集群。
随着公司逐步贯彻策产投建营结合区域深耕的经营战略,项目可研和投标方案的编制工作扮演了越来越重要的角色。而传统人工编制面临核心人员依赖重、设计效率低、编制周期长、跨部门协作成本高等痛点。针对以上价值场景,XX以新OA数据中台为基座,训练策划经营垂域小模型,构建以下智能体:- 投标方案AI助手:自动生成技术标框架,整合历史案例、造价数据,缩短编写周期,解决标书业绩资源调用困难、人员资质分散以及格式规范性不足等问题。
- 可研报告AI助手:融合政策库、市场数据,解决公司可研报告资源库检索难、核心人员经验依赖高等问题,实现风险自动评估与财务测算,提升数据分析准确性。
AI能力建设采用分段式推进,首期建设完成后,预计将达到以下效果:- 完成AI算力中台框架搭建,形成基础算力服务(Iaas)、模型应用(Maas)、智能体应用(Aaas)三级服务架构,并有数据治理层和AI定制开发工具提供支撑。
- 通用AI能力覆盖超80%常用办公场景,完成管理流程全面智慧化赋能。
- 可研报告编制时间缩减50%,人工校验成本降低60%。
- 探索确定垂域小模型训练、微调、工作流和行业智能体构件标准路径,为下一步打造优势行业垂域智能体集群奠定基础。
1.2 项目可行性和应用前景
- 数据基础可行性:新OA系统已全面建成集成,通过对近10年历史项目数据的治理,已形成超20TB的结构化数据,涵盖工程全生命周期;基于OA系统已清洗的1万+标书/可研历史数据,可满足经营垂域模型微调需求。
- 技术基础可行性:XX前期已完成了“中联智绘”等小模型的训练,并与生态伙伴共同运营了盈利性质的“好易智算”AI平台,具备充分的AI算力调度、模型训练及平台运营技术基础。
- 在策划经营领域垂域模型微调方面,联合建设投资公司提供领域知识及实际项目使用验证,确保模型专业性。
- 人工智能时代已经来临,工程勘察设计行业的AI转型刻不容缓,“中联大脑”的建设亟需完善自身的AI体系能力,而AI中台的建设和各种垂域小模型的孵化正是迈出的第一步。
- AI投标及可研助手的打造,全面匹配公司策产投建营和区域深耕的经营战略。投入使用后可使单个项目投标成本降低50%,可研报告编制效率提升50%,公司年节省成本保守估计超500万元。在XX使用成熟后,还可进一步推广至三地三院,全面提升中国联合系的经营生产数字化转型。
策划经营垂域小模型的训练可进一步细分复用于工业、物流、能源等行业领域,加深垂域文件编制的专业性。同时可通过微调、RAG和工作流的设计,裂变为针对不同场景的行业智能体。二、技术方案
2.1 总体架构
2.2 主要内容
包含各类计算资源、存储资源、网络资源。它提供基础架构支持、支撑业务运行、适配多样化需求,实现资源灵活调配,降低成本与风险,促进创新与敏捷开发。主要功能有:显卡集群管理、多显卡资源分配。计算资源负载均衡、单显卡资源切片。分布式存储系统、存储资源分配及存储卷管理。支持国产通用开源大模型的快速便捷本地部署。可以将多个模型部署在同一套计算资源上,实现资源的共享和高效利用,避免了每个模型单独部署所带来的资源浪费,降低了硬件成本。将AI模型或其他类型的模型作为服务提供给用户的架构层,其主要包括以下几方面:简化部署流程,MaaS 层能够将复杂的模型部署过程进行封装,用户无需了解模型部署的底层技术细节,如服务器配置、环境搭建等,只需通过简单的接口调用,就可以快速使用模型,大大降低了模型使用的门槛。模型版本管理,方便对模型的不同版本进行管理和维护,模型开发者可以根据业务需求和模型性能的提升,轻松地更新和切换模型版本,确保用户始终能够使用到最新、最准确的模型。统一接口标准,为各种不同类型的模型提供统一的访问接口,无论模型是基于深度学习、机器学习还是其他技术,用户都可以通过相同的方式来调用模型,提高了模型使用的便利性和一致性。支持多种编程语言和工具的调用,满足不同用户的技术背景和开发需求,使模型能够更好地融入到用户的业务系统中。模型共享:使模型开发者能够将自己开发的模型共享给其他用户或团队,促进了模型的复用和知识的传播,避免了重复开发,提高了整个行业的效率。跨团队协作:方便不同团队之间基于模型进行协作。智能体应用层主要包括:知识库插件,如文件预处理、向量检索、分片策略等;数据分析插件,如Chat转SQL、数据分析等插件;文生图插件;插件库管理功能,如分类、标签、加载、删除等功能。智能体支持开放接口,提供基于RestFul协议,实现与外部应用数据的交互。数据治理层是AI中台运行的关键核心,其包含以下几个模块:数据标签支持人工标注与自动化标注(基于规则/预训练模型),提供标签版本管理与一致性校验。数据统计查询:支持通过SQL语句进行数据的统计查询。元数据管理支持对各类数据的溯源。结果后处理模块,对模型输出的结果进行后处理,如结果解析、格式转换、可视化等,将模型的输出转化为用户易于理解和使用的形式,方便用户进行后续的分析和决策。数据治理层支持与OA及第三方系统的对接,完成数据的安全抽取。AI定制开发工具层,是XX后续打造行业垂域智能体集群的关键基础。通过定制化工具,降低开发门槛,让更多的公司的行业专家能够基于自身知识复制进行定制开发,从而实现优势行业能力的复制,打造企业核心竞争力。定制开发层包含以下功能模块:大模型微调框架,支持微调模型包含国内通用的开源大模型,支持微调方式包含全量调整、冻结调整、LoRA、QLoRA、奖励建模、PPO 训练、DPO 训练等。大模型量化框架,建立高效推理框架,支持多精度量化方式,支持将量化后的大模型发布到MaaS层。AI智能体开发模块,支持低代码或零代码下的AI智能体开发任务,支持对开发中AI智能体进行版本回退。AI智能体发布模块,支持将开发好的AI智能体发布到AaaS,支持对已发布AI智能体的编辑修改。本文篇幅较长,点赞关注后私信“垂域”,领全部完整资料集!