推广 热搜: 采购方式  甲带  滤芯  气动隔膜泵  减速机  减速机型号  履带  带式称重给煤机  链式给煤机  无级变速机 

汇业研究 | 企业构建和部署大模型RAG的主要法律实务问题

   日期:2026-01-11 07:00:09     来源:网络整理    作者:本站编辑    评论:0    
汇业研究 | 企业构建和部署大模型RAG的主要法律实务问题

2026,被认为是真正的AI Agent元年。作为AI Agent的重要能力单元,RAG成为企业确保模型幻觉控制生成结果可审计的重要技术路径。不同于通用的基础模型,RAG的构建、部署与应用,深入企业核心业务,直接处理私有数据,其合规性直接关系到企业的数据安全与商业秘密保护

结合类似项目经验,汇业律师事务所黄春林律师团队分析企业构建部署大模型RAG的主要法律实务问题如下,仅供参考。

一、大模型RAG的基本原理及法律属性

1.RAG的基本原理及类型

RAGRetrieval-AugmentedGeneration,检索增强生成)的核心原理是通过检索外部知识库中的可信内容,对大语言模型的生成能力进行增强,降低大模型幻觉从而提升输出内容的可靠性。

RAG的核心逻辑为:用户输入prompt→先从知识库中检索相关信息再将检索结果与用户prompt一同输入大模型大模型结合检索信息及推理能力生成可信内容反馈给用户。

从技术类型划分,主要包括传统向量检索RAG、基于知识图谱KGGraph RAG以及混合型RAG三类。本文中,除非特别说明,主要基于Graph RAG分析讨论。

2.知识图谱的法律属性

知识图谱的表现形式可以为原始文档、向量数据等,但其内容具有多重法律属性,具体包括但不限于:

1)数据及个人信息:知识数据的原始文档非结构化数据,切块化后的数据,以及向量化数据和索引数据等,属于《数据安全法》意义上的数据,数据主体、数据处理者等依据《关于构建数据基础制度更好发挥数据要素作用的意见》及相关法律法规享有数据资源持有权、数据加工使用权、数据产品经营权等权益。此外,对于涉及测绘、金融、医疗等领域的监管数据,还应纳入相应领域的特殊数据管理规范。

此外,如果RAG中原生结构化数据(例如表格)含有个人信息,或者在知识图谱构建过程中抽取实例导致非结构化数据具备个人识别性(例如基于人的主体、属性及关系等)的,还需同时遵循《个人信息保护法》等相关规定。

2)作品:依据《著作权法》等规定,若知识图谱的构建过程中对原始文档素材进行了具有独创性的选择、编排,形成了独特的结构设计、实体选择和关系建模、索引体系和向量关系的,则可能构成汇编作品。

3)商业秘密:若知识图谱包含企业未公开的技术信息、经营信息,且该信息具有商业价值并经企业采取保密措施,则可能符合《反不正当竞争法》关于商业秘密的定义,受商业秘密保护制度约束。

3.RAG的法律属性

RAG系统本质上是大模型之上的外部功能组件。因此,RAG并不涉及大模型本身的训练或优化不涉及模型权重的改变,而是通过检索模块与现有大模型能力结合实现功能增强,本质上是在应用层对大模型能力的外部扩展。

这一属性界定的法律意义在于:RAG的构建者无需承担基础模型相关的合规义务(如模型伦理审查、模型备案等),但需对检索模块的设计、知识库数据的合法性和质量性等承担直接责任。而生成内容的信息安全、内容质量等合规责任,主要由最终应用(例如APPAgent等)承担直接责任。

二、知识图谱数据来源合法性评估清单

汇业黄春林律师团队建议,企业应当根据《网络数据安全管理条例》生成式人工智能服务管理暂行办法》等规定,确保数据来源合法性,依法履行相应的合规义务,具体的审查评估要点包括但不限于:

三、构建RAG的主要环节及其合规要求

1.主要构建环节

RAG构建的核心环节为:数据采集数据清洗知识抽取与结构化知识图谱构建知识库存储检索模块集成系统测试。各环节环环相扣,任一环节的合规缺陷均可能导致整个RAG系统存在法律风险。其中,数据清洗、知识图谱构建知识库存储是合规风险的高发环节,需重点关注。

2.知识数据清洗合规

数据清洗的核心合规目标是消除原始文档中的数据冗余、错误及敏感信息,参照《标准知识图谱1部分实现指南》《人工智能知识图谱技术框架》等内容,具体合规要求包括但不限于

1)个人信息清洗:清洗过程中需遵循最小必要原则,对于员工及用户的个人信息(如身份证号、手机号、医疗记录等)应采取匿名化处理或删除处理,经合法评估为确保数据质量需要保留一般个人信息的,应采取去标识化处理。应记录清洗过程以备监管核查。

2)监管数据清洗:针对测绘数据、金融数据、医疗数据等监管敏感数据,需遵循专项法规要求,并确保构建、存储、部署及应用全生命周期的合规

3)商业敏感数据清洗:对于包含企业财务数据、核心技术参数、客户名单等商业敏感数据的,清洗过程中需采取脱敏、加密处理措施,限制清洗人员的访问权限。

3.知识图谱构建合规

汇业黄春林律师团队建议,知识图谱构建环节,需重点关注以下方面:

1)知识抽取合法性:例如单一知识数据可能不具敏感性,但通过图谱关联(如A员工经常在B地与C客户会面)可能推导出敏感个人信息或商业秘密,因此需在图谱构建层设置关系准入控制策略

2)图谱构建的准确性与可追溯性:知识图谱构建需保证实体关系的准确性,避免因错误关联导致生成内容失真,违背数据质量原则。同时,需建立图谱构建的全流程记录,包括数据来源、抽取规则、图谱更新日志等,确保图谱内容可追溯、可核查。

3)特殊领域图谱的合规限制:对于地理、金融、医疗等特殊领域的知识图谱构建,需遵循行业专项法规;等等。

4.知识数据存储合规

数据存储合规主要涵盖存储系统合规与存储加密合规两大维度:

1)存储系统合规:依据《网络安全法》《信息安全技术网络安全等级保护基本要求》规定,单独数据资源及RAG知识库存储系统需符合网络安全等级保护要求。

2)存储加密合规:依据《网络安全法》《密码法》等规定,对存储的敏感数据(如个人信息、商业秘密、重要监管数据)需采用符合国家密码标准的加密技术进行保护。加密算法应选用国家认可的SM系列算法等,使用进口加密组件或技术的,还应当符合《商用密码管理条例》等规定

3)档案管理合规:企业知识库符合《档案法》等规定的,还应当满足相应的合规要求。

四、企业部署RAG的主要模式

及其主要法律问题

1.私有化部署RAG的主要法律问题

RAG含有企业大量核心数据及商业秘密,因此强烈建议企业私有化部署RAG。私有化部署是指企业将RAG系统部署在内部服务器或专属云环境中,仅面向员工用于内部业务场景。其核心法律问题包括:

1)数据本地化及跨境合规:依据《个人信息保护法》规定,若RAG涉及重要数据或个人信息,私有化部署需满足数据本地化及跨境传输相关要求。

2管理合规依据《个人信息保护法》《数据安全法》《网络数据安全管理条例》等规定,依法开展个人信息保护影响评估、数据安全风险影响评估、商业秘密保护有效性评估等,依法制定安全事件应急预案,定期开展应急演练;发生安全事件的,依法履行报告及通知义务。

3技术合规依据《个人信息保护法》《网络安全法》《网络数据安全管理条例》等规定,对相关知识数据采取加密、备份、安全认证等技术措施和其他必要措施;尤其应当建立权限机制、审计控制等机制,确保不同部门和人员对知识库访问和使用的分级分类管理;相关连接、传输端口采取加密措施;相关域名、IP和移动应用依法办理ICP备案;等等。

4)用户保护:应当向用户说明RAG技术的局限性;等等。

2.平台部署RAG的主要法律问题

1平台法律属性及资质要求

企业通过火山方舟、阿里百炼等平台部署RAG,提供RAG服务的平台,根据《电信条例》《互联网信息服务管理办法》规定,应当依法取得相应的电信业务经营许可证(如ICPEDIIDC许可证)。

若平台涉及生成式人工智能服务(例如知识向量化处理、索引编排等),还需依据《生成式人工智能服务管理暂行办法》规定,对使用的LLM开展安全评估并履行算法备案手续。

此外,若平台处理特殊领域数据(如金融、测绘),还需取得相应的行业监管资质。

2平台协议审查

根据《个人信息保护法》《网络数据安全管理条例》等规定,企业应与作为数据处理受托方的平台签订协议,并履行监管责任。

若签署平台服务协议(例如《火山知识库产品服务和专用条款》、《火山知识库(免费版)数据授权规则及免责声明》)的,需重点审查包括但不限于以下条款数据权属与使用范围条款、保密与数据销毁条款合规承诺条款;等等。

3部署方式合规要求

  • 模型分离部署:分离部署在物理独立的网络环境(一般建议是私有环境),确保知识库的安全性和未来迁移的灵活性

  • 与其他知识库隔离部署:为防止不同企业/部门的知识库数据交叉泄露,需要求平台方采取技术措施实现各知识库的隔离存储与访问控制。

  • 跨平台互联合规:例如在阿里百炼部署RAG,但是在企业微信调用RAG能力的,尽量使用企业自有域名调用相应的API接口。

4平台服务要求

应当符合《人工智能知识图谱应用平台第2部分性能要求与测试方法》及平台SLA相关要求

综上, RAG 并非人工智能应用单纯技术细节,而是集中体现数据权利、责任边界与应用控制的综合性合规性问题。企业能否真正提高人工智能的生产力,并不单单取决于LLMAgentGraph RAG的技术先进程度,同时也取决于其是否在法律上清晰界定了知识图谱法律属性、RAG构建合规边界及应用层责任结构

作者往期文章推荐:
汇业研究 | 两电商新规对零售行业开展电商业务的主要影响及建议
汇业研究 | 端侧模型部署与应用的主要法律实务问题
汇业研究 | 企业私有化部署Dify类Agent开发平台的主要法律实务问题
汇业研究 | 未成年人个人信息保护合规审计及其报送工作的法律实务问题

大模型“存算跨境分离”部署架构的法律分析

在华外企使用境外总部AI解决方案的主要法律问题
企业上线AI Agent的主要安全风险与合规自评估清单
企业在中国境内部署及应用AI Agent的主要法律问题(二)
企业在中国境内部署及应用AI Agent的主要法律问题(一)
企业部署第三方大模型的主要模式、法律风险及缓释措施

《大型网络平台个人信息保护规定(征)》解读二:数据本地化及其数据中心合规管理

《大型网络平台个人信息保护规定(征)》解读一:负责人及工作机构的特殊合规要求

个人信息保护负责人(PIPO)信息报送及官方审核的十大实务问题

个人信息保护负责人(PIPO)信息报送的十五个实务问题

企业接入国家网络身份认证公共服务的几个常见问题

2025年网络安全等级保护3.0最新政策变化

零售行业的隐秘角落:门店个人信息处理合规评估项目实践

《网络安全法》2025年修订的主要内容及趋势展望

 
打赏
 
更多>同类资讯
0相关评论

推荐图文
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  皖ICP备20008326号-18
Powered By DESTOON