
来源:中国信通院

这份由中国信息通信研究院于2025年发布的《数据治理研究报告——端侧大模型数据治理法律要点研究》,系统探讨了在端侧大模型(部署于手机、汽车、智能家居等终端设备上的轻量化人工智能模型)快速发展背景下,数据治理面临的法律挑战、国际比较与应对建议。以下是报告的核心内容梳理:
一、 端侧大模型概述与技术特点
报告定义了端侧大模型,并总结了其四大特征:
本地化:数据本地处理,减少云端依赖,增强隐私保护与离线服务能力。
轻量化:通过模型压缩(量化、剪枝等)与资源动态分配,适应终端有限的算力与存储。
个性化:基于用户本地行为数据动态优化,提供精准、实时的场景化服务。
协同化:通过“端-边-云”架构实现任务智能分流与多设备联动,平衡性能与效率。
二、 数据治理法律要点与挑战
报告重点分析了端侧大模型在全生命周期中的数据治理难题:
数据处理前:“告知-同意”规则适配难
海量公开训练数据中包含的个人信息难以逐一获取同意。
实时响应需求与“一揽子授权”现实,与敏感信息“单独同意”要求存在冲突。
功能边界大幅扩展,用户难以精准知晓数据收集范围与用途。
对未成年人、老年人等特殊群体缺乏有效识别与保护机制。
数据处理中:传统原则面临挑战
最小必要原则:为追求高度智能化与个性化,数据收集范围可能超越“最小必要”边界。
存储期限管理:端云协同模式下,数据在云端存储期限可能超出法定要求。
数据处理后:用户权利行使与责任认定困难
权利行使障碍:数据分散于模型参数中,用户的更正、删除、拒绝处理、可携等权利难以有效实现。
责任认定困境:涉及终端厂商、模型开发者、云服务商等多主体,数据流转链条复杂,导致数据泄露等安全事件责任划分不清。
处理全链条:数据安全与内容风险
数据污染:本地化训练数据易混入错误或恶意信息,导致模型输出偏差。
模型幻觉:轻量化压缩可能降低模型精度,生成错误内容。
对抗攻击:终端安全防护较弱,易受输入攻击或参数篡改。
三、 全球治理模式比较
欧盟:在GDPR严格框架下寻求灵活适用,通过EDPB意见和各国指南细化AI数据合规要求,强调“权利优先”与高风险系统监管。
美国:采取“场景化保护”路径,联邦层面轻监管、各州差异化立法,依靠行业自律、技术标准及重点领域法规(如HIPAA、COPPA)进行治理。
中国:在《网络安全法》《数据安全法》《个人信息保护法》等现有法律框架下探索,通过司法案例(如杭州“AI奥特曼”案)明晰责任,并推进技术标准研制。
四、 展望与建议
报告提出构建“发展-安全”平衡框架,具体建议包括:
完善法律规则:建立分级告知机制、探索训练数据同意例外、弹性适用最小必要原则、规范数据存储期限、强化特殊群体保护。
明确主体责任:细化数据分类分级、完善侵权认定规则、通过“共同处理”或“委托处理”界定多主体责任边界。
补充监管手段:构建可信语料库、提升算法可解释性、完善“机审+人审”内容过滤机制。
创新技术工具:部署监管沙盒、优化数据脱敏、构建安全存储架构、开发轻量化隐私计算技术。
建立协同机制:形成“政府监管+行业自律+技术监测”三位一体模式,建立动态评估、信息共享与便捷维权渠道。
加强国际合作:推动制定国际准则、开展联合技术研发、促进经验交流与人才培养。



















完整报告原文已分享到星球社区
会员可前往下载。非会员请按照以下步骤免费获取:
关注公众号,然后在首页对话框回复关键词“数据治理研究报告”,
系统自动推送百度网盘下载链接。
(关键词输入需完全一致,否则系统无法正确匹配)



(本星球常年对接50万+报告智库,每日精选50+行业报告学习分享!)
免责声明:本社群只做内容收集和知识分享,严禁用于商业目的,报告版权归原撰写发布机构所有,相关报告通过公开合法渠道收集整理,如涉及侵权,请联系我们删除;如对报告内容存疑,请与撰写、发布机构联系。


