“开源大模型法律风险及防范研究报告(2025)”由同济大学&上海市人工智能社会治理协同创新中心发布。
本报告共计:99页。完整版PDF电子版报告下载方式见文末。
开源人工智能生态的构建依赖于项目、组织与平台的共同推动,以“技术-规则-市场”的三元结构共同构成开源人工智能生态的基础设施。开源人工智能项目作为生态系统的核心生产力载体,本质上是以代码、参数和数据等为核心的技术共享机制,其技术开放程度与创新质量直接决定生态活力。
当前具有全球影响力的开源项目可分为基础模型、开发框架与工具链三类。基础模型领域,Meta的LLaMA系列通过开放模型权重重塑了人工智能开源范式,成为中小开发者构建垂直领域模型的基石。但LLaMA的开放程度有限,其权重需在有限条件下“申请”获取,这些限制条件包括但不限于使用目的与范围的限制、权重和衍生模型的分发限制。这类有限开放常被业内称为“开源洗地”行为,并不完全符合开源的精神。
除LLaMA外,阿里旗下的Qwen也是基础模型中最有影响力的开源项目之一,并且因LLaMA4性能表现的不佳得到了更多的关注。但与Meta类似,阿里旗下模型也有差异化的开放限制,并且始终有性能更优的商业化模型序列。据开源中国的不完全统计,截至2024年9月,全球已有近8万基于阿里Qwen的衍生模型,超越了Meta的LLaMA。
开发框架领域,Google和Meta主导的TensorFlow与PyTorch是当前最主流的两大人工智能开发框架,这它们通过模化化设计,降低分布式训练与模型部署的技术门槛,避免重复造轮子的困境。其中使用PyTorch框架的预训练人工智能模型要比使用前者的多得多,也是人工智能学术研究中最流行的框架。
幻影视界整理分享报告原文节选如下:












戳“阅读原文”下载报告。


