技术许可“攻守道”（三）：AI大模型许可关注点

Article Insights

Zhou Qi’s articles from Beijing Jincheng Tongda & Neal Law Firm are most popular:

in European Union
with readers working within the Accounting & Consultancy and Law Firm industries

Beijing Jincheng Tongda & Neal Law Firm are most popular:

within Corporate/Commercial Law, Antitrust/Competition Law and Insurance topic(s)

引言

AI大模型已从技术研发快速走向商业应用，对于AI大模型开发公司而言，技术许可已经成为其实现商业化的重要路径之一。对于被许可方而言，通过调用、部署或集成成熟大模型，也可以在较短时间内获得智能客服、内容生成、编程辅助、知识问答、合同审查等能力，甚至可以在成熟大模型基础上向用户提供增值服务。

AI大模型许可较传统软件许可更复杂，其许可标的不只是代码，还可能包括模型权重、模型参数、训练方法、部署文档、微调工具链、提示词模板、安全过滤模块等多种技术资产（视许可交易形态而定）；其使用过程也可能持续产生输入数据、日志数据、反馈数据、输出内容和模型改进成果；同时，大模型输出具有不确定性，可能引发知识产权、人格权、个人信息保护，以及内容安全等风险。

本文从实操角度对AI大模型许可交易中的主要关注点进行介绍，以供相关企业参考。

1. AI大模型许可交易形态

识别AI大模型许可的交易形态（即模型能力如何送达）是后续考虑许可标的、许可范围、费用、数据和成果归属、合规义务、赔偿责任等安排的基础。

根据检索，AI大模型的交易形态一般有以下几种模式：

云端服务化交付：许可方在自有或控制的云基础设施上运行模型，被许可方通过网络远程调用能力。这又细分为两种典型场景，即API调用模式（直接输出模型能力，被许可方需自行构建上层应用，按调用量、Token量等指标计费）和SaaS应用模式（交付封装好的终端功能，被许可方获得的是完整软件服务的使用权，但无法触及模型本身）。
本地环境交付：模型被部署到被许可方指定的自有服务器、私有云或内网环境中，常见形式包括私有化部署和一体机交付。模型权重文件（通常经加密或容器化）与运行环境整体移入本地，确保数据不出域，以满足金融、政务等高度敏感的合规要求。
集成再分发模式：许可方授权被许可方将模型能力集成进自有产品，并以被许可方品牌对外提供服务，形成“模型提供方—集成方—终端用户”的许可链条。具体表现为OEM或白标合作、嵌入式SDK许可等。此模式下，许可方通常并不直接面向终端用户。
源代码级交付：被许可方直接获得模型源码、完整权重、训练代码及数据集，拥有完全的修改和再训练权限。这通常只适用于完全开源的大模型，或深度合作的许可/定制开发场景。

不同模式对应不同风险关注点，双方需要根据交易的模式分析潜在风险和应对方案。举例而言，从控制权来看，从API/SaaS交付到源代码级交付，许可方对模型的控制力逐渐减弱，被许可方的自主权则逐步增强，这意味着未经授权访问、逆向工程或越权使用的风险敞口与管控难度均有所不同；从知识产权角度，API与SaaS模式通常不涉及模型本身的权属变动，被许可方获得的仅是使用权，而微调定制或源代码级交付则可能产生新的衍生成果，模型权属、增量参数的归属以及后续商业化利用的边界，必须通过合同条款明确约定；在责任分配层面，集成再分发模式引入了“模型提供方—集成方—终端用户”的多层链条，一旦发生输出错误、侵权或安全事故，责任回溯与划分将更为复杂。

2. 许可标的

许可标的应当尽量具体。协议中不宜仅写“许可方许可被许可方使用AI大模型技术”，因为这一表述对双方而言都未说清楚许可的技术究竟是什么，自然也难以判断交付是否充分。

建议的做法是，在协议正文或附件中列明许可标的/交付物。例如，许可内容是否包括基础模型、模型权重、模型参数、API接口、SDK、容器镜像、源代码、部署文档、训练或微调工具等。不同标的的开放程度和风险完全不同。仅开放API接口时，许可方仍然控制模型本体；一旦交付模型权重、微调工具链或部署文档，被许可方就可能更深地接触许可技术的核心能力。

同时，协议也可以反向列明不在许可范围内的内容。例如，不许可源代码，不许可模型权重，不许可训练数据，不许可底层训练方法，不许可商标和模型名称，不许可未来版本或其他迭代更新等。对于许可方而言，这类反向排除条款并非多余，而是防止许可标的被事后扩大解释的重要依据。

3. 许可范围

许可范围是许可协议的核心条款，通常围绕使用主体、使用目的、使用领域、地域、期限和数量限制展开。

首先是使用主体。协议应明确被许可方是否仅限自身使用，是否包括关联公司、员工、顾问、外包商、客户或最终用户。如果允许关联公司使用，应明确关联公司范围、责任承担方式和许可方的审计权。如果允许外包商或集成商接触模型能力，应要求取得许可方的事先审批，或至少要求其承担不低于被许可方的保密和安全义务。

其次是使用目的。许可模型是仅用于内部测试、内部办公、内部研发，还是用于客户项目交付、产品集成、商业化销售、白标服务？许可方可以针对不同用途设置不同费用、审批条件和使用限制。尤其是对外商业化使用，应明确终端用户管理、内容审核、生成内容标识、投诉处理和监管配合责任。

再次是使用领域。部分行业场景具有更高风险，例如医疗、金融、法律、教育、政务、自动驾驶等。许可方可以根据自身模型能力和合规承受能力，限制被许可方在特定高风险领域使用，或要求其在专业人员复核、用户提示、风险披露和监管审批方面承担更高义务。

此外，协议还可以明确地域、期限、用户数、设备数、调用量、Token额度、并发量、模型实例数量等限制。《民法典》允许技术许可合同约定实施专利或者使用技术秘密的范围，但不得排除/限制竞争和技术发展。因此，若约定行业/领域/竞争限制，应注意边界和必要性，避免将合理的许可范围控制写成可能产生排除或限制竞争效果的条款。

4. 使用限制

AI大模型许可协议中，使用限制条款往往和授权条款同样重要。授权条款解决“可以做什么”，使用限制条款则约定许可方最为关注的禁止或限制行为，比如禁止被许可方绕开商业安排反向获取许可方的核心模型能力。

在AI大模型许可交易中，较为重要且常见的使用限制事项有：

(1) 禁止反向工程和模型提取：被许可方不得反编译、反汇编、反向工程，不得绕过访问控制，不得通过自动化测试、高频调用、批量提示、输出采样等方式，提取模型能力、还原模型参数或推断训练数据。

(2) 禁止模型蒸馏和竞品训练：模型蒸馏简单说就是用一个能力较强的大模型去“教”另一个小模型。如果被许可方大量调用许可模型并收集输出结果，再用这些结果训练自己的模型，可能实质上是在利用许可方模型能力开发替代产品。

(3) 禁止规避安全措施：即被许可方不得删除、篡改、隐匿或规避水印、生成内容标识、安全过滤、速率限制、权限控制、系统提示词或其他安全机制。该条不仅关系到许可方的技术控制，也关系到内容安全和监管责任。

5. 输入数据的使用权

在AI大模型许可交易中，用户输入数据能否被许可方用于模型训练，是双方都十分关注的问题。被许可方的核心关切在于，输入大模型的数据可能包含商业秘密、客户信息或个人信息，一旦许可方将这些数据用于基础模型训练，相关内容存在随模型输出被第三方间接获取的风险。而许可方则认为，真实用户数据是优化模型性能、修正错误、提升安全性的关键资源，完全禁止使用将限制其产品的持续迭代能力，因而希望保留使用用户数据优化模型的权利。这种核心利益的对立，使得数据使用权条款成为交易谈判中不可回避的焦点。

根据笔者经验，实操中并非只有“允许”或“禁止”两种选择。较为常见的方案是许可方经被许可方事前书面授权（比如点击同意按钮）后可使用，但需限定目的、范围与保存期限；而对于金融、医疗、政府等敏感行业，通常被许可方会明确要求禁止许可方使用。其他可行的方案还包括：仅允许使用经匿名化且聚合多客户的数据用于模型训练，或约定输入数据仅可用于该被许可方的专属模型优化，不得用于改进通用基础模型。在API或者SaaS形式许可场景下，用户协议或隐私政策中可能含有概括授权条款，被许可方应注意识别，若不同意这类格式条款安排，可考虑通过协议明确排除此类格式条款的适用。

此外需要注意的是，如果交易涉及跨境调用、跨境部署、境外人员访问、境外服务器存储或境外模型服务商参与，还应进一步评估个人信息出境、重要数据识别和出境、技术和管制物项出口等合规要求。

6. 微调成果

在某些许可交易形态下，被许可方有可能会对许可的AI大模型进行微调，以适应被许可方所在行业的商业化需求。一方面，微调可能需要投入客户数据、行业知识、标注结果等数据；另一方面，微调成果又往往依附于许可方的基础模型、权重结构和训练工具。

从技术上看，不同微调方式对基础模型的依附程度并不相同。对于prompt模板、RAG（retrieval-augmented generation）知识库等轻量化或外挂式微调成果，新增部分可能相对独立识别，由此产生的前景知识产权较易区分；但对于直接修改基础模型权重的全量微调，微调后的模型往往表现为一个整体权重包，新增成果与许可方基础模型深度融合，难以在实际使用中清晰切割产生的前景知识产权。

对于上文提到的无法清晰剥离的情况，前景知识产权的物理边界是模糊的，只能依靠合同条款来拟制权利的边界。实务中较为常见的安排是约定微调成果由双方共同所有，或约定基础模型归属许可方不变但微调增量部分归属被许可方。前者的难题在于共有权利的行使规则，后者的难题在于增量部分在技术上无法独立存在，离开基础模型便无法使用。两种路径各有取舍，但都需要配套清晰的使用权限安排（即双方各自在何种权限范围内可以使用微调后的大模型），否则权属约定将流于形式而无法最终落地。

7. 合规责任分配

AI大模型许可协议中，合规责任分配一般取决于向终端用户提供AI服务场景下双方扮演的角色，是使用者、服务提供者，还是技术支持者。以《互联网信息服务深度合成管理规定》为例，深度合成服务提供者、深度合成服务技术支持者和深度合成服务使用者所应承担的合规义务差异明显。

如许可方仅提供底层模型、被许可方以自身产品对外提供服务，协议一般应明确由被许可方负责终端服务侧的合规义务，包括用户协议、隐私政策、用户管理、内容审核、投诉举报、日志留存、生成内容标识、算法备案或安全评估等事项；如果许可方为服务提供者，被许可方仅是使用AI服务，那么许可方将作为服务提供者承担主要的合规义务。

因此，为明确双方的合规责任，避免后续因为合规义务履行产生分歧，笔者建议根据在服务提供、技术支持和使用环节中的角色，明确双方在算法备案、安全评估、内容标识、用户管理、数据保护、监管配合等方面的具体义务。

结语

AI大模型许可协议不宜简单套用传统软件许可或一般技术服务协议的模板。笔者建议从具体交易模式出发，围绕模型开放程度、数据如何流动、模型使用限制、微调成果归属等商务细节搭建协议框架。尤其在私有化部署、微调合作、白标集成等深度合作场景下，协议条款应力求在技术开放和管控之间实现平衡。

另外，关于许可费支付、陈述保证、侵权赔偿、抗辩控制、责任限制等条款，仍应按照技术许可协议的一般逻辑进行设计。具体可参考笔者此前发表的系列文章《技术许可“攻守道”（一）——软件许可关键条款解析》《技术许可“攻守道”（二）——IP侵权相关条款设计》。（见相关阅读）

资深软件开发工程师黄俊林先生亦对本文有贡献。

The content of this article is intended to provide a general guide to the subject matter. Specialist advice should be sought about your specific circumstances.

[View Source]