转自公众号:国浩律师事务所
http://mp.weixin.qq.com/s?__biz=MjM5MjUwNjE4NA==&mid=2651524539&idx=1&sn=3b357a7d754e7912ffc0ef700c50853e
引言:2025年初,由杭州深度求索人工智能基础技术研究有限公司开发的生成式人工智能产品DeepSeek以其优越的性能、低廉的成本和开源策略迅速占领市场,轰动全球。但与此同时,OpenAI公司公开指责DeepSeek利用“知识蒸馏”技术侵犯了OpenAI公司的合法权利,对于OpenAI的侵权指控,理论界及实务界看法不一,本文将介绍“知识蒸馏”技术的工作原理,分析大模型“知识蒸馏”技术的著作权争议,并对DeepSeek所涉侵权争议提出看法。
目 录
一、“知识蒸馏”的主要工作原理和侵权判断路径
二、“知识蒸馏”著作权侵权判断第一步——人工智能生成内容的可著作权性
三、“知识蒸馏”著作权侵权判断第二步——人工智能生成内容的权利归属
四、“知识蒸馏”著作权侵权判断第三步——合理或合法使用抗辩
五、结语
Part01.
“知识蒸馏”的主要工作原理和侵权判断路径
技术角度而言,“知识蒸馏”属于迁移学习的一种,主要原理可以总结为:首先选定已经较为成熟的“教师模型”(大模型),并在“教师模型”中输入某一类别的内容,获取大量“教师模型”的输出结果后,通过技术手段总结“教师模型”所有输出结果中的相似之处,并作为用于训练“学生模型”(小模型)的语料[注1],从而使得“学生模型”绕开前期巨量的数据学习所消耗的经济、时间成本,而就某一类别的内容取得与“教师模型”尽可能接近的输出效果。从法律角度而言,“知识蒸馏”可以总结为:先使用他人的大模型产品而取得相关数据,继而通过技术手段将已经取得的数据进行处理,最终将经处理的数据用于训练自己的大模型产品。“知识蒸馏”技术极大地降低了大模型产品的入场门槛,对提高市场上大模型产品的平均质量起到了巨大的作用。但对此有人指出,“知识蒸馏”抓取他人数据用于训练自己的大模型产品并获取商业利益,构成著作权侵权。
由上述,“知识蒸馏”并未通过直接接触“教师模型”的内部参数,而仅仅是总结、处理“教师模型”在输出层面的结果并用于训练“学生模型”,因此“知识蒸馏”可能涉及的著作权争议也只可能在于数据抓取这一行为的合法与否。笔者认为,“知识蒸馏”是否构成著作权侵权可以用三步法进行分析、评价。
Part02.
“知识蒸馏”著作权侵权判断第一步——人工智能生成内容的可著作权性
判断教师模型所输出的内容能否被著作权法保护是论证“知识蒸馏”是否构成著作权侵权的一大前提,如果大模型生成的内容本身不能被《著作权法》所保护,那么“学生模型”抓取、处理“教师模型”所生成内容的行为就不会构成著作权侵权。事实上,关于人工智能生成内容的著作权属性已经成为近年来理论界的热点话题,学者观点不一。但理论上而言,在我国《著作权法》的规制体系下,将人工智能视为人类的工具[注2],将人工智能生成内容类比于人类利用相机拍出的相片,进而认定人工智能生成内容的著作权由使用者合法享有是能够成立的。而在司法实践角度,虽然我国法院直接就人工智能生成内容是否能取得著作权的案例较少,但近年公开披露的案例中,法院大多倾向于认为:如果人工智能使用者在使用时能够体现人类的创造性,且生成内容能够在外观上具有独创性,则可以认为人工智能生成内容构成我国《著作权法》下的作品[注3]。
事实上,从目前市场中主流大模型产品的工作情况来看,现阶段大模型产品输出内容已经具备了类似于人类作品的独创性。另外对于国内大模型产品蒸馏国外成熟产品这一纠纷形态,即便在如美国等对人工智能生成内容秉持较为严格态度、不轻易认可著作权性的国家,如果国外大模型厂商认为中国大模型厂商违法蒸馏而前往中国起诉,根据《中华人民共和国涉外民事法律关系适用法》第五十条的规定,也不会面对被否认可著作权性的困境。因此应当认为,按照中国法律,在不违反《著作权法》第五条规定的情况下,人工智能生成内容大概率能够受到著作权法的保护。
美国则对人工智能生成内容的可著作权性持较为严格的态度。例如《美国版权局实践概要》即明确禁止对人工智能创作的作品予以版权登记,《版权注册指南》同样规定如果作品的创作要素系人工智能生成,则不能予以注册。[注4]而从司法角度,美国法院在“猴子自拍案”[注5]中即明确只有自然人的创作成果才能享有著作权,而由猴子拍摄的作品即便具备作品的外观,同样不能受到著作权法的保护;而在近年披露的Thaler v. Perlmutter案中,法官在判决中则明确指出人工智能生成内容不能得到著作权法保护。因此可以认为,目前美国司法体系普遍认为人工智能生成内容因难以体现独属于人类的独创性不具备可著作权性,而应被归入公共领域。
综上所述,鉴于ChatGPT服务协议中已经明确约定因ChatGPT所提供服务所引发的相关争议应当由NAM管辖并适用美国加州法律,因此按照美国目前司法实践情况,在ChatGPT所生成的内容难以被认为具备著作权性的情况下,即便DeepSeek确实利用“知识蒸馏”技术学习了ChatGPT生成内容,也不构成著作权侵权。但如果与“知识蒸馏”相关的侵权纠纷由中国法院进行管辖,在目前我国法院倾向于承认人工智能生成内容的可著作权性的情况下,则还需通过第二步予以判断是否构成侵权。
Part03.
“知识蒸馏”著作权侵权判断第二步——人工智能生成内容的权利归属
在人工智能生成内容可以得到著作权法保护的情况下,由于侵犯著作权的一大前提在于被侵权人享有该作品的著作权,因此判断“知识蒸馏”是否构成著作权侵权应当明确人工智能生成内容的著作权权利主体。在立法层面,我国并未明确规定人工智能生成内容的权利归属,而我国《生成式人工智能服务管理暂行办法》第九条则规定:“提供者应当与注册其服务的生成式人工智能服务使用者签订服务协议,明确双方权利义务。”因此,人工智能生成内容的权利归属应以约定为主。
而在实践中,目前市面上主流的大模型产品基本均已就生成内容的著作权归属进行了约定。如ChatGPT在服务协议[注6]“CONTENT”部分明确约定使用ChatGPT所生成的内容一切权利均归属于使用者;DeepSeek在服务协议[注7]中同样将生成内容的所有权利授予了使用者;而国产人工智能另一明星产品Kimi则仅授予使用者非商用生成内容的权利[注8];而文心一言则在用户协议[注9]中明确约定由百度公司享有生成内容的相关权利。因此应当认为,如果“教师模型”厂商已经通过服务协议等形式将生成内容的著作权授予了使用者,那么“学生模型”产品厂商以“教师模型”所生成的内容训练“学生模型”在中国著作权法视角下并不存在相关障碍,属于使用具有合法来源的数据。
鉴于ChatGPT在服务协议中已经明确约定生成内容的相关权利归属于使用人,而在“知识蒸馏”技术中,“学生模型”可以看作“教师模型”的使用人,因此即便根据中国法律体系,DeepSeek系蒸馏所需数据的合法著作权人,同样不构成侵权。但如果某种“教师模型”厂商已经明确保留了权利,那么“学生模型”“知识蒸馏”的行为就有可能构成著作权侵权,进而需要第三步判断。
Part04.
“知识蒸馏”著作权侵权判断第三步——合理或合法使用抗辩
在人工智能生成内容能够得到著作权法保护,并且“教师模型”依法依约对所生成的内容享有著作权的情况下,最终应当判断已经涉嫌侵犯著作权的“知识蒸馏”行为在特定法域内能否构成著作权的合理或特殊合法使用。我国《生成式人工智能服务管理暂行办法》第七条明确规定:生成式人工智能服务提供者应当依法开展预训练、优化训练等训练数据处理活动使用具有合法来源的数据和基础模型,涉及知识产权的,不得侵害他人依法享有的知识产权。根据此款规定,中国法律体系下人工智能抓取数据这一行为并不存在特殊豁免方案,而在中国《著作权法》合理使用规则体系中,留给“知识蒸馏”的空间极为有限,基本上只可能局限于在个人出于研究的目的非商业性质建构大模型这一情况下。因此依照中国法律,对于市场中广泛存在的商用大模型而言,一旦在步骤一、二中未能获得著作权侵权豁免的事由,则“知识蒸馏”大概率将构成著作权侵权。
与中国类似,美国对训练人工智能的数据来源规定同样较为严格,豁免空间主要见于美国《著作权法》第一百零七条规定的合理使用制度,即判断是否构成著作权合理使用需要综合考量使用目的、著作权作品自身性质、所使用的数量与质量、对作品潜在市场或价值的影响四个要素。但在“知识蒸馏”这一侵权形态下[注10],由于“学生模型”大概率商用,且很可能与“教师模型”予以正面竞争,“学生模型”需要担负较高的举证责任才可能自著作权侵权中得以豁免。
而区别于中美对于数据来源较为严格的规制,全球领域内某些国家则对人工智能抓取数据这一行为作出了豁免性的规定。例如根据新加坡《著作权法》第243[注11]、244[注12]条的规定,只要第三方出于“计算机分析”的目的,且能够通过合法方式获取数据,那么就可以绕开作品著作权保护的限制直接使用该作品作为训练人工智能大模型的语料。并且根据新加坡《著作权法》第187条[注13]的规定,该合法使用规定不能被合同约定排除适用;除此之外,日本《著作权法》第三十条第四款[注14]、第四十七条第五款[注15]则对以非欣赏性的“信息解析”在法律上进行了著作权侵权豁免,依照日本法律,自“教师模型”获取数据以训练“学生模型”可以纳入到“信息解析”的概念当中,从而免除“知识蒸馏”潜在的著作权侵权责任。
如前所述,在对于数据来源秉持较为宽松态度的国家中,即便在人工智能生成内容能够得到著作权法保护,并且“教师模型”依法享有著作权的情况下,“知识蒸馏”的行为同样可以得以豁免,因此在判断“知识蒸馏”是否构成著作权侵权之时,应当充分考虑到所在法域的特殊性规定,从而客观、全面地得出结论。
Part05.
结 语
综上所述,经前述“三步法”著作权侵权判断,不论从中国法还是美国法的视角,国内外对于DeepSeek“知识蒸馏”侵犯OpenAI公司著作权的指控均是难以成立的。但如果将目光不仅仅局限于著作权侵权这一形态,“知识蒸馏”这一技术事实上还存在潜在的合同违约及不正当竞争的法律风险。例如:ChatGPT在服务协议“Using our Services”部分明确禁止用户使用ChatGPT的输出内容开发与ChatGPT存在竞争关系的模型(Use Output to develop models that compete with OpenAI)。在此种情况下,虽然对ChatGPT进行“知识蒸馏”并不侵犯OpenAI公司所享有的著作权,但可能构成合同违约;与此同时,如果“知识蒸馏”在某一法域下被认定为合同违约或违反商业道德,且在商业上对“教师模型”产生了一定的负面影响,则可能在不同法域内构成不正当竞争。但需要指出的是,OpenAI公司对于DeepSeek的指控,不论是基于何种案由,OpenAI公司均需要就DeepSeek进行了“知识蒸馏”这一行为及其违法性承担举证责任,并充分论证这一行为对ChatGPT产生了何种影响,否则既有侵犯初创企业名誉权之责,又有对行业后起之秀政治偏见之嫌。指控应当基于证据与逻辑,而非基于傲慢与偏见。
注释及参考文献
来源|国浩律师事务所