谈大模型“知识蒸馏”技术的著作权争议——兼评DeepSeek被指控侵权事件_最新动态

首页 > 最新动态 > 谈大模型“知识蒸馏”技术的著作权争议——兼评DeepSeek被指控侵权事件

最新动态

谈大模型“知识蒸馏”技术的著作权争议——兼评DeepSeek被指控侵权事件

2025-03-12738

转自公众号：国浩律师事务所
http://mp.weixin.qq.com/s?__biz=MjM5MjUwNjE4NA==&mid=2651524539&idx=1&sn=3b357a7d754e7912ffc0ef700c50853e

引言：2025年初，由杭州深度求索人工智能基础技术研究有限公司开发的生成式人工智能产品DeepSeek以其优越的性能、低廉的成本和开源策略迅速占领市场，轰动全球。但与此同时，OpenAI公司公开指责DeepSeek利用“知识蒸馏”技术侵犯了OpenAI公司的合法权利，对于OpenAI的侵权指控，理论界及实务界看法不一，本文将介绍“知识蒸馏”技术的工作原理，分析大模型“知识蒸馏”技术的著作权争议，并对DeepSeek所涉侵权争议提出看法。

目录

一、“知识蒸馏”的主要工作原理和侵权判断路径

二、“知识蒸馏”著作权侵权判断第一步——人工智能生成内容的可著作权性

三、“知识蒸馏”著作权侵权判断第二步——人工智能生成内容的权利归属

四、“知识蒸馏”著作权侵权判断第三步——合理或合法使用抗辩

五、结语

Part01.

“知识蒸馏”的主要工作原理和侵权判断路径

技术角度而言，“知识蒸馏”属于迁移学习的一种，主要原理可以总结为：首先选定已经较为成熟的“教师模型”（大模型），并在“教师模型”中输入某一类别的内容，获取大量“教师模型”的输出结果后，通过技术手段总结“教师模型”所有输出结果中的相似之处，并作为用于训练“学生模型”（小模型）的语料^[注1]，从而使得“学生模型”绕开前期巨量的数据学习所消耗的经济、时间成本，而就某一类别的内容取得与“教师模型”尽可能接近的输出效果。从法律角度而言，“知识蒸馏”可以总结为：先使用他人的大模型产品而取得相关数据，继而通过技术手段将已经取得的数据进行处理，最终将经处理的数据用于训练自己的大模型产品。“知识蒸馏”技术极大地降低了大模型产品的入场门槛，对提高市场上大模型产品的平均质量起到了巨大的作用。但对此有人指出，“知识蒸馏”抓取他人数据用于训练自己的大模型产品并获取商业利益，构成著作权侵权。

由上述，“知识蒸馏”并未通过直接接触“教师模型”的内部参数，而仅仅是总结、处理“教师模型”在输出层面的结果并用于训练“学生模型”，因此“知识蒸馏”可能涉及的著作权争议也只可能在于数据抓取这一行为的合法与否。笔者认为，“知识蒸馏”是否构成著作权侵权可以用三步法进行分析、评价。

Part02.

“知识蒸馏”著作权侵权判断第一步——人工智能生成内容的可著作权性

判断教师模型所输出的内容能否被著作权法保护是论证“知识蒸馏”是否构成著作权侵权的一大前提，如果大模型生成的内容本身不能被《著作权法》所保护，那么“学生模型”抓取、处理“教师模型”所生成内容的行为就不会构成著作权侵权。事实上，关于人工智能生成内容的著作权属性已经成为近年来理论界的热点话题，学者观点不一。但理论上而言，在我国《著作权法》的规制体系下，将人工智能视为人类的工具^[注2]，将人工智能生成内容类比于人类利用相机拍出的相片，进而认定人工智能生成内容的著作权由使用者合法享有是能够成立的。而在司法实践角度，虽然我国法院直接就人工智能生成内容是否能取得著作权的案例较少，但近年公开披露的案例中，法院大多倾向于认为：如果人工智能使用者在使用时能够体现人类的创造性，且生成内容能够在外观上具有独创性，则可以认为人工智能生成内容构成我国《著作权法》下的作品^[注3]。

事实上，从目前市场中主流大模型产品的工作情况来看，现阶段大模型产品输出内容已经具备了类似于人类作品的独创性。另外对于国内大模型产品蒸馏国外成熟产品这一纠纷形态，即便在如美国等对人工智能生成内容秉持较为严格态度、不轻易认可著作权性的国家，如果国外大模型厂商认为中国大模型厂商违法蒸馏而前往中国起诉，根据《中华人民共和国涉外民事法律关系适用法》第五十条的规定，也不会面对被否认可著作权性的困境。因此应当认为，按照中国法律，在不违反《著作权法》第五条规定的情况下，人工智能生成内容大概率能够受到著作权法的保护。

美国则对人工智能生成内容的可著作权性持较为严格的态度。例如《美国版权局实践概要》即明确禁止对人工智能创作的作品予以版权登记，《版权注册指南》同样规定如果作品的创作要素系人工智能生成，则不能予以注册。^[注4]而从司法角度，美国法院在“猴子自拍案”^[注5]中即明确只有自然人的创作成果才能享有著作权，而由猴子拍摄的作品即便具备作品的外观，同样不能受到著作权法的保护；而在近年披露的Thaler v. Perlmutter案中，法官在判决中则明确指出人工智能生成内容不能得到著作权法保护。因此可以认为，目前美国司法体系普遍认为人工智能生成内容因难以体现独属于人类的独创性不具备可著作权性，而应被归入公共领域。

综上所述，鉴于ChatGPT服务协议中已经明确约定因ChatGPT所提供服务所引发的相关争议应当由NAM管辖并适用美国加州法律，因此按照美国目前司法实践情况，在ChatGPT所生成的内容难以被认为具备著作权性的情况下，即便DeepSeek确实利用“知识蒸馏”技术学习了ChatGPT生成内容，也不构成著作权侵权。但如果与“知识蒸馏”相关的侵权纠纷由中国法院进行管辖，在目前我国法院倾向于承认人工智能生成内容的可著作权性的情况下，则还需通过第二步予以判断是否构成侵权。

Part03.

“知识蒸馏”著作权侵权判断第二步——人工智能生成内容的权利归属

在人工智能生成内容可以得到著作权法保护的情况下，由于侵犯著作权的一大前提在于被侵权人享有该作品的著作权，因此判断“知识蒸馏”是否构成著作权侵权应当明确人工智能生成内容的著作权权利主体。在立法层面，我国并未明确规定人工智能生成内容的权利归属，而我国《生成式人工智能服务管理暂行办法》第九条则规定：“提供者应当与注册其服务的生成式人工智能服务使用者签订服务协议，明确双方权利义务。”因此，人工智能生成内容的权利归属应以约定为主。

而在实践中，目前市面上主流的大模型产品基本均已就生成内容的著作权归属进行了约定。如ChatGPT在服务协议^[注6]“CONTENT”部分明确约定使用ChatGPT所生成的内容一切权利均归属于使用者；DeepSeek在服务协议^[注7]中同样将生成内容的所有权利授予了使用者；而国产人工智能另一明星产品Kimi则仅授予使用者非商用生成内容的权利^[注8]；而文心一言则在用户协议^[注9]中明确约定由百度公司享有生成内容的相关权利。因此应当认为，如果“教师模型”厂商已经通过服务协议等形式将生成内容的著作权授予了使用者，那么“学生模型”产品厂商以“教师模型”所生成的内容训练“学生模型”在中国著作权法视角下并不存在相关障碍，属于使用具有合法来源的数据。

鉴于ChatGPT在服务协议中已经明确约定生成内容的相关权利归属于使用人，而在“知识蒸馏”技术中，“学生模型”可以看作“教师模型”的使用人，因此即便根据中国法律体系，DeepSeek系蒸馏所需数据的合法著作权人，同样不构成侵权。但如果某种“教师模型”厂商已经明确保留了权利，那么“学生模型”“知识蒸馏”的行为就有可能构成著作权侵权，进而需要第三步判断。

Part04.

“知识蒸馏”著作权侵权判断第三步——合理或合法使用抗辩

在人工智能生成内容能够得到著作权法保护，并且“教师模型”依法依约对所生成的内容享有著作权的情况下，最终应当判断已经涉嫌侵犯著作权的“知识蒸馏”行为在特定法域内能否构成著作权的合理或特殊合法使用。我国《生成式人工智能服务管理暂行办法》第七条明确规定：生成式人工智能服务提供者应当依法开展预训练、优化训练等训练数据处理活动使用具有合法来源的数据和基础模型，涉及知识产权的，不得侵害他人依法享有的知识产权。根据此款规定，中国法律体系下人工智能抓取数据这一行为并不存在特殊豁免方案，而在中国《著作权法》合理使用规则体系中，留给“知识蒸馏”的空间极为有限，基本上只可能局限于在个人出于研究的目的非商业性质建构大模型这一情况下。因此依照中国法律，对于市场中广泛存在的商用大模型而言，一旦在步骤一、二中未能获得著作权侵权豁免的事由，则“知识蒸馏”大概率将构成著作权侵权。

与中国类似，美国对训练人工智能的数据来源规定同样较为严格，豁免空间主要见于美国《著作权法》第一百零七条规定的合理使用制度，即判断是否构成著作权合理使用需要综合考量使用目的、著作权作品自身性质、所使用的数量与质量、对作品潜在市场或价值的影响四个要素。但在“知识蒸馏”这一侵权形态下^[注10]，由于“学生模型”大概率商用，且很可能与“教师模型”予以正面竞争，“学生模型”需要担负较高的举证责任才可能自著作权侵权中得以豁免。

而区别于中美对于数据来源较为严格的规制，全球领域内某些国家则对人工智能抓取数据这一行为作出了豁免性的规定。例如根据新加坡《著作权法》第243^[注11]、244^[注12]条的规定，只要第三方出于“计算机分析”的目的，且能够通过合法方式获取数据，那么就可以绕开作品著作权保护的限制直接使用该作品作为训练人工智能大模型的语料。并且根据新加坡《著作权法》第187条^[注13]的规定，该合法使用规定不能被合同约定排除适用；除此之外，日本《著作权法》第三十条第四款^[注14]、第四十七条第五款^[注15]则对以非欣赏性的“信息解析”在法律上进行了著作权侵权豁免，依照日本法律，自“教师模型”获取数据以训练“学生模型”可以纳入到“信息解析”的概念当中，从而免除“知识蒸馏”潜在的著作权侵权责任。

如前所述，在对于数据来源秉持较为宽松态度的国家中，即便在人工智能生成内容能够得到著作权法保护，并且“教师模型”依法享有著作权的情况下，“知识蒸馏”的行为同样可以得以豁免，因此在判断“知识蒸馏”是否构成著作权侵权之时，应当充分考虑到所在法域的特殊性规定，从而客观、全面地得出结论。

Part05.

结语

综上所述，经前述“三步法”著作权侵权判断，不论从中国法还是美国法的视角，国内外对于DeepSeek“知识蒸馏”侵犯OpenAI公司著作权的指控均是难以成立的。但如果将目光不仅仅局限于著作权侵权这一形态，“知识蒸馏”这一技术事实上还存在潜在的合同违约及不正当竞争的法律风险。例如：ChatGPT在服务协议“Using our Services”部分明确禁止用户使用ChatGPT的输出内容开发与ChatGPT存在竞争关系的模型（Use Output to develop models that compete with OpenAI）。在此种情况下，虽然对ChatGPT进行“知识蒸馏”并不侵犯OpenAI公司所享有的著作权，但可能构成合同违约；与此同时，如果“知识蒸馏”在某一法域下被认定为合同违约或违反商业道德，且在商业上对“教师模型”产生了一定的负面影响，则可能在不同法域内构成不正当竞争。但需要指出的是，OpenAI公司对于DeepSeek的指控，不论是基于何种案由，OpenAI公司均需要就DeepSeek进行了“知识蒸馏”这一行为及其违法性承担举证责任，并充分论证这一行为对ChatGPT产生了何种影响，否则既有侵犯初创企业名誉权之责，又有对行业后起之秀政治偏见之嫌。指控应当基于证据与逻辑，而非基于傲慢与偏见。

注释及参考文献

上下滑动查看全部

[1] 邵仁荣、刘宇昂、张伟、王骏，《深度学习中“知识蒸馏”研究综述》，《计算机学报》

[2] 也即理论界“工具说”

[3] 如（2019）粤0305民初14010号案，（2023）京0491民初11279号案等

[4] 人工智能生成内容（AIGC）的著作权问题探析，刘东、陈超逸、杜逸白，https://law.wkinfo.com.cn/professional-articles/detail/NjAwMDAyMTI5NDY%3D?q=AIGC%20%E8%91%97%E4%BD%9C%E6%9D%83&module=&childModule=all&from=editorial&searchId=07efeca69d264a9fb3ac83f5ab60e01f

[5] Naruto v. Slater

[6] https://openai.com/policies/terms-of-use/

[7] https://cdn.deepseek.com/policies/zh-CN/deepseek-terms-of-use.html

[8] https://platform.moonshot.cn/docs/agreement/modeluse#%E5%85%B3%E4%BA%8E%E7%94%9F%E6%88%90%E5%86%85%E5%AE%B9%E7%9A%84%E7%9F%A5%E8%AF%86%E4%BA%A7%E6%9D%83

[9] https://yiyan.baidu.com/infoUser/#olz3wy1lj

[10] 此时假设人工智能生成内容在某种特殊情况下得到了美国法院的著作权认可。

[11] In this Division, “computational data analysis”, in relation to a work or a recording of a protected performance, includes —(a) using a computer program to identify, extract and analyse information or data from the work or recording; and (b) using the work or recording as an example of a type of information or data to improve the functioning of a computer program in relation to that type of information or data.

[12] 244.—(1) If the conditions in subsection (2) are met, it is a permitted use for a person (X) to make a copy of any of the following material:(a) a work;(b) a recording of a protected performance.(2) The conditions are —(a) the copy is made for the purpose of —(i) computational data analysis; or (ii) preparing the work or recording for computational data analysis; (b) X does not use the copy for any other purpose; (c) X does not supply (whether by communication or otherwise) the copy to any person other than for the purpose of — (i) verifying the results of the computational data analysis carried out by X; or (ii) collaborative research or study relating to the purpose of the computational data analysis carried out by X; (d) X has lawful access to the material (called in this section the first copy) from which the copy is made; and . Illustrations (a) X does not have lawful access to the first copy if X accessed the first copy by circumventing paywalls. (b) X does not have lawful access to the first copy if X accessed the first copy in breach of the terms of use of a database (ignoring any terms that are void by virtue of section 187). (e) one of the following conditions is met: (i) the first copy is not an infringing copy; (ii) the first copy is an infringing copy but — (A) X does not know this; and (B) if the first copy is obtained from a flagrantly infringing online location (whether or not the location is subject to an access disabling order under section 325) — X does not know and could not reasonably have known that; (iii) the first copy is an infringing copy but —(A) the use of infringing copies is necessary for a prescribed purpose; and (B) X does not use the copy to carry out computational data analysis for any other purpose. (3) To avoid doubt, a reference in subsection (1) to making a copy includes a reference to storing or retaining the copy. (4) It is a permitted use for X to communicate a work or a recording of a protected performance to the public if — (a) the communication is made using a copy made in circumstances to which subsection (1) applies; and (b) X does not supply (whether by communication or otherwise) the copy to any person other than for the purpose of — (i) verifying the results of the computational data analysis carried out by X; or (ii) collaborative research or study relating to the purpose of the computational data analysis carried out by X. (5) For the purposes of this Act, the supply of copies of any material in circumstances to which this section applies —2020 Ed. Copyright Act 2021 164 Informal Consolidation – version in force from 1/11/2022 (a) is not to be treated as publishing the material (or any work or recording included in the material); and (b) must be ignored in determining the duration of any copyright in the material (or the included work).

[13] 187.—(1) Any contract term is void to the extent that it purports,directly or indirectly, to exclude or restrict any permitted use under any provision in (a) Division 6 (public collections), but not section 234 (supplying copies of published literary, dramatic or musical works or articles between libraries and archives); (b) Division 7 (computer programs); (c) Division 8 (computational data analysis); or (d) Division 17 (judicial proceedings and legal advice).

(2) Without limiting subsection (1), a contract term is void to the extent that it purports, directly or indirectly, to prevent or restrict the doing of any of the following acts in circumstances that constitute a permitted use under the provisions mentioned in subsection (1): (a) making a copy of a work or a recording of a protected performance; (b) supplying (whether by communication or otherwise) a copy of a work or a recording of a performance; (c) performing a work or a recording of a protected performance. (3) This section applies to any contract made before, on or after 21 November 2021.

[14] 第三十条の四：著作物は、次に掲げる場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には、その必要と認められる限度において、いずれの方法によるかを問わず、利用することができる。ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。一　著作物の録音、録画その他の利用に係る技術の開発又は実用化のための試験の用に供する場合二　情報解析（多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行うことをいう。第四十七条の五第一項第二号において同じ。）の用に供する場合三　前二号に掲げる場合のほか、著作物の表現についての人の知覚による認識を伴うことなく当該著作物を電子計算機による情報処理の過程における利用その他の利用（プログラムの著作物にあつては、当該著作物の電子計算機における実行を除く。）に供する場合（図書館等における複製等）

[15] 第四十七条の五　電子計算機を用いた情報処理により新たな知見又は情報を創出することによつて著作物の利用の促進に資する次の各号に掲げる行為を行う者（当該行為の一部を行う者を含み、当該行為を政令で定める基準に従つて行う者に限る。）は、公衆への提供等（公衆への提供又は提示をいい、送信可能化を含む。以下同じ。）が行われた著作物（以下この条及び次条第二項第二号において「公衆提供等著作物」という。）（公表された著作物又は送信可能化された著作物に限る。）について、当該各号に掲げる行為の目的上必要と認められる限度において、当該行為に付随して、いずれの方法によるかを問わず、利用（当該公衆提供等著作物のうちその利用に供される部分の占める割合、その利用に供される部分の量、その利用に供される際の表示の精度その他の要素に照らし軽微なものに限る。以下この条において「軽微利用」という。）を行うことができる。ただし、当該公衆提供等著作物に係る公衆への提供等が著作権を侵害するものであること（国外で行われた公衆への提供等にあつては、国内で行われたとしたならば著作権の侵害となるべきものであること）を知りながら当該軽微利用を行う場合その他当該公衆提供等著作物の種類及び用途並びに当該軽微利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。一　電子計算機を用いて、検索により求める情報（以下この号において「検索情報」という。）が記録された著作物の題号又は著作者名、送信可能化された検索情報に係る送信元識別符号（自動公衆送信の送信元を識別するための文字、番号、記号その他の符号をいう。第百十三条第二項及び第四項において同じ。）その他の検索情報の特定又は所在に関する情報を検索し、及びその結果を提供すること。二　電子計算機による情報解析を行い、及びその結果を提供すること。三　前二号に掲げるもののほか、電子計算機による情報処理により、新たな知見又は情報を創出し、及びその結果を提供する行為であつて、国民生活の利便性の向上に寄与するものとして政令で定めるもの２　前項各号に掲げる行為の準備を行う者（当該行為の準備のための情報の収集、整理及び提供を政令で定める基準に従つて行う者に限る。）は、公衆提供等著作物について、同項の規定による軽微利用の準備のために必要と認められる限度において、複製若しくは公衆送13信（自動公衆送信の場合にあつては、送信可能化を含む。以下この項及び次条第二項第二号において同じ。）を行い、又はその複製物による頒布を行うことができる。ただし、当該公衆提供等著作物の種類及び用途並びに当該複製又は頒布の部数及び当該複製、公衆送信又は頒布の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。（翻訳、翻案等による利用）

来源|国浩律师事务所

点我访问原文链接