文/何智龙
现阶段,互联网已发展到了可读、可写、可拥有的技术阶段。人工智能生成内容(AI-Generated Content,以下简称AIGC)的生产行为不再主要依靠自然人、法人(此处的法人采法人实在说),而是通过可处理数据的算法。详言之,以Chat-GPT文本内容的生成为例,当使用者在对话框内输入一段关于生成内容要求的指令,AI可从数据库中抓取相应的内容,并依据用户的指令进行整理、排列、输出。AIGC的著作权归属问题学界争议不断,但在讨论著作权归属问题之前,应当对人工智能生成物的可版权性及其标准展开分析。
一、问题的提出
近年来,随着AIGC的爆炸式产生,带来了诸多法律难题。例如生成内容的权利设置问题、权属安排问题、交易规则适用等。现代社会人类对技术的依赖性不断提高,人工智能在人类创造性智力活动中愈发发挥着不可或缺的作用。在知识产权领域内,无论是保护思想表达的“作品”,还是保护技术方案的“专利”,都是人类智力活动的成果。AIGC的生成,是算法运作后,以现有数据库存储的数据为内容来源,以用户的需求指令为提要,运用已编辑后的程序输出的结果。无论创作方式如何变化,创作的成果若要被知识产权法保护,均应在“作品”“专利”的有效射程之内。
单就著作权而言,独创性是作品构成要素的核心要件,也是AIGC运用著作权法规则进行考察的前提。值得注意的是,立法并未释明关于独创性的具体认定标准。从立法例上看,早期英美法系版权法以“额头流汗”为独创性判断标准。但这一标准太过于宽泛,与著作权法鼓励创作的立法目的相背,且与《伯尔尼公约》的要求不符。以美国为代表的英美法系国家已明确放弃这一标准。我国著作权法第3条对著作权法保护作品的种类采用列举式、特征性的立法表述,并明确作品需为智力成果。最高人民法院在判决中指出:“《著作权法》保护的是具有独创性的作品,必须同时符合‘独创性’和‘最低限度的创造性’两个要件”
与传统作品版权赋予的两要件不同的是,AIGC的创作过程具有“非人类智力”的参与。欲明确AIGC的著作权归属问题,AIGC是否满足独创性标准及最低限度的创造性等仍属于当然考察事项。在此基础之上,AIGC的著作权归属问题才有讨论的空间。
二、AIGC版权赋予的客观必然
AIGC是否具有可版权性关键在于其是否满足著作权法项下作品的法律特征。生成式AI表现出了一般人类智力无法达到的运算、理解与思维能力。从内容上看,AIGC与纯人类创作的作品并无明显不同,2023年,清华大学新闻与传播学院教授沈阳,利用AI平台创作的科幻作品《机忆之地》在第五届江苏省青年科普科幻作品大赛评选中获评二等奖。足见,从技术使用端,站在人类总智力成果保护及使用的角度上看,AIGC确有可版权性的空间。
1.AIGC版权赋予的必要性
理论界,关于否认AIGC可版权性的主张者不在少数。其理由主要在于:其一,Chat-GPT全部条款(2022年12月13日版本)第1条使用限制第5款:禁止将机器生成内容对外以人为创作内容使用。似乎Chat-GPT研发者也将AIGC排除于可版权的范畴之内。其二,著作权法保护的权利主体为自然人、法人等,并不包含程序。诚如萨缪尔森教授所言,版权制度在历史上从来都仅对人授予版权。其三,司法实践中,有关判例指出:依据AI系统生成的报告具有一定的独创性,但并非自然人完成,因而不属于著作权法保护的作品。其四,从立法例上看,美国版权局于2023年发布新规称,由Stability
AI、Chat-GPT等AI自动生成的作品系由程序自主完成,且训练的数据是基于人类创作的作品,因此不受著作权法的保护。
实际上,研读反对AIGC可版权性的观点发现,其理由主要基于AIGC的内容完全无人类智力贡献、AI无法成为著作权的权利主体。首先,关于AIGC的“作品”认定。有学者指出,依据世界知识产权组织的权威解释,AIGC只要满足创作的标准:完全不是或基本不是从另一作品上抄袭而来,即可构成受著作权法保护的作品,而作品的用途、价值、社会评价不在考察之列。置言之,生成的内容满足创作的标准即可成为著作权法意义上的作品。其次,完全由AI生成的作品是否受著作权法保护属“伪命题”。AI仅是程序,不能自发的产出内容。在AIGC产生的过程中仍需要使用者对内容给予命令性指示,内容的来源、排列方式、篇章结构等可由使用者参与设计。例在一则判例中,法院认为AI生成的文章系主创团队在设定、模板、风格上的自主取舍与安排,符合《著作权法实施条例》中“创作”的定义,因此认定案涉AIGC属于著作权法所保护的文字作品。再次,关于AI无法成为权利主体问题。计算机程序无法成为著作权法意义上的主体,并不影响AIGC的版权赋予,权利主体需要依据《著作权法》具体规则、AI开发公司开发权益、使用者思想的表达及社会公共利益等多方利益综合考量确定。正如吴汉东教授所言,今天的人工智能生成作品亦具有
“可版权性”。最后,2023年3月16日,美国版权局发布《版权登记指南:包含人工智能生成材料的作品》,该份文件表明:当且仅当AIGC具备作者的创造性想法、且由作者赋予表现形式时,才有可能获得版权法的保护。不难得出结论:AIGC是否构成作品的关键在于是否符合创作标准,置言之,使用者在整个AIGC产出过程中是否存在人类支配力决定着其是否可版权化。
2. AIGC的版权保护的法价值
法律的功能在于服务而非限制,知识产权法亦是权利保护法。从法价值层面讲,赋予AIGC著作权仍有以下三点理由:①从现行立法上来看,《著作权法》的立法目的见于第1条。简言之,著作权法的立法初衷在于保障作者能够从其创作中获得经济利益,进而鼓励创作。给予AIGC以版权保护有助于激励知识产权市场积极性,鼓励大众创作,万众创新。②从著作权法的发展来看,科技的进步一直推动着著作权制度的发展,给AIGC以版权化符合著作权法开放的法益保护体系。③从智能产业的发展来看,抛开AIGC的著作权归属问题,对AIGC赋予著作权可以促进更多的人投入AI技术的使用,用户的增多会当然的导致技术的发展。事实上,人类对科技的依赖及利用具有历史必然性,即使著作权法否认AIGC的版权性,也不可阻挡历史发展的潮流。
如上文所述,AIGC确有可版权性。让人不禁追问的是,AIGC的产生原理为何?用户创作智力如何体现?前者关乎从技术角度考察AIGC使用后台数据的合法性问题,后者注重作品的认定问题。
三、AIGC的产生路径审视
有学者认为,AIGC的技术路径可从生成程序和内容类型两个维度展开。生成程序又分为数据输入、机器学习和内容输出三个阶段,根据指令输入与内容输出的对应程度,可将输出内容分为孪生内容、伴生内容和原生内容。此种展开方法虽较好的解析了技术原理,但并未涉及著作权法相关问题。例如,倘若AIGC所抓取的数据本身是侵权行为,则据此产出的内容是否具有合法性?是否参照美国的“毒树之果”理论将产出内容排除于著作权法的保护范畴?对此,本文对AIGC产生的技术路径分析采“数据储备”及“人—机输出”二分法展开,综合审视其中包含的技术与法律问题。
1.第一阶段:数据储备阶段
现阶段的数据储备,是指智能程序依据算法赋予其自动抓取数据的功能,并将数据整理后存储于数据库以备用户之需的过程。汤姆•米切尔(Tom
M. Mitchell)将这一过程定义为机器学习,并认为机器学习的内涵为:计算机程序从经验E中学习并完成任务T,机器学习就是提高完成任务的性能P,进而实现P如何随着经验积累自动提高。具体而言,可再分为三个步骤,第一步,将收集到的数据嵌入数据模型;第二步,依据算法的处理、运算能力对数据进行分析以待用户指令;第三步,对用户指令进行数据化分解,依据第二步的数据输出内容。其中第三步输出阶段需对用户贡献度展开分析,于后文展开论述。
第一阶段需关心的问题是,第一步中数据收集的法律性质。学界主要有授权许可说、合理使用说和法定许可说。三种学说属于著作权行使和著作权限制的不同领域,这其中涉及到著作权法上“合理使用”的界定问题。采授权许可说者认为,为保障智力成果创作者的利益,数据收集需经原作品作者的许可。该观点的不足在于,限制了AI直接抓取数据,等同于间接限制了使用AI技术创作,这与著作权法鼓励创作的立法目的并不相符。合理使用说者认为,为保障大众对他人作品的合理接触,计算机的数据收集无须经过原作者的许可,且无需支付报酬,但不得使原作者的合法权益因此受损。该观点的不足之处在于,第一,原作者的合法权益是否受到损害无法追踪,该观点缺乏技术支持;第二,判断某一情形是否属于合理使用的前提是这一情形已经构成侵权,这已经成为一种共识。将数据抓取的行为先行认定为侵权,已将AIGC的版权作者置于不利地位,私以为不妥。法定许可说者的基本观点为,数据抓取行为无需原作者许可,只需支付报酬即可。该说的不足之处在于,第一,法定许可与合理使用均可在一定程度上激励创作,但无法准确区分二者;第二,为保障原著作权人的合法权益,需逐一判断是否抓取数据进而支付报酬;第三,法定许可使用制度需以法律规定为前置性条件,但目前数据抓取领域内仍属于立法空白,法定许可说似乎属于“无本之木”。
本文主张法定许可说,理由如下:第一,法定许可说使得机器无需作者授权即可获得数据,符合鼓励创作的立法宗旨。且法定许可说下,数据的获取者应向作者支付报酬,保障了著作权人的合法权益;第二,法定许可说无需逐一经过作者许可,符合市场价值创造的效率原则。从卡尔多·希克斯效率原则来看,机器学习使用他人作品所带来的社会公众效益的增长是远大于著作权人可能承受的经济损失;第三,人工智能的关键数据是技术运转与功能呈现的重要保证,倘若在数据获取阶段阻碍人工智能,无论人工智能具备多么强大的机器学习能力,其所生成的衍生内容也无法达到应用的效果,法定许可说可间接支持AI技术的发展;第四,关于对原著作权人支付报酬问题。可通过延伸集体管理组织,建立一种市场化的数据抓取收费体系。第五,关于法定许可说目前尚无法律明文规定问题。有学者主张应加快立法建设,将机器学习纳入法定许可的范围之内。此主张站在立法论的角度解决问题,倒也不失为一种良策。从解释论的角度讲,《著作权法》第33条第2款规定了法定许可的一种情形,可对“其他报刊”作扩大解释,将机器存储的数据库视为报刊的一种。一方面,根据衡平理论将报刊列为法定许可种类之一,将人工智能的数据库扩大解释为报刊仍符合衡平理论。另一方面,从用户的角度观之,报刊通过订阅即可阅览内容,人工智能通过支付使用报酬也可阅览其数据内容,本质上亦无有不同。当然,此方案也有不足之处。其一,根据条文文义,数据抓取的内容只能是他人发表在报刊上的内容;其二,机器可能无法准确识别他人声明拒绝转载、摘编的内容,存在对他人作品侵权的可能性。
2.第二阶段:人—机输出阶段
在Web3.0时代,网络服务提供者虽仍为服务提供者,但其消极中立的第三方地位已然发生偏移,完成了从单向传播到双向互动再到个性化服务的跨越。这一阶段,用户只需在与机器对话框内输入命令,机器即按照该命令调动数据,并按照用户的命令对数据进行输出。值得注意的问题是,用户对命令采不同的表述方式及要求,机器输出的内容则不同。即便用户的命令完全相同,机器输出的内容亦不相同。示例如下:
例一,用户命令:描述一间教室,分两段,要求有桌子、有凳子、有学生及老师,300字。
机器输出:在一间宽敞而明亮的教室里,整齐排列着一排排桌子和凳子。每张桌子都是坚固的木质桌面,表面光滑平整,经过反复擦拭后闪闪发光。桌子上摆放着整齐的教科书、笔记本和铅笔盒,准备着迎接学生们的学习。凳子则是简约而稳固的设计,配有舒适的靠背和坐垫,让学生们可以舒适地坐在上面专心听讲。
教室的一侧是一块宽大的黑板,上面写满了老师精心准备的教学内容和练习题目。在黑板前方,是一张讲台,上面摆放着老师使用的讲义、笔记和其他教学工具。一位身着整洁衣服的老师站在讲台前,手持粉笔,满脸严肃而专注地讲解着课程内容,向学生们传授知识。他们的表情各异,有的认真聆听着老师的讲解,有的专心地做着课堂练习,有的则在课桌上翻阅着教科书。
例二,用户命令:用300字描述一间教室。
机器输出:这间教室位于校园的一角,是一处充满学术氛围的空间。教室的墙壁被淡淡的米色涂抹,窗户透过晨光洒进来,将整个空间照亮。房间的每一角落都经过精心设计,呈现出有序而温馨的布局。
在教室的中央,排列整齐的课桌和椅子形成了规整的座位,每一组都有足够的空间让学生自由舒展。桌面上摆放着整洁的教材、笔记本和铅笔盒,为学生们提供了良好的学习工具。
教室前方是一块宽大的白板,记录着老师的讲解和学生的互动。一位老师站在讲台上,用丰富的肢体语言和清晰的语言向学生传授知识。讲台旁边的投影仪为教学提供了更多的可能,让教学变得更加生动和多样化。
教室的一侧是一个小小的角落,摆放着一架书架,上面摆满了各类书籍,涵盖了不同学科和兴趣。
例三,用户命令:用300字描述一间教室。
机器输出:在这个教室里,一派热闹的学习氛围笼罩着整个空间。高高的天花板上挂着明亮的灯具,为房间带来了充足的光线。墙上挂着各式各样的教学海报和学生的作品,增添了活力和色彩。
教室的中央摆放着一排排整齐的课桌和椅子,桌子的表面散发着淡淡的木香,上面摆放着整洁的教材和学习用具。学生们坐在桌子前,认真聆听着老师的讲解,或是在书本上埋头苦读。
教室的前方是一块宽大的白板,上面写满了老师用彩色粉笔绘制的图表和文字。黑板两侧挂满了各种学科的资料和学生们的成果,展现着知识的丰富和学生们的努力。
教室的一角设有一个小型的阅览区,书架上摆放着丰富的书籍和杂志,供学生们自由阅读和借阅。舒适的沙发和温馨的灯光营造出一个安静而舒适的阅读环境,让学生们尽情沉浸在书海中。
以上示例可以看出,在人—机输出阶段,用户的指令对内容的生成似乎作用不大,是否满足了最低的创作标准?置言之,AIGC能否成为作品?有学者认为,《著作权法》第11条第2款规定,创作作品的自然人是作者,AIGC不是自然人创作,因此不属于作品。此观点存在的误区在于,第11条规定的是作品的归属问题?从逻辑上看,作品的产生与否与作品的归属存在先后判断层级,机器能否成为AIGC的作者与作品是否产生并无必然联系。只要满足独创性的要求,AIGC即应具备可版权性。对独创性的判断,著作权法现有最低限度标准应仍然适用于AIGC。
四、AIGC版权赋予的要件标准
1.版权授予要件标准的确立
结合《著作权法》第11条第2款、《著作权法实施条例》第3条,直接产生文学、艺术和科学作品的智力活动是为创作。在法教义学上,AIGC语境下的创作有两种学说。一为自由意志决定表达说;二为创作工具说。自由意志决定表达说认为,自由意志与表达之间应存在紧密联系。AIGC与自由意志不存在紧密联系,人—机输出阶段不能视为创作,因而AIGC不是作品;创作工具说认为,《著作权法实施条例》第3条第2款已明确列举应排除范围。AIGC的产生过程有人的智力投入,机器仅为作者创作的工具而非辅助,因而AIGC是作品。两种学说均有一定的道理,且关键的问题在于,两学说并未排斥彼此,法教义学可得出两种相反的结论。
对此,可以思想与表达相区分的视角,借助演绎推理的方法来得出结论。首先需要明确推理的“大前提”标准。只有具有“独创性”的外在表达才能成为著作权法意义上的作品,独创性可再分为“独”和“创”两个构成要件。其中“独”要求创作内容来源于作者独立完成,而非抄袭而来,是一种量的判断。例最高人民法院在一则判决中指出:“简单的省略和组合,不能体现出足够的创作高度和个性,不能使得涉案歌词具备独创性”;“创”要求创作内容需为智力创作成果,要求展示作者的个性并达到最基本的创造性要求,是一种质的判断。例刘先明与濮阳龙丰纸业有限公司、中纸在线(苏州)电子商务股份有限公司侵害作品信息网络传播权纠一案:“刘先明主张的四句话内容简单、形式常见,不能体现作者的智力投入和足够的创作高度,不具有独创性,不构成作品”。足见,无论是理论界还是实务界,独创性均可作为作品判断的“大前提”。
关于“小前提”过程维度下的考察范围。AIGC的整个产生过程应并非均应纳入判断范围之内,“小前提”应在过程维度上进行限缩。第一阶段中的数据存储阶段完全不存在用户的参与,仅为人—机输出阶段的前提性准备,不应列在作品要件的考察范围之内。本文主张对数据抓取的行为采法定许可说,倘若并未支付原作者报酬,应当追究其侵权责任。人—机输出阶段,此中可借鉴思想表达二分法再次进行剖析。该阶段可再分为三个环节,依次为:用户输入命令、用户将命令发送给AI、AI依据命令对内容进行编排输出。值得注意的问题是,三个环节是否均需列入判断范围?有学者主张用户输入命令这一环节不应列入考察范围之内,理由在于著作权法并不保护思想,而是保护对思想的表达,用户输入命令的这一环节应当界定为思想。本文对此持相同观点。理由在于:其一,对AIGC的版权标准考察内容确应着眼于第二阶段的第三环节。抽象的思想反应着表达,表达亦无法脱离思想而存在,前两个环节与第三环节虽属于“一体两面”,但仅考虑著作权法保护的对象而言,应当将第三环节认定为表达,纳入小前提的考察范围之内;其二,倘若判断对象仅为命令本身,则需对命令再次进行思想与表达的拆分,命令背后的思想亦不受著作权法保护。
综上,应当将AIGC第二阶段中的第三环节作为“小前提”,纳入到“独”和“创”两个构成的“大前提”之内,对产出结果进行判断。
2. AIGC输出结果对版权标准的嵌入
遗憾的是,对独创性的判断,并不像理工类实验可以肉眼可见的方式界定。例如:可通过检测客观确定某100ML的液体中各成分的含量。故此,仍需采用定性的分析方法对“独”和“创”两个要件进行逐一判断。如上文所述,“独”要求创作内容来源于作者独立完成,是一种量的判断。“创”要求展示作者的个性并达到最基本的创造性要求,是一种质的判断。不难看出,满足了“独”的要求,不一定满足“创”的要求,而不满足“创”的要求,则无需考察是否满足“独”。因此,在判断的先后顺序上,应当先行判断“创”,而后考察“独”。
(1)AIGC的“创”之判断
从外观上看,AIGC与人类创作的作品几乎没有任何差异,但并不能据此直接认定AIGC属于作品。“创”之要件的核心在于要达到最基本的智力创造高度。人的本质为社会关系的总和,人的成长环境、社会阅历、心理建设等外在感性条件不同,主观价值、思维方式当然不同。而智力创造的判断应当究表达之思想,即命令输入环节。判断方法可以采取倒推的方法,倘若命令仅为简单的事实描述则不应认定其中存在智力创造。如示例二、示例三,命令仅可以被看作是对生成内容的事实描述,其中并不包含智力输出。示例一与示例二、三的区别在于,示例一的命令包含着对创作内容的要求,命令对输出的内容存在着用户的选择与期待。
因此,对AIGC“创”之要件的判断,需要考察命令输入时是否存在智力创造。而智力输入的多少、用户命令的要求几何则属于“创”之高低判断,而非有无。置言之,如果用户命令存在价值、内容、格式等选择要求,即可认为满足了“创”之要件。
(2)AIGC的“独”之判断
智力成果满足“独”之要件的情况有两种。一为作品从无到有的独立创作,二为对已有作品进行再创作,且产生的内容与原作品存在可以被客观识别的、较为明显的差异。客观来讲,两种情况均有发生的可能性。此中存在的问题是,由于数据抓取阶段的数据来源于不同的地方,“独”的要件考察不具有可参照性标准,对判断是否与他人内容构成实质性相似缺乏技术支持。但从法原理学的角度上讲,机器不存在法律主体资格,只要用户的命令满足创作高度,而命令来源于用户本身,AIGC即存在满足“独”之要件标准的可能性。
五、结论
从促进人工智能发展,AIGC存在版权保护的空间且有其必要性。对AIGC的产出过程可分为数据储备阶段和人—机输出阶段。思想与表达二分的视角下,对人—机输出阶段再进行拆分,可将命令输入评价为思想,机器输出评价为表达。对产出内容进行实质性判断,如果满足独创性的作品成立条件,即应对AIGC赋予版权。(作者为河南财经政法大学硕士研究生)(参考文献略)