南方财经全媒体记者卓皙雯 广州报道
古籍用于大模型训练是否需要经过授权?文化数据训练语料中的各方权益归属于谁?由文化数据训练后的AIGC生成投入市场后是否拥有知识产权?近年来,数据要素开发利用为文化产业带来全新发展机遇的同时,也对企业合规提出了新的风险和挑战,推动文化产业打通数据合规链路成为市场亟待解决的难题。
为探索构建文化数据交易合规新路径,11月21日,由南方财经全媒体集团、广州数据交易所(天河)服务专区及南方文化产权交易所联合主办的“探索数据合规路径,共促文化产业健康发展”研讨会在广州天河召开。面对文化数据合规的诸多“荆棘”,多位专家提出,平衡数据各方主体的权益和需求是关键所在。
文化数据确权是合规关键
当前,许多机构手握海量文化数据,如文博艺术品数据、出版数据等,是人工职能大模型训练的潜在热门卖家。不过,在实践中,如何确认文化数据的权益归属,成为能否实现合规交易的关键。
与会专家以使用古籍内容训练大模型的案例进行了深入讨论。《暨南学报(哲学社会科学版)》副主编李晶晶表示,对古籍图书进行大模型训练涉及公版书的使用边界问题,如果在国际流通具有较大隐患。尽管不再有主体享有著作权,但出版社对经过自身劳动后重新编排的古籍仍然享有汇编权。
广州知识产权法院著作权审判庭法官屈昕补充道,如果出版社把出版物数据给数据产业公司进行数据训练,需再次得到作者的许可。广东财经大学法学院教授姚志伟则指出,如果出版社获得语料费用,但作为著作权人本身无法拿到费用也是一个棘手问题。
广州数据交易所合规专家孙薇提出了不同观点,她认为,出版物已经进入公开流通领域,所包含的数据就属于公开数据,如果仅在合理范畴内使用,可以不需要经过作品权属人的同意。
暨南大学法学院/知识产权学院副教授吴雨辉认为,由文化数据训练形成的AIGC可以获得版权的基础是要证明,输入提示词的使用人有相关的个性化投入,使用者对基于这个提示词投入而产出的对应内容享有著作权。因此,在目前的制度框架下,如果要在批量化的AIGC产出中论证每个提示词的个性化投入,难度较大。
“未来,要通过妥善审理涉人工智能新类型网络侵权纠纷案件,探索以技术向善推动实现人工智能价值对齐。”在场专家表示,审慎确立生成式人工智能侵权责任,探索厘清训练数据合理使用、人工智能生成物版权认定标准和侵权责任归责原则等问题,以期为行业的发展提供稳定预期,也为后续的相关立法提供司法实践例证。
探索文化数据资产登记
文化数据确权的特殊之处是,数据产权与知识产权之间应如何衔接。多位参会专家认为,核心在于平衡数据各方主体的权益和需求。
我国在数据要素领域的顶层设计明确了数据确权的基础框架。2022年12月,《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》提出了“三权分置”理论,聚焦于数据的使用流通,体现出对不同主体权益的保护。而知识产权主要以保护知识产权人的私人利益为中心,更多是鼓励知识创作。数据产权与知识产权是否有接续或重合,主要取决于两者保护的客体范围是否产生重合。
金杜律所合伙人胡凌波表示,文化类数据产品到底以数据还是知识产权的角度进行保护要考虑到地方性、经济角度、各方交易需求等多方面。文化数据产品涉及多方主体,包括原始持有人、著作权人、出版商、数据商、人工智能开发商及运营主体。从法律角度出发,数据需要完成“一层一层合规”,从数据主体、数据提供者、开发主体、运营主体到使用主体逐层合规。
在文化数据开发利用过程中,平衡好私权保护与实现技术创新之间的关系也十分重要。李晶晶建议,一是在制度方面,要加强数据产权制度建设,推动文化数据行业的市场准入、市场交易以及创新体系达到合法安全隐私的标准;二是要加强知识产权保护、交易监管及执行,如对版权登记、专利登记、商标登记等数字化程序的监管;三是在司法诉讼方面,法院要平衡各方利益,多开论证会议等。
当前,文化数据资产登记的探索可分为三大路径。一是文化数字内容产品,需进行版权登记;二是文化数据产品,可进行数据的权属登记;三是大量文化数字内容形成的数据集产品,完成了版权登记之后还需完成数据权属登记。
南方财经数据要素事业群运营经理陈丹提到,机构将文化数据要素资产进行分类、开发利用,进行相关权属登记后,再通过交易所或行业交易平台完成数据产品或资源的交易流通。目前,南方文化产权交易所已经获得了中国版权保护中心的数字产权链试点应用合作,可为数字产权提供DCI的认领、数字版权登记服务,版权方可以在数字版权链上实施确权、流转、查询、交易、登记备案的全流程。而文化数据产品可在广州数据交易所完成数据产权登记。
在数据流动中,不仅要确认权益归属,还要确保后续的交付和使用。南方文化产权交易所交易总监唐瑛提出两种解决方法,一是以本地整体数据库去提供服务,二是通过产权授权将文化数据交付给模型企业作为语料使用。她还建议,在目前没有明确法律框架的前提下,要积极推动交易所行业内的标准互认。
(作者:卓皙雯 编辑:马嘉璐)