近日,欧盟知识产权局(EUIPO)发布了《版权视角下生成式人工智能的发展研究》报告。
报告由EUIPO委托都灵大学法学院和都灵理工大学Nexa互联网与社会中心完成,旨在从技术、法律和经济角度阐明生成式人工智能(GenAI)系统开发中涉及到的版权问题。
报告讨论了欧盟涉及GenAI和版权的法律框架、GenAI输入及输出时遇到的版权问题及处理方式、已有的版权许可方式等,主要从技术性和非技术性两个方面、从版权所有人和GenAI开发者两个角度,全面地分析了目前已有的和未来可以进一步加强的措施,以实现对版权所有人进行有效保护的同时,能对人工智能技术的发展起到促进作用。
以下内容值得国内从事生成式人工智能领域的企业家高度关注。
一、报告特别提示欧盟相关法案在人工智能领域的重点条款
欧盟于2019年发布的《单一数字市场版权指令》(CDSM)中,规定了文本和数据挖掘(TDM)的两种例外情形:允许科研机构(见CDSM第3条“以科学研究为目的的文本和数据挖掘”)和商业主体(见CDSM第4条“文本和数据挖掘的例外或限制”)对合法获取的内容进行文本和数据挖掘,不视为侵犯版权的行为。同时,在第4条中也规定了权利人可以以适当方式明确保留对上述作品或其他内容的使用(opt-out),例如针对网上公开提供的内容采取机器可读的方式声明权利保留。该指令的解释和适用可能在权利人的策略选择中发挥重要作用,进而影响GenAI开发者对数据的获取流程及难度。
此外,2024年发布的《人工智能法案》中,要求通用人工智能(GPAI)模型提供商需公开训练数据摘要,确保训练数据合规,并要求部署者须使生成内容可被机器检测等。在该法案的规定下,非欧盟企业若向欧盟市场提供GenAI服务,无论训练数据来源地在哪里,亦需遵守上述规则。
二、报告强调政府等公共机构在促进人工智能发展方面应当发挥更加积极的作用
报告在详细分析了GenAI领域现有的技术及非技术的手段之后,对政府等公共机构提出了一些强化协调的建议。
例如,非技术的手段包括:开展教育活动,提升权利持有人、开发者及公众对GenAI领域版权问题的认知;监测 GenAI 市场的关键技术进展(如检索增强生成技术RAG、模型“遗忘”技术)和商业实践(如直接许可协议、数据中介平台的兴起),为政策制定提供实时分析;搭建跨部门对话平台,协调权利持有人、AI企业、学术机构等主体的诉求,推动版权合规框架的共识;以及建立公开数据库,梳理并记录用于解决GenAI输入(数据训练)和输出(内容生成)版权问题的各类法律与技术措施等。
技术类的支持包括:开发标准化元数据模板或开源工具,帮助中小权利持有人便捷配置TDM权利保留声明,或提升生成内容检测工具的兼容性;推动不同技术措施的互认标准,例如确保“基于位置的元数据标记”与“基于资产的数字指纹”在跨平台数据流转中保持一致性,降低技术碎片化风险;建立国家级生成内容检测认证中心,为中小企业提供低成本侵权筛查服务,或开发版权许可智能合约平台,自动化管理数据使用权限与报酬分配等。
欧盟在数据安全、数据保护和应用、人工智能等多个新型领域的立法无疑是超前的,建立了全球公认的最为严格的规则体系。欧盟在数据、人工智能方面的立法实践,必然会对全球相关领域的立法、司法和执法带来深远的影响,其在规则制定方面的影响在现阶段甚至会超过美国和中国。
对于国内企业而言,无论将来商业触角是否延伸至欧盟,其欧盟对于数据、人工智能方面的立法动态、司法动态,值得高度关注,这不仅仅可以有效避免欧盟商业活动合规风险,避免高额罚款,甚至禁入,还可以协助企业预判中国、美国以及世界其他国家对于数据、人工智能等法律规则建立、完善的基本路径,提前预见风险,提前做好布局,有效降低合规成本,在全球GenAI竞争中占据主动。
来源:北京市贸促会,作者:赵洁、孙志峰,北京卓纬律师事务所