网信办拟发布AI“内容水印”要求:大厂试水中,中小厂有挑战

合规科技肖潇 2024-09-14 18:37

21世纪经济报道记者肖潇 北京报道

互联网上滥用AI“以假乱真”的内容越来越多,一条普遍认同的应对方法是,明确表明内容由AI生成,防止被误认为是真实内容,类似于在纸币上印防伪水印。

9月14日,网信办起草的《人工智能生成合成内容标识办法(征求意见稿)》(下称《AI标识办法》),就专门针对AI内容标识,开始向社会公开征求意见。

与之配套的强制性国家标准《网络安全技术 人工智能生成合成内容标识方法》征求意见稿(下称《AI标识国标》),也在当天由全国网安标委发布,拟在发布后6个月正式实施。

一位紧跟本领域监管动向的专家向21记者透露,深度合成问题是有关部门目前的关注重点,内容标识更是其中的关键点。虽然国家有相关标准和规定,各个大平台也有各自实践,但始终没有统一明确的规范。而且内容标识是一个最重要的AI治理工具,也是全球监管共识。这是新办法起草的大背景。

不过,多位大模型业内人士表示,AI内容标识仍面临成本高、技术不够可靠的挑战。21记者从业内了解到,一些大厂已经率先推进AI数字水印技术,小厂的压力更大,第三方网络安全公司或能从中受益。

标识要求更细,新增平台核验义务

《AI标识办法》专门规范如何标识AI生成的内容,一共十四条,最大特点之一是颗粒度明显变细。 

此前,我国已经有《网络安全法》《互联网信息服务算法推荐管理规定》《互联网信息服务深度合成管理规定》《生成式人工智能服务管理暂行办法》四部法律法规规范,对AI生成内容作出约束,但在内容识别上的要求较为宽泛。

比如,针对AI生成服务的提供者,《互联网信息服务深度合成管理规定》第十六条规定, 应当采取技术措施添加不影响用户使用的标识。第十七条规定,可能导致公众混淆或者误认的,按要求显著标识出AI生成。

而最新的《AI标识办法》则明确区分了显式标识和隐式标识:前者指的是在生成内容或者使用页面,能被用户肉眼看到的标识;后者指在内容文件数据中里的隐形标识,不影响用户看到的画面或文字,但能将生成合成内容属性信息、服务提供者名称或编码、内容编号等制作要素信息嵌入到文件中。

配套的《AI标识国标》进一步细化了不同场景的要求。例如如果是视频,起始画面需要添加提示文字,而文本要添加提示文字或者AI角标

 

 (图源:《AI标识国标》)

 


“哪个主体,在哪些情况下,添加何种类型的标识,是不是具有特定的合规义务,这种系统性规范我觉得很有必要。” 对外经济贸易大学法学院教授张欣告诉21记者,添加了标识后,才可以从终端的角度,让用户知道自己接收到的内容到底是由人生产的还是模型生产的。这种信息区分原则,是互联网信息内容治理一个较为基础性的原则。

张欣表示,《AI标识办法》不仅仅是技术治理工具,也为不同产业主体规定了较为清晰的合规义务,衔接了此前的算法备案、安全评估等治理工具。

此前,标明AI内容的责任更多放在技术提供者身上,也就是要求在下载、导出内容时标明AI生成。而《AI标识办法》对传播平台提出了核验要求,如果核验发现文件元数据中有隐式标识,平台要在发布内容周边需要添加显著的提示标识,明确提醒用户该内容属于生成合成内容。

苹果商店、安卓应用商店等互联网应用程序分发平台在APP上架或上线审核时,也需要核验提供者是否按要求提供了AI内容标识功能

《AI标识办法》还重申了一些此前的要求,服务提供者在履行算法备案、安全评估等手续时,要提供AI标识的相关材料。用户上传时,则应当主动声明并使用平台提供的标识功能。 

大厂试水中,小厂有挑战,网络安全公司或受益

另一方面,张欣向21记者提到了AI标识的两个挑战:一个是对内容的展示度和准确性可能带来一定影响,而且即使有了AI标识,仍然可能被篡改;一个是企业的合规成本和技术实现成本需要综合考虑。  

21记者梳理发现,国内大型互联网平台的AI显式标识已经基本成形。小红书、B站、微博、抖音、快手都增加了AI生成内容的声明,要求创作者主动勾选,以避免误导观众。小红书团队此前对21记者表示,AI 生成内容的真实度和扩散程度不断提高,平台主动的AIGC鉴别能力成为刚需,小红书会用算法主动监测疑似内容,并打上“疑似AI内容生成”标识。

但在隐形标识方面,目前能推进的平台有限。业内公认的棘手之处在于,还没有出现一个完美的隐形水印技术。

去年十月,美国马里兰大学计算机科学教授Soheil Feizi测试了AI“数字水印”的技术可靠性,发现这一技术可被轻易破解。他的研究团队轻松避开了现有的水印方法,并发现在非 AI 生成的图像上添加“假水印”更为容易。同年,另一项美国加州大学和卡内基梅隆大学的研究也映证了这一结论。

即使是科技巨头谷歌推出的AI数字水印工具SynthID,其在发布时也写道:“并非万无一失”“并不完美”。谷歌的看法是,AI数字水印可能很难抵御高级攻击,但至少是解决方案的一部分,能捕捉一些低级的AI造假事件。

去年5月,抖音发布了《关于人工智能生成内容标识的水印与元数据规范》,希望在相关图片和视频元数据中写入信息,不同的平台及工具能够互认标识元数据,达到通用识别的效果。目前来看可能还只是一个美好的倡议。

近年已有一批国内公司布局数字水印业务,大多为网络安全公司,或能从中获益。A股方数字水印相关概念股有20余只,包括电科网安、北信源、鸿博股份、汉仪股份等。不过数字水印目前市场规模较小,在相关公司的业务营收占比也还较小。

(作者:肖潇 编辑:王俊)

肖潇

记者

关注国内外互联网合规问题。