AI水印是什么?如何抹除?

AI水印是什么?如何抹除?

You are currently viewing AI水印是什么?如何抹除?

我在研究AIGC内容是否会被谷歌惩罚时,看到一些业内人士频繁提到AI水印这个东西,他们的观点是AI生成的内容要注意消除水印。我想,出发点可能是基于谷歌不喜欢AIGC内容吧。

后来我仔细研究了一下AI水印,得出的结论是,AI水印相较于图片等媒介的水印,是比较特殊的,如果只是在意是否会被识别出是AI写的,建议阅读我的这篇文字“用AI写文章会被Google惩罚吗?”,如果是担心AI写出的文章AI味儿很重,说明你担心得对,核心还是内容质量,也可以点击链接看看怎么样提升AIGC内容质量。对AI水印感兴趣的同学可以接着往下看。

AI水印是什么?

大家在生活中都接触过水印吧,如下图所示的钱币上的防伪水印,是生活中很常见的一种。水印除了可以防伪,还可以用来溯源。我前司的工作软件就会在员工对App进行截图时给图片自动加上“姓名+工号”的水印,这样,当有人泄露公司机密时,立马就能定位到泄密人。

那么AI水印是什么?AI水印的诞生源自于一些国家对于道德和法律层面的担忧,现在AI技术这么发达,造假成本变得很低,不法分子随随便便就可以编出一些虚假的材料,如果这些材料在网络上大肆传播,后果不堪设想。

一些国家就寄希望于通过数字技术在AI大模型输出内容之时或输出之后嵌入可识别的信号,即AI水印,以便人们通过特定算法进行解码从而鉴别出如图片或文字等形式的材料是人工产出的,还是由AI生成的。

AI水印在图片上的应用

现在一些机构和高校已经在进行AI水印相关的研究,并取得了一些成果,尤其是在图像层面。AI水印在图片上的应用主要有两种表现形式,一种是可见的水印,如下图所示:

还有一种是肉眼不可见的水印,这种水印只是改变了原图的几个像素,肉眼无法识别。但可以通过算法检测到。

AI水印在文字应用上的争议

文字的AI水印添加过程,是AI大模型在输出文字时使用一些人们不太用的词汇,或者调整某些语言范式出现的频率等,将AI水印嵌入到最终的文本输出中,之后有水印识别算法进行解码,判断文字是否是由AI生成的。

但在文字上应用AI水印,争议是比较大的,主要集中在以下几个方面:

一、水印对文字的破坏力大

文字不同于由无数个像素组成的图片,即使只改变一个单词,或者改变一下语序,都会让原文的意思大不相同。如果水印算法不能很好地维持文字的可读性和预期效果,人们就会对使用水印产生顾虑。

二、水印本身很容易被破坏

利用一些Paraphrasing工具可以一键改写整篇文章,轻而易举就破坏掉通过各种复杂的算法嵌入到文字中的水印。

三、水印算法对AI模型造成负担

水印算法如果是在大模型的文本生成进程中运行,会需要加入了更多的数据集,加密算法对大模型也会有一些特有的指令要求,可能会使得大模型的精准度和效率都下降,这也是大模型开发者不愿意见到的。

四、易识别

现在有一些研究者发现通过比对模型正常输出文字和加了水印算法后的大模型输出的文字,可以破解出水印算法的大概构造,这样就可以把加了水印的文字进行修改,逃过水印检测算法的检查。

五、人权上的担忧

一些创作者认为,人们有权利决定如何创作自己的作品,不论是何种方式。而AI水印像是一个带来耻感的标签,会让自己的作品被人鄙视,版权遭受质疑,甚至有暴露个人信息的风险。且AI水印不应该是必选项,应该由AI的使用者决定是否要使用水印,在水印中要披露信息到什么程度。

ChatGPT等大模型有在使用AI水印吗?

目前ChatGPT正在实验AI水印,但因为种种担忧,可能包括我提到的以上几点,目前并没有正式使用。如果你觉得ChatGPT的输出AI味儿很浓,可能只是Prompts给得不够,也可能是可利用的语料库不多,并不是因为ChatGPT故意加上了水印。

Google能识别出AI水印吗?

是的!谷大哥很强的。Google的SynthID算法不但可以加数字水印,还能识别出AI文本、图片、视频、音频。但是我看了它的官方介绍是说可以识别出这些内容是是否是通过Google系的AI产品如Gemini生产的,但是否支持鉴定ChatGPT等AI模型的输出目前还不明确。

总结

AI水印在文字上的应用目前还不太成熟,甚至面临着很多阻碍。对于营销人员来说,更是不需要太过于担忧这个问题,起码现在不是所有的大模型都有加AI水印,例如ChatGPT就没有。你要是担心Google不喜欢AI内容的话,文字上的水印通过各种手段还是相当容易被抹除掉的。

发表回复