“深层思维”公司为人工智能生成文本打“水印”

新华社伦敦10月25日电(记者郭爽) 谷歌旗下“深层思维”公司的研究人员设计了一种“水印”,可以无形地标记人工智能生成的文本,并将其提供给数百万聊天机器人用户。该研究成果日前发表在英国《自然》杂志上。

随着大语言模型在质量、连贯性、覆盖范围和专业性方面的进步,区分其生成的高质量合成文本和人工书写文本变得越来越困难。鉴于大语言模型在教育、软件开发和网络内容生成中的广泛使用,人工智能生成文本的识别和归属对于确保安全和负责任使用该技术至关重要。

各国都希望通过水印来识别人工智能生成文本并限制意外或故意滥用问题,以帮助鉴别和打击虚假新闻和学术造假等,同时避免因使用人工智能生成内容训练而导致未来模型质量下降的问题。但迄今开发的水印都较容易被移除,或者用于欺诈。

此前,“深层思维”公司已经开发出图像水印技术——SynthID,可以识别并应用在人工智能生成图像上。在此基础上该公司开发了一种被称为SynthID-Text的文本水印技术,可以将水印应用于文本。

该技术将水印整合到大语言模型本身文本生成的步骤中,以一种隐秘但公式化的方式标记模型选择的单词,而这可以用密钥检测到。与其他方法相比,这样产生的水印更容易被检测到,而且应用它不会减慢文本的生成速度和质量。此外,由于密钥复杂,移除水印或使用水印欺诈变得更加困难,即使使用第二个大语言模型来解释文本,水印仍然可以被检测到。

目前,“深层思维”公司已将该水印技术开源,开发人员可以将这种水印应用于他们的模型。


首届人工智能安全峰会于2023年11月1日至2日在英国布莱奇利园举行,峰会发布《布莱奇利宣言》。新华社记者 李颖 摄