每经记者 文巧    每经编辑 兰素英    

  当地时间5月20日,外媒NPR独家公布了被影迷称为“寡姐”、科幻电影《她》中AI助手饰演者斯嘉丽·约翰逊发布的一篇声明,斯嘉丽指控OpenAI的ChatGPT非法使用其声音,同时要求将语音下架。

  上周,OpenAI发布了最新旗舰模型GPT-4o,引爆科技圈。在发布会上,OpenAI展示了ChatGPT最新语音功能,不少人发现,其富有表现力的合成声音Sky与《她》中斯嘉丽饰演的AI助手的声音惊人地相似,这引发了激烈的讨论。

  斯嘉丽声明称,2023年9月,ChatGPT推出语音模式时,OpenAI曾找过她希望为其配音,但由于个人原因拒绝。就在GPT-4o演示前两天,OpenAI还曾试图说服斯嘉丽,但在联系上之前,新模型就已发布。基于此,斯嘉丽的法律团队此前已向OpenAI发送两封声明,要求该公司详细说明其开发这种声音的过程。

被ChatGPT“复制”声音,“寡姐”斯嘉丽发文怒斥,OpenAI紧急停用,生成式AI面临深度伪造的新危机?

  由于斯嘉丽的指控,OpenAI在当地时间5月19日发表声明宣布暂停使用这款AI声音模板。同时,作为回应,该公司也公布了ChatGPT中5个配音的详细创作流程,称这是从400多名专业配音和演员中挑选出来的。

被ChatGPT“复制”声音,“寡姐”斯嘉丽发文怒斥,OpenAI紧急停用,生成式AI面临深度伪造的新危机?

  实际上,这已经不是OpenAI初次面临类似的指控。更早之前,《纽约时报》和《权力的游戏》原著作者乔治·马丁等在内的内容创作者都曾因版权问题将该公司告上法庭。而随着这场斗争延伸至语音领域,外媒Wired认为,这可能会带来新的有关深度伪造的威胁。

被ChatGPT“复制”声音,“寡姐”斯嘉丽发文怒斥,OpenAI紧急停用,生成式AI面临深度伪造的新危机?

  “寡姐”斯嘉丽:ChatGPT“偷”走我的声音

  “当我听到发布演示时,我感到震惊、愤怒,并且不敢相信阿尔特曼会追求一种听起来与我如此相似的声音,以至于我最亲密的朋友和新闻媒体都无法分辨。”斯嘉丽在声明中这样写道。

被ChatGPT“复制”声音,“寡姐”斯嘉丽发文怒斥,OpenAI紧急停用,生成式AI面临深度伪造的新危机?

被ChatGPT“复制”声音,“寡姐”斯嘉丽发文怒斥,OpenAI紧急停用,生成式AI面临深度伪造的新危机?

  实际上,自去年9月OpenAI推出ChatGPT的语音模式以来,Sky的声音就一直可用。ChatGPT的语音模式一共有Breeze、Cove、Ember、Juniper和Sky五种声音。但直到上周OpenAI演示了最新的旗舰AI模型GPT-4o模型,使声音更具表现力时,Sky的声音与斯嘉丽的联系才变得清晰起来。

  在上周的发布会上,OpenAI展示了ChatGPT最新语音功能,得益于反应速度的大幅提升,该功能几乎等同“实时对话”。随后,OpenAI首席执行官阿尔特曼在X平台上发布了“her”这个词,暗示科幻电影《她》已走入现实。不少人意识到,ChatGPT中富有表现力的合成声音与《她》斯嘉丽·约翰逊饰演的AI助手的声音惊人地相似,由此引发了外界激烈的讨论。

被ChatGPT“复制”声音,“寡姐”斯嘉丽发文怒斥,OpenAI紧急停用,生成式AI面临深度伪造的新危机?

  而斯嘉丽的声明也指出,阿尔特曼用“她”来指代这部电影,似乎在鼓励全世界将ChatGPT最新演示与其表演联系起来。

被ChatGPT“复制”声音,“寡姐”斯嘉丽发文怒斥,OpenAI紧急停用,生成式AI面临深度伪造的新危机?

  她在声明中表示,2023年9月,ChatGPT推出语音模式时,阿尔特曼找到她,询问她是否愿意为ChatGPT配音,去安慰用户,弥合AI与人类之间巨大的差异所带来的不适感。斯嘉丽表示,经过深思熟虑后,她拒绝了这一提议。就在GPT-4o演示前两天,OpenAI还曾试图说服斯嘉丽,但在联系上之前,新模型就已发布。基于此,斯嘉丽的法律团队此前已向OpenAI发送两封声明,要求该公司详细说明其开发这种声音的过程。

  OpenAI回应:暂停Sky语音,ChatGPT的5种声音来自400多份投稿 

  当地时间5月19日,OpenAI表示公司正采取措施解决问题,同时正在暂停使用这款AI声音模板。

被ChatGPT“复制”声音,“寡姐”斯嘉丽发文怒斥,OpenAI紧急停用,生成式AI面临深度伪造的新危机?

  该公司还公布了ChatGPT中5个配音的详细创作流程,称每一种声音都经过了长达五个月的精心挑选,且是从合作的配音演员中进行采样的,且每位演员的报酬都高于市场最高水平。

被ChatGPT“复制”声音,“寡姐”斯嘉丽发文怒斥,OpenAI紧急停用,生成式AI面临深度伪造的新危机?

  OpenAI在声明中写道:“我们认为AI的声音不应该刻意模仿名人的独特声音——Sky的声音不是对斯嘉丽·约翰逊的模仿,而是属于另一位专业女演员,使用她自己自然的说话声音。为了保护他们的隐私,我们不能分享我们配音演员的名字。”

被ChatGPT“复制”声音,“寡姐”斯嘉丽发文怒斥,OpenAI紧急停用,生成式AI面临深度伪造的新危机?

  据悉,2023年5月,OpenAI的选角机构和选角导演发出了人才招募。不到一周,他们就收到了400多份配音演员和银幕演员的投稿。将近5个月后,他们挑选出了5种声音发布到ChatGPT中。

  该公司为ChatGPT的声音制定了一套标准,仔细考虑了每个声音的独特个性及其对全球观众的吸引力。这些标准包括:有不同背景或能说多种语言的演员;一种听起来有“永恒”(timeless)感觉的声音;一种平易近人、能激发信任的声音;一种音色丰富,且温暖、引人入胜、充满自信、魅力十足的声音;自然且易于听取。

被ChatGPT“复制”声音,“寡姐”斯嘉丽发文怒斥,OpenAI紧急停用,生成式AI面临深度伪造的新危机?

  深度伪造威胁或升级

  《每日经济新闻》记者注意到,斯嘉丽的指控已经不是OpenAI初次面临类似的斗争。

被ChatGPT“复制”声音,“寡姐”斯嘉丽发文怒斥,OpenAI紧急停用,生成式AI面临深度伪造的新危机?

  今年5月初,包括《纽约每日新闻》和《芝加哥论坛报》在内的多家报纸在纽约联邦法院起诉OpenAI和微软,指控他们滥用新闻内容来训练生成式AI系统。

  去年12月,《纽约时报》在纽约南区法院向OpenAI及其投资人微软公司提起侵犯版权诉讼;同月,多名普利策奖得主也起诉OpenAI和微软滥用自己作品训练大模型,指出这样的行为无疑是在“刮取”作家们的作品和其他受版权保护的材料。

被ChatGPT“复制”声音,“寡姐”斯嘉丽发文怒斥,OpenAI紧急停用,生成式AI面临深度伪造的新危机?

  更早之前,去年9月,美国作家协会以及包括《权力的游戏》原著作者乔治·马丁在内的17位美国著名作家对OpenAI发起集体诉讼,称OpenAI在未经授权的情况下使用原告作家的版权作品训练其AI模型。

  OpenAI面临的难题也揭示了整个生成式AI领域与内容创作者之间权益边界的普遍性问题。

  据媒体引用不完全统计数据称,自2022年11月至2023年10月,仅美国加州北区法院便已经受理了10起版权人起诉StabilityAI、OpenAI、Meta、Alphabet等公司未经授权,利用版权作品进行模型训练的案件。

  外媒Wired评论称,与斯嘉丽的冲突将加剧OpenAI与艺术家、作家和其他创意人士之间的现有斗争。随着这场争斗蔓延至语音领域,Wired认为,生成式AI使创建逼真的合成声音变得更加容易,这可能会带来新的有关深度伪造的威胁。

  实际上,OpenAI今年3月就曾表示,它已经开发出一种可以从15秒的剪辑中克隆某人声音的技术,但该公司表示不会发布该技术,因为它可能会被滥用。

  封面图片来源:每经记者 刘雪梅 摄