初听上去,“简单的快乐”(Simplicity‘s Delight)就像一首为Velveeta芝士创作的朗朗上口的广告流行歌。歌手在轻盈的吉他和欢快的打击乐中歌颂着“一块朴素的芝士”。但仔细听,你会发现声音有点像计算机合成的,但也可能只是使用了Autotune(自动电音调节)。真正暴露出歌手恐非人类的是第二段副歌,其中搞错了“tangy”(浓郁)一词的发音。
现在有一批新的人工智能初创公司专注于构建自动化的音乐创作工具,上面这首歌正是由其中一间名为Suno Inc.的公司的软件所创作。输入简短的文字指令,Suno可在几秒钟内产生以假乱真的人声音乐,从关于恋人分手的梦幻电子流行乐到歌颂美味的发酵乳制品的不插电小调,无所不能。据悉,Spotify等音乐平台上已经出现了疑似由Suno制作的完整AI专辑。
产生式人工智能已被用于制作文字、影像、影片等各类内容。音乐正成为下一个对象,借此,人人都有望通过歌曲表达自己。但AI初创公司也加剧了音乐人对生计的担忧,很快,网际网络上可能就会充斥各种半生不熟的计算机合成歌曲。这也将考验唱片公司的容忍度,长期以来,它们一直不惮于与科技行业对簿公堂。
音乐人和唱片公司已经将人工智能视为了潜在的生存威胁。4月,艾利什(Billie Eilish)、兰伯特(Miranda Lambert)和史密斯飞船(Aerosmith)等数百组音乐人和乐队透过非营利组织艺术家权利联盟(Artist Rights Alliance)签署了公开信,敦促AI开发者、科技公司及其他方面停止使用AI‘侵犯和贬低音乐人的权利’。
近日,环球音乐集团(UMG)与TikTok达成协议,以加强防范AI音乐,此前该公司曾因担心TikTok“充斥AI生成音乐”而从该平台撤出了旗下歌曲。去年,环球曾对一首利用AI复制了Drake和The Weeknd风格的爆红歌曲发出谴责。数十家音乐出版机构此前也起诉了OpenAI的竞争对手Anthropic,指控其聊天机器人未经许可抓取歌词。
近年来,OpenAI和Alphabet旗下的Google等领先的AI公司都展示过AI产生音乐的功能,但目前为止,它们尚未推出面向消费者的相关产品。例如,Google旗下的DeepMind去年11月揭幕了一款名为Lyria的音乐创作工具,但尚未对外发布。该公司称正与音乐人和音乐行业“接触”,以推进“无责开发”。
在这种情况下,当前的AI音乐革命主要由规模较小的公司引领。Suno成立于2022年,总部位于马萨诸塞州剑桥市,去年发布了音乐制作软件,最近推出的新版本能让使用者产生长达两分钟的歌曲。同样,由前GoogleDeepMind研究人员和工程师创办的Udio上个月推出了测试版软件,能输出约30秒的音乐片段。
“两三年前,这项技术还不成熟,”Udio联合创办人兼行政总裁David Ding表示,他曾参与DeepMind的产生式人工智能项目,包括Lyria,“现在各方面的研究成果,包括语言建模、影像建模、影片建模的进步,似乎都表明音乐模型大放异彩的时机已经来临。”
Udio得到了科技和音乐领域知名人士的支持。该公司筹集了1000万美元的种子轮融资,由Andreessen Horowitz领投,Instagram联合创办人迈克·克里格(Mike Krieger)、音乐人will.i.am和Common、音乐制作人泰伊·基思(Tay Keith)及发行商UnitedMasters参投。Suno未透露融资细节。
为招揽使用者,两家公司目前均提供免费服务:在测试阶段,Udio的使用者每月可免费产生1200首歌曲,Suno的使用者每天可产生10首歌曲,成为付费会员可获得更多歌曲产生等权限。这两家公司对每个用户指令都会执行两次,以产生有所不同的版本。
Udio联合创办人桑切斯(Andrew Sanchez)称软件推出头两周,试用者就突破60万人,用户平均每秒产生10首歌。(Suno未提供可比数据。)Udio的软件也在快速迭代:过去几周推出了多项新功能,包括可将歌曲延长至15分钟。
Suno联合创办人弗雷伯格(Keenan Freyberg)说,人们通常会先用Suno为朋友或家人(或一起)创作一首歌,然后再探索软件的其他功能。教师用Suno制作歌曲来辅助课堂教学,资料软件公司Palantir Technologies Inc.利用它为近期的软件训练营创作了一首乡村音乐。
歌曲可能朗朗上口,可能稀奇古怪,也可能兼而有之。一首名为“老鼠避孕迪斯科”的歌曲讽刺了《纽约时报》(New York Times)关于纽约市利用节育方法阻止老鼠繁殖工作的报道。歌词节选:“忘掉老鼠药吧,陷阱也一无是处。不如来场迪斯科革命,让小玩意粉墨登场。”
“因为无法预料人们会如何使用这些工具,我们感到如履薄冰。”弗雷伯格说。
但随着AI愈加深入创意领域,这项技术开始与娱乐产业及其版权律师产生冲突。Midjourney、OpenAI和Stability AI等公司在构建产生多媒体内容的AI模型时使用的数据集包含了从网上抓取的影像。他们辩称这种做法受到美国版权法的合理使用原则的保护,但仍然引发了愤怒和诉讼。
加州大学伯克利分校的数字版权专家和法学教授萨缪尔森(Pamela Samuelson)表示,产生式人工智能公司对于将作品用作训练数据有合理的使用辩护理由。但她认为法院看待音乐的方式可能与计算器程序代码、文字或影像等作品不同。“数据类型可能很重要,”萨缪尔森说,“法院可能会据此作出区分。”
Suno和Udio均未透露各自的AI系统具体的训练数据。丁说Udio使用了来自网际网络的公开数据。Suno联合创办人舒尔曼(Mikey Shulman)说从某种程度上讲,该公司认为训练资料甚至比如何构建AI软件更重要,“因此我们会严格保密。”但舒尔曼说Suno的做法是“”合法的”,且“与其他公司的路线基本一致”
Suno联合创办人基南·弗雷伯格(Keenan Freyberg)说“因为无法预料人们会如何使用这些工具,我们感到如履薄冰”。
这种保密性让非营利组织Fairly Trained的行政总裁埃德·牛顿-雷克斯(Ed Newton-Rex)感到不安,该组织为使用许可数据训练的AI模型提供认证。牛顿-雷克斯曾负责Stability AI的音乐产生产品,他发现使用这两家公司的软件都很容易产生大量与版权音乐高度相似的作品。例如,他能够产生很像皇后乐队(Queen)、阿巴合唱团(Abba)、绿洲乐队(Oasis)、Blink-182和艾德·希兰(Ed Sheeran)等乐队和音乐人的歌曲。
“我们不知道他们的训练数据是什么,但如果是受版权保护的作品,而且他们藉此构建与这些作品竞争的产品,那么很难让人相信他们真心尊重音乐人,”牛顿-雷克斯说道。桑切斯称其公司正与包括音乐人和版权所有者在内的行业利益相关者对话,“以确保我们的技术能造福所有音乐人和创作者。”一位不愿具名的唱片公司人员表示,他们对于与负责任的AI公司达成协议持开放态度。
Suno拒绝就与音乐行业的谈判发表评论,但舒尔曼说该公司正在考虑如何补偿音乐人,并且在密切关注不断变化的法律环境。“我们非常希望以一种对所有人都公平的方式处理好这个问题,”他说。
为此,Suno目前禁止使用包含音乐人姓名的创作指令,Udio会用其他描述词替换掉它们。例如,当用户要求创作一首“比莉·艾利什风格的多愁善感的流行歌曲”,以讲述在食杂店挑选酸奶口味的困难,Udio会用形容词替换掉音乐人的名字,比如“民谣流行”和“独立流行”。它还会在曲目内容中加入蓝色的“音乐人被替换”卷标。
尽管音乐人感到担忧,但这些公司指出,过不了多久就会有庞大的群体能够使用至少部分AI工具创作出听起来很专业的精彩音乐。“过去,许多人可能出于经济等原因被排除在音乐创作之外,”桑切斯说,“”我们认为这一工具将清除他们的障碍。’