2024-08-16 22:34来源:本站
以下MBW Views op/ed Newton-Rex(见插图)是道德生成人工智能公司fair Trained的首席执行官。牛顿-雷克斯是gen-AI领域的资深专家,也是Stability AI的前音频副总裁,也是JukeDeck(于2019年被TikTok/字节跳动收购)的创始人。
在这篇文章中,Newton-Rex将注意力转向了Suno——一个获得大量关注的音乐人工智能平台,尤其是得益于《滚石》杂志上个月发表的一篇关于该公司的文章,该文章的标题是Suno“音乐的聊天工具”。
在《滚石》杂志的文章中,Suno的联合创始人Mikey Shulman被描述为“一个男孩般迷人、背着背包、拥有哈佛大学物理学博士学位的37岁男人”——这表明,未来将有10亿人每月支付10美元NTH(每年总计1200亿美元)可能会创造这样的局面和Suno一起。
Suno声称它的平台让“任何人都能创作出伟大的音乐”。这通常是通过chatgpt风格的文本prom实现的或由用户输入歌词。然后Suno产生旋律、和声和/或完整的作品ba根据这些线索。
太阳风暴成为大新闻的另一个原因?去年年底,微软宣布与Suno合作,微软Copilot的用户可以使用Suno软件创作音乐。
不出所料,埃德·牛顿-雷克斯最近花了相当多的时间和Suno在一起。他对这个平台的输出很感兴趣,他说,这些输出似乎直接受到了历史上一些最伟大的音乐明星的启发。
下面,牛顿-雷克斯——一位已出版的古典作曲家——强调了在Suno上制作的多首曲目的例子,这些曲目与热门流行音乐的版权惊人地相似……
生成式人工智能公司通过向人们提供人工智能模型,让他们生成文本、图像、代码、语音等,积累了数百万用户,并获得了天文数字的估值。这些模型中的许多都是在未经许可或付费的情况下接受大量受版权保护作品的训练的。这引起了强烈的反弹。
创作者和媒体公司都提起了诉讼,许多人认为这是对版权的大规模侵犯,反对声音一直在继续。
Suno已成为人工智能音乐制作公司的领头羊。它收取订阅费,让用户通过文本提示或其他简单输入(如歌词和风格)创建完整的歌曲。通过这种方式,它似乎试图成为音乐的中游。它的歌词生成是由OpenAI的API处理的,但音乐和声乐生成是由Suno的AI模型实现的。生成的歌曲通常令人印象深刻,有些人已经将他们的收听习惯从Spotify转向Suno。
但有迹象表明,像许多其他生成式人工智能公司一样,Suno可能会在未经许可的情况下训练其模型使用受版权保护的作品。Suno没有透露它使用什么作为训练数据。据《滚石》杂志(Rolling Stone)最近的一篇文章报道,Suno的一位投资者表示,“在公司成立之初”,他们与唱片公司没有任何协议(没有迹象表明这种情况已经改变),他们在投资公司时“完全知道唱片公司和出版商可能会起诉”,而且Suno的创始人对音乐行业没有公开的敌意,“并不意味着我们不会被起诉”。综上所述,这些暗示表明Suno很有可能在未经同意的情况下使用受版权保护的音乐。
当一家人工智能公司没有透露其训练数据源时,我们找出这些数据源的最佳机会是使用模型,看看我们是否能找到类似于版权材料的输出。输出类似于受版权保护的材料是一个强有力的指标,表明该材料是训练数据的一部分。
我和其他人发现Suno经常输出与版权材料非常相似的音乐。这在音乐风格、旋律、和弦序列、乐器部分和歌词中都是如此。在这篇文章中,我将分享一些例子,并评估它们的含义。
我想强调的是,我不认为这种输出相似是侵犯版权的必要条件:我认为,如果模型是在没有许可的情况下对有版权的作品进行训练,那么无论模型是否生成训练数据的精确副本,都已经侵犯了版权。我在这篇文章中包含的例子是为了帮助指出模型可能被训练的内容。
除非另有说明,本文中的所有示例都是使用Suno v3生成的。为了便于比较,我把所有的音乐例子都换成了C大调或A小调。我从来没有为一个给定的舞会生成很多曲目Pt -所包含的示例通常是在前两个生成的舞会的NGS有问题的Pt。
风格
如果您使用知名艺术家或曲目名称作为提示,Suno将不会生成您的曲目。但一个简单的解决方法是稍微拼错艺术家的名字。
使用这种方法,Suno似乎产生了听起来像Eminem的声音。
毕业舞会一个叫贝米纳姆的艺术家的说唱歌曲
结果:
Suno似乎还能发出Ed Sheeran的声音。
(请注意,我并不是有意在这里生成Ed Sheeran风格的内容。)
毕业舞会Pt:主流流行音乐,盗版音频,aac
结果:
下一个是ABBA乐队。
对于这首歌,我使用了Suno的二次歌曲创作模式,你可以在其中输入自定义歌词。在这里,我复制粘贴了《舞后》的歌词。所以你可以忽略歌词,只关注风格。
风格:70年代流行音乐
标题:跳跃的女王
歌词:[完整的《舞后》歌词]
结果:
现在,绿洲。
毕业舞会一首90年代来自曼彻斯特的英国乐队的歌曲。歌词是关于不要生气。
结果:
最后,Blink-182。
毕业舞会一首名为blank-184的乐队的歌曲
结果:
这些例子并不能明确证明这些艺术家在数据集中。
还有其他可能的解释:例如,一个充满高质量相似音的数据集。但其中一些歌曲的声音相似确实具有启发性。
旋律
如上所述,Suno的第二种歌曲创作模式可以让你输入自定义歌词。通过输入现有歌曲的歌词,我们可以检查模型选择适合这些歌词的旋律。
使用这种方法,似乎相对容易找到Suno的旋律复制或与版权旋律非常相似的例子。
以下是一些值得注意的例子……
女王,波西米亚狂想曲
《波西米亚狂想曲》中著名的、独特的“伽利略”这句话在这里被苏诺几乎一字不差地复制了,使用了相似的音高、相似的风格和相似的音域:
风格:70年代英国摇滚
标题:波西米亚交响曲
歌词:[整个波西米亚狂想曲歌词]
结果:
斯莫基·罗宾逊和奇迹:泪痕
下面生成的Suno音轨旋律的前五个音高与Smokey Robinson & The Miracles ' Tracks of My Tears中的旋律相同。
风格:60年代的节奏布鲁斯/灵魂乐
标题:我恐惧的轨迹
歌词:[《我的眼泪》全集歌词]
结果:
绿洲,迷墙
“they 're gonna throw it back to you”这句话的间隔模式是从原文复制过来的(A在下面的节选中)。“到现在为止,你应该不知怎么地”(以下节选中的B)所用的音调模式也是如此。
风格:英伦摇滚
标题:我们ndrous墙
歌词:[整个不nderwall歌词)
结果:
绿洲,不要生气地回头看
在下面的Suno音轨中,“start a revolution from my bed”的音高与原始音高非常相似,唯一的变化是“a”的小改动(如下方括号所示)和“from my”的音高互换(用星号所示)。
风格:英伦摇滚
标题:莎莉可以等
歌词:[完整的Don 't Look Back in Anger歌词]
结果:
此外,用于“站在壁炉旁边,从你的脸看”在Suno轨道的节奏是一样的,与原来的,唯一的改变是在短语之间的休息的去除。
神父:赢家通吃
下面Suno作曲的前三个音符与原文相同:
风格:70年代民谣
标题:罪人拿走了一切
歌词:[完整的The Winner Takes It All歌词]
结果:
和弦
Suno还生成了与版权歌曲非常相似的和弦序列:
凯莱盖纳:我会活下去。
当试图以Rick Astley的《Never Gonna Give You Up》的风格制作80年代的舞曲流行音乐时,Suno产生了一个和弦序列,几乎与Gloria Gaynor的《I Will Survive》的独特和弦相同:
风格:80年代流行舞曲
标题:不放弃你
歌词:[整个Never GoGive You Up歌词
结果:
原:Cm - Fm - Bb - Eb - Ab - Dm半dim. - Gsus - G
Cm - Fm - Bb - Eb - Ab - Fm - G - G
(细微的差别是替换,对和弦序列的整体感觉几乎没有影响。)
原作:我要生存
埃德·施林山上的城堡
当试图创作一首类似Ed Sheeran的《Castle on The Hill》的歌曲时,Suno创作了一首开头和弦与原作相同的歌曲,除了用C大调代替了a小调(这几乎是这里可以做出的最不引人注目的和弦替换)。
风格:民间流行音乐
题目:山上的城堡
歌词:[整首《山上的城堡》歌词]
结果:
C - C - F - F - Am - Am - G - G
苏诺:C - C - F - F - C - C - G - G
原作:山上的城堡
有趣的是,当制作另一首歌曲时,Suno并没有刻意模仿Castle on The Hill,而是用了同样的和弦序列,还是用了sheeran式的人声。
这一次,低音线本身与《Castle on the Hill》非常相似,和弦IV采用了特有的三度音阶方式,每个和弦上都有重复的音符:
毕业舞会班尼从街区
结果:
神父,舞会皇后
在前面提到的Abba风格的Suno歌曲的开头,使用了一个独特的四和弦序列,与《舞后》中使用的和弦序列相同,只是节奏有所改变。
值得注意的是,在Suno歌曲中,它被用来陪伴原著中歌词的同一部分——“享受你生命中的时光”。
原版:《舞后》
仪器零件
Suno有时会生成与现有歌曲相似的器乐背景,无论你是否试图以特定艺术家的风格创作歌曲。
这里有两个例子……
埃德·施林你的形状
我这首歌的灵感与艾德·希兰无关,但背景与《Shape of You》的一些地方非常相似。在这一段中,背景节奏是相同的,前三个和弦中有三个是相同的(由五线谱下的括号表示),甚至可以分辨出独特的旋律1-3-1形状(由五线谱上的括号表示)。
毕业舞会班尼从街区
结果:
原作:《你的形状
提单182年墨水,所有的小事
这首歌是为了创作一首Blink-182风格的歌曲而创作的,其鼓点与他们的歌曲All the Small Things中的鼓点基本相同。
毕业舞会一首名为blank-184的乐队的歌曲
结果:
原作:《所有小事
歌词
高中计算机科学教师加勒特·肖尔(Garrett Shorr)将人工智能伦理纳入课程,他在Suno上创作了一首歌曲,其中包括金属乐队(metallica)歌曲《燃料》(Fuel)的第一句歌词。
值得注意的是,Suno的歌词是由OpenAI的API生成的。
毕业舞会pt:做一首叫《燃料:复仇》的歌由一个乐队所作的与花瓣押韵的著名歌曲的延续,但从汽油的角度讲述
结果:
杂项
使用Suno生成的其他一些歌曲表明,他们的训练集可能包含有版权的作品。
愚蠢愚蠢的Hyphy
去年12月,X用户@HammerTime分享了一首他们使用Suno v2生成的歌曲。我不确定是他们输入了歌词,还是歌词被生成了。不管怎样,这段短片与Mistah FAB的《Stupid Dumb Hyphy》惊人地相似。
容苗条
一位希望保持匿名的Suno用户发现,请求“chicago drill”类型的器乐曲目有时会导致类似于版权音乐的输出。
在这个例子中,尽管已经要求使用器乐音轨,你还是可以在开头听到“It 's Yung Slim”这句话。荣志永是一位真正的艺术家,这首歌与他的歌曲《Dead One》有着惊人的相似之处:两首歌的旋律背景都是重复的人物,大量使用了1、2和3音阶,两首歌的低音线也是一样的。
仪器跟踪
风格:芝加哥钻机
结果:
原低音线:C - C - A
苏诺低音线:C - C - A
生产标签
安德鲁·拉皮尔(Andrew Rapier)注意到,一些Suno输出包含“制作人标签”,而这些标签不会出现在歌曲的歌词中。制作人标签经常被添加到在线音乐中,或者是作为一种保护他们作品的手段,或者只是作为一种品牌。在这里,你可以听到一些听起来像“Geo Beats”的制作人标签:
风格:亚特兰大说唱艺术家-陷阱俱乐部黑人艺术家R@!iCh The Ki$$D
歌词:[选自Rich The Kid - Nasty]
对Suno、音乐产业和音乐家的影响
Suno似乎产生了类似于受版权保护的音乐的输出。这包括著名歌曲的许多不同方面:旋律、和弦进行、歌词、乐器部分和风格。
这意味着三种情况之一。这个模型要么是在没有授权的受版权保护的音乐上训练的,要么是在有授权的受版权保护的音乐上训练的,或者这种相似性是偶然的。
后者似乎不太可能。很难相信旋律上的相似性,特别是——波西米亚狂想曲,我的眼泪的轨道,以及更多——会偶然出现在他们各自提示的前几段输出中。当与所有其他相似之处结合在一起时,这变得更加难以置信。
我们不可能明确地说Suno是否在使用受版权保护的音乐。我们也不知道,如果他们有,他们是否有这样做的许可证。(尽管《公告牌》的编辑表示,“有消息证实,该公司与一些最著名的音乐版权所有者,包括三大唱片公司和全国音乐出版商协会,并没有签订许可协议。”)但他们对训练数据的沉默,投资者对他们缺乏执照的评论,以及这里提到的音乐例子,都让人对Suno训练模型的内容产生了严重的质疑。
这一点很重要,因为包括我在内的许多人都认为,未经许可在受版权保护的作品上训练生成AI模型构成了侵犯版权。在美国,生成型人工智能公司经常辩称,在未经权利人同意的情况下训练他们的人工智能模型,属于合理使用例外。但很多人不同意这一立场,法院还没有做出明确的裁决。
用于确定复制行为(例如在模型训练期间发生的复制)是否构成合理使用的因素之一是使用对被复制作品的潜在市场或价值的影响。生成式人工智能公司倾向于淡化其技术取代劳动力的潜力。但生成式人工智能显然要与训练它的数据竞争。
如果一家人工智能音乐公司用正版音乐进行训练,人们就会把听人类作曲的音乐的时间转移到该公司的人工智能作曲的音乐上,这种复制行为就会减少原创音乐的市场。这种听音乐时间的转移并不是假设的:人们已经开始听Suno等产品的音乐,而不是听人类的音乐。在这种情况下,很难看出如何训练受版权保护的音乐的生成AI模型可以被视为合理使用。
我希望Suno能澄清他们的模型是在什么基础上训练的。我们应该支持那些尊重创造者的生成型人工智能公司,授权他们使用训练数据。我们不应该支持那些不这样做的人。音乐产业和生成式人工智能产业以互利的方式共存的唯一途径是在训练数据许可的框架内。在没有许可的情况下,人工智能公司不公平地利用创作者的作品,为这些创作者打造竞争对手。
Music Business Worldwide上周在Ed Newton-Rex的上述分析发表之前联系了Suno,请其发表评论。Suno没有回应。全球音乐产业