2022 年人工智能音乐发展现状：初创公司、音乐人及挑战

“Beautiful The World”是一首使用经过音乐数据库训练的人工智能创建的曲目，以及动物的音频样本。是的，你没有猜错，它来自澳大利亚。这是2020年人工智能歌曲大赛的获奖作品，这是一场面向音乐家、科学家和开发者的全球性比赛——本质上是人工智能音乐的欧洲歌唱大赛。这是2020年创造性人工智能技术能力的写照，但计算机音乐在理论或实践上都不是全新的事物。早在1950年代初期，一台名为 CSIRAC的计算机就被用来播放数字音乐"Colonel Bogey"，尽管它不能创作音乐。

从1950年代开始，世界各地的研究人员一直在探索使用计算机的算法作曲。而在后来的几十年里，这与鼓机和合成器等电子乐器的发展不谋而合，这进一步模糊了人类制作音乐和机器制作音乐之间的界限。实际上，这些模糊的界限是一个重要的原则：多数时候我们并不是在谈论完全靠自己制作音乐的机器（或现在的人工智能）。更多是关于人类如何使用机器或人工智能来制作音乐。人和机器双方都有不同程度的参与。

人工智能音乐的早期商业化

虽然本文的重点是最新的人工智能音乐，历史回顾也是必不可少的。2014年12月，当时一家名为 Jukedeck的英国音乐科技公司在巴黎举行的Le Web大型科技会议上获得了初创企业推介奖。该公司建立了一个人工智能系统来生成免版税的音乐曲目，可供视频博主、游戏开发商和企业使用。它的宣传口号小心翼翼地强调它并没有试图让音乐家失业。 “作曲家是音乐世界的基石（我们自己就是作曲家！）。但不是每个人都能雇用专门的作曲家，而这正是我们的用武之地”。一年后，即2015年12月，Jukedeck正式推出其服务，让人们每月免费创作五首歌曲，之后的每首歌曲则收取7美元。完整拥有其版权需要150美元。

2017年2月，一家名为Amper Music的美国公司成为Techstars Music加速器的第一批初创公司之一。与Jukedeck非常相似，它的创始人也是作曲家。与Jukedeck一样，Amper将自己定位为音乐库的替代品，其人工智能系统能够根据客户设定的心情、风格和长度生成曲目。它使用订阅模式，包括提供免版税的全球使用许可。该公司也不愿被视为作曲家的敌人。“这是一种帮助提高创意工作的工具，无论他们是否是音乐人。这是一个合作伙伴；一个提供帮助的技术而不是取代工作的技术，”其首席执行官说。

这两家开创性企业都已被收购。Jukedeck于2019年被字节跳动收购，而Amper Music则于2020年被图片视频音乐库Shutterstock收购。这表明大公司对人工智能音乐和初创公司表现出兴趣，我们稍后将更深入地探讨。

人工智能的用途：成品音乐

现来谈谈人工智能音乐的一些具体用途了。我们将从Jukedeck和 Amper Music正在做的成品音乐开始。他们的系统正在按需求生成音乐。客户会告诉计算机他们想要多长时间的曲目以及其风格和情绪的其他信息，然后人工智能会吐出客户愿意接受的曲目，或者客户选择拒绝并拿到新的一首曲目。

另一商业模式开创自来自初创企业Amadeus Code，该公司最初开发的是人工智能作曲辅助工具。在2019年，它推出了一个名为 Evoke Music的免版税音乐库，人工智能生成的曲目由其人类团队精心挑选。这样的转型在人工智能音乐圈并不罕见，因为初创公司要持续寻找与他们技术相匹配的商业模式。

另一个例子是柏林的初创公司Loudly，它最初的产品是人工智能remix。当遭遇版权方不愿提供授权的困难后，该公司改变了策略并建立了一个名为Loudly AI Music Studio的工具。AI Music Studio同Jukedeck 和 Amper Music最初的目标基本一致，即为视频博主、游戏开发商和其他企业提供免版税音乐创作。

另一家一直在探索人工智能音乐公对公业务前景的欧洲初创公司AIVA被定位为“能创作有情感的配乐的人工智能”。它的目标客户同样包括游戏开发商、视频博主和企业。AIVA现有企业客户包括英伟达、沃达丰和TED。尽管AIVA保留其音乐的版权，非商业用途的话免费的。商业用途的使用需要其他更高的产品级别，其中AIVA可以保留版权，或者客户完全拥有版权。AIVA还是第一家其人工智能系统被一个作曲家协会（法国的Sacem）正式认可为作者的人工智能音乐公司。人工智能作作曲家身份是一个有争议的话题，我们稍后再讨论。

人工智能制作音乐领域的一些初创公司已经将目光投向了特定应用领域，Infinite Album就是其中之一。它专注于为游戏直播提供生成音乐：人们在Twitch等平台上直播，如果他们在直播中使用商业音乐，他们的直播内容就有可能因版权问题而下架。Infinite Album不仅为游戏播主提供原创音乐供他们使用。它的系统可以实时调整音乐以适应正在玩的游戏，而观众也可以通过打赏来影响音乐的流派、情感和乐器，这反过来又为播主创收。Infinite Album适用于许多热门游戏，包括堡垒之夜Fortnite、Apex Legends、无畏契约Valorant和英雄联盟。测试版已于2022年3月推出。

DAACI同样专注于游戏音乐。2022年6月公开亮相，DAACI正在筹划500万美元的融资。 DAACI建立的个人工智能可以“创作、编排、配器和制作”原创音乐，其用途包括动态乐谱和游戏配乐。

Beatoven是一家来自印度初创公司，致力于将其音乐人工智能提供给视频和播客创作者。用户将内容上传后，需要为录音的不同部分标记编辑点，然后从16种情绪和5种音乐流派中进行选择。之后Beatoven的人工智能便会根据这些要求创作音乐。它在2022年初筹集了100万美元，以便继续构建其技术和服务。

另一个新入场的公司Soundful于2022年4月从包括环球音乐集团和 Beatport的高管在内的投资者那里筹集了380万美元的种子资金。它是一种使用人工智能创造“想法、洗脑旋律和伴奏”的工具。其目标客户包括网红，目的是让他们可以创作自己的音乐而不会导致他们的视频因侵权而下架。

Venturesonic分拆自英国的AI Music。它与一家名为Made Music Studio的声音品牌公司合作推出了一项服务，为大公司的商业品牌创建定制曲目。其早期客户包括阳狮传媒Publicis Media、维珍超级高铁Virgin Hyperloop和北极星工业Polaris Industries。随着AI Music被苹果收购，Venturesonic目前的状况尚不清楚。

人工智能系统在制作音乐的另一个方面是创建loop循环段、采样和音频效果。对于Splice和Tracklib等公司来说，这是一项非常成功的业务，它们拥有由人类音乐家创建的大型音频数据库。Tapes.ai试图用人工智能生成的声音来挑战他们。2021年它推出的服务声称是“采样包的未来”。它的人工智能创造了所有的声音，然后经由人类团队整理成超过5000个循环的一个个采样包。Splice也在试验人工智能。提供“声音推荐”的采样合成器CoSo在聆听音频源后能从其采样库中自动寻找合适的声音。这并不是人工智能本身创造音乐，而是更多地参与人类音乐制作过程中的声音管理。

AI音乐的用途：功能音乐

现在让我们谈谈使用人工智能生成功能音乐。这意味着用于特定目的的音乐：比如帮助你放松；工作或学习；或者帮助睡眠。

Endel是一家美国初创公司，其技术承诺“帮助您集中注意力、放松和睡眠的个性化音乐环境”。Endel现有手机和电脑软件以及亚马逊智能音箱 Alexa。该应用程序的工作原理是让人们告诉它他们在做什么，然后生成适合的背景音乐。其中一些音乐来自Endel的人工智能和人类艺术家之间的合作。2020年，它与Grimes合作“人工智能摇篮曲”，并通过Endel的应用程序分发。 Grimes将原始音乐和人声创作为子总线stems，然后 Endel的人工智能将其重新混合成背景音乐。2021年，它与电子音乐艺术家Richie Hawtin（又名Plastikman）重复了这一合作模式。音乐家为Endel提供了一系列音乐素材，人工智能将它们变成了旨在帮助人们集中注意力的音乐。Music Ally就该项目采访了Hawtin和Endel。 Endel 的首席执行官将这个过程描述为“以子总线stems的形式提取他的基因，并将其送入算法”。Hawtin则称其“为人工智能提供了最好的构建模块”，这样它就可以创造出“具有我的音乐语言特征”的音乐。

Endel正在寻找其他方法来让人们听到他们的功能音乐。2019年，它推出了一个专门用于“睡眠音乐”的全天候Twitch直播频道。2021年，它与梅赛德斯-奔驰合作，为驾驶员生成自适应配乐，以保持他们的高度专注并缓解压力。 Endel的人工智能使用包括汽车速度、驾驶风格、天气和道路类型在内的信号来塑造音乐。Endel还将其人工智能创作的一些音乐变成了传统专辑，并在流媒体平台上发布。在2019年与华纳音乐集团达成分销协议后，它发行了更多专辑。

人工智能的音乐如何人类音乐家竞争？当我们在2022年2月查看时，Endel在Spotify上的每月听众刚刚超过3.7万人。在撰写本文的5个月后，由于最近与James Blake的合作，它现在拥有超过8万每月听众。Endel的音乐已经进入了Spotify的一些氛围音乐播放列表（Submerged、Ambiente和The Quiet Club），因此该流媒体平台的一些策划人看到了它的价值。投资者也是如此：该公司在2022年4月筹集了1500万美元。

其他初创公司也致力于情绪音乐。Aimi就是其中之一。它在2020年推出了一款应用程序，能将人类艺术家的音乐改编成电子音乐，就像Endel对 Grimes和Plastikman的音乐所做的那样。该应用程序可以免费试用，每天使用超过30分钟的人需要按月订阅。2021年11月，Aimi筹集了2000万美元的资金，并暗示计划使用区块链技术向其创作者支付版税。

另一家初创公司Mubert，最初产品也是能提供人工智能生成的音乐的一款应用程序。它可以帮助人们睡眠、集中注意力和冥想，涵盖各种音乐风格。然而，自2018年首次推出以来，Mubert已经拓展到其他领域：例如一款名Mubert Render的视频创作者的配乐制作工具；以及为希望在创作过程中使用人工智能的音乐人提供的名为Mubert Studio的软件。这是公司转型的另一个案例。一家初创公司在构建具有特定商业模式或用户场景的创意人工智能时，随着时间的推移会意识到其他更适合的其他用途，或者至少更好的机会来建立完善的商业模式。

另一家有特定用途的人工智能音乐初创公司是LifeScore。它于2019年由英国作曲家Philip Shepherd和Tom Gruber共同创立，后者是 Siri的联合创始人——苹果买下了Siri并成为其同名语音助手。LifeScore的技术并不是使用人工智能从头开始创作音乐。相反，该公司录制了人类古典音乐家，然后将音乐分割成更小的片段。LifeScore的人工智能之后将这些片段拼接成自适应音乐。最初的演示产品是一个移动应用程序，当你四处走动时，音乐会随着你的步伐或转向而改变。该公司还为Twitch总部创建了一个反应式音乐显示器，并与宾利合作为驾驶员创作自适应音乐——这与Endel与梅赛德斯-奔驰的合作类似。2022年3月，LifeScore筹集了1100万英镑的融资，而华纳音乐集团是投资者之一。该公司正计划与艺术家合作，作为其发展的一部分。

人工智能音乐的用途：创意工具

现在是时候谈谈专业音乐人如何使用创意人工智能作为他们歌曲创作和录音过程的一部分。

我们之前谈到了Amadeus Code。它最初的产品被定位为“人工智能歌曲创作助手”：一款移动应用程序，根据从经典歌曲中学习到的数百个和弦进行生成旋律。然后这些旋律可以作为音频和MIDI文件导出到数字音频工作站，供音乐家在他们的项目中使用。因此Amadeus Code并没有取代音乐家，而是被设计为一种创造性的工具：促使词曲作者走出他们的舒适区，或者帮助他们避免创意卡住。

Algoriffix是另一家探索这一想法的瑞典初创公司。它于2021年9月推出的应用程序向人类音乐家宣传它是“人工智能合作伙伴”。人们可以上传无伴奏的独奏音频或子母线stem，以便其算法识别音符并推荐最佳的节拍和和声。该公司希望同时吸引职业音乐家和音乐学生作为在创作新歌时的工具。

英国初创公司Vochlea 是人工智能被用来增强人类音乐家创造力而不是试图取代人类的另一个例子。该公司的第一个产品是硬件（麦克风）和软件的组合，该软件可以获取音乐家的声音并使用它们来控制乐器。你可以对着麦克风beatbox，软件就根据这些声音创建鼓的midi轨道，或者直接哼唱来创建低音旋律。Vochlea的技术旨在帮助人类将声音从他们的脑海中释放出来，并放到他们的数字音频工作站上。 2021年9月，Vochlea推出了其第二代产品，这是一款纯软件产品，不再需要专门的麦克风。

艺术家打造的创意人工智能

一些最有趣的辅助人工智能是由音乐家构建的，或者至少是有音乐家的密切参与。

Holly Herndon是现代人工智能音乐的重要人物。在她2019年的专辑“Spawn”中，她和她的团队构建了一个名为Spawn的人工智能，在她和其他歌手的声音样本上对进行训练，然后在专辑中将输出结果用作歌手。在2021年，Herndon推出了名为Holly+的产品，与一家名为Never Before Heard Sounds的初创公司合作。她将Holly+描述为自己的“数字双胞胎”。人们可以上传和弦音频，并下载数字Holly的演唱版本。Herndon还以DAO的形式建立了一个社区和商业模式——一个去中心化的自治组织，是当前web3运动与NFT和区块链技术一起的大趋势之一——通过 Holly+创作的音乐将创造一个流动版权，可用于技术开发投入。

美国组合Yacht在2019年为他们的“Chain Tripping”专辑构建了一个人工智能系统，在他们整个音乐库上训练，以便它可以创建新的原创音乐和歌词。然后乐队将其塑造成专辑的10首曲目。Yacht决定他们不会在人工智能制作的音乐或歌词中添加任何东西，拿来直接用。人工智能并没有取代人类音乐家的创造力。在制作“Chain Tripping”专辑的过程中人工智能发挥了关键作用，但人类仍然是最终驱动力——无论是通过他们过去的音乐数据训练人工智能，以及对如何使用人工智能输出做出的决定。

如果你对人工智能音频感兴趣，那么Dadabots的工作绝对值得关注。这是一个由音乐家和开发人员组成的团体，近年来创建了一系列有趣且具有启发性的项目。“我们开发的神经网络输出原始音频，可以模仿乐队。”这些项目包括Relentless Doppelganger，一个“神经技术死亡金属”的YouTube直播，还有与之匹配的视觉效果。Dadabots也参与了Outerhelios，另一个全天候生成音乐直播，这次是自由爵士。通过与美国宇航局的合作，Outerhelios从航海者3号太空探测器上广播。Dadabots还创造了受食人尸乐队Cannibal Corpse启发的永无止境的音乐；贝尔实验室纪录片的神经beatbox视频；还有一个有趣的 deepfake项目，使用人工智能模拟Nirvana翻唱Gorillaz。哦，他们参加了 2022 年的人工智能歌曲比赛，而且是与Nuns in a Moshpit乐队合作！Dadabots是一项实验性艺术和技术研究，而不是一家商业初创公司，但其的工作与我们一直在分析的公司一样，正在帮助推动人工智能音乐的艺术和科学向前发展。

人工智能音乐的用途：帮助业余用户制作音乐

我们已经讨论过使用创意人工智能的专业音乐人，但对于业余玩家使用这项技术来制作音乐还有很大想象空间。

澳大利亚初创公司Splash是这两个领域之间的桥梁。2017年，Splash当时（原名Popgun）它推出了一个名为Alice的人工智能，可以与人类一起弹钢琴，用自己的旋律回应他们演奏的内容。这个人工智能很快就被用于其他用途：一个名为Splash Pro的产品，音乐家可以使用它来获得由人工智能生成的钢琴、贝斯、鼓和人声作品，以导出到他们的数字音频工作站并在他们的项目中使用。

通过一款名为Splash的程序，Popgun将其人工智能产品转化为普通消费者使用。它最初是一个移动端音乐制作应用，人们可以通过点击代表节拍、循环和音效的网格来创作歌曲。这些声音是在主题包中下载的，不同的是，所有这些声音都来自Popgun的人工智能。Splash为没有受过音乐训练或乐器技能的人提供了一种开始制作音乐的方式。在2020年5月，当Popgun将Splash带到游戏平台Roblox时，它提升了几个档次，人们可以使用该工具制作较短的DJ列表，在其他玩家跳舞和聊天的同时创作音乐。在最初的20天里，有超过100万人玩了这款游戏。到2020年11月，这一数字已经增长到2100万人。从那时起，Splash的Roblox游戏通过新的地点和活动不断扩展，而Popgun在筹集了2000万美元后，于2021年11月更名为Splash。Splash已经帮助数百万人使用人工智能创建的元素创作音乐，其中许多是孩子。就消费者范围而言，它是迄今为止最大的人工智能音乐项目。

创造性人工智能技术还被融合进了一些现有音乐创作应用。 BandLab有超过5000万人使用它的应用程序来录制和分享音乐。2022年3月，它添加了一个名为“SongStarter”的功能，可以根据用户的需求生成节拍、旋律及和弦，甚至可以用歌词甚至表情符号来输入需求！该公司表示，这只是其向辅助人工智能工具扩张的“开始”。

另一个面向音乐家的人工智能音乐工具Starmony于2021年7月在瑞典推出。它与Vochlea同属一个赛道，承诺让艺术家或制作人“只需要你的声音就能创作一整首歌”，然后分享你的歌曲。当年该公司筹集了340万美元的资金，它表示希望吸引下一代艺术家，“那些在TikTok有创意并在现成伴奏下唱歌的人”。它的联合创始人曾是X5 Music的老板，一家流媒体编辑公司，于2016年被华纳音乐集团收购。

另一家专注于非专业人群的人工智能音乐初创公司是美国的Boomy。它于 2019年推出，根据设置的流派和风格等参数获取由其系统生成的一段音乐。如果你不喜欢这首音乐，你可以简单地按下一个按钮来获取另一个，直到你找到适合的音乐。你还可以编辑音轨，例如移动、添加和删除小节。这与几年前Jukedeck和Amper Music的做法非常相似。然而Boomy的重点有所不同：它希望人们通过将他们使用其系统制作的曲目编成专辑来商业发行，而不是制作廉价的背景音乐。Boomy将音乐分发给40多个流媒体平台，包括Spotify、YouTube和TikTok，然后与制作歌曲的用户分享每首曲目的版税。用户获得80的版税，而Boomy拥有版权，创作者也可以将曲目用于大多数个人和商业用途，例如在他们自己的视频和播客中。作者在2019年尝试了Boomy，发行了两张人工智能创建的专辑。专业音乐人不用担心，因为从那时起的总收入还不到五美元！Boomy用户自推出以来已创作了超过750万首曲目。这家初创公司估计，这占到全球录制音乐的7.7以上。

人工智能音乐的用途：虚拟艺术家

创意人工智能最有趣的用途之一是为虚拟偶像创作音乐，一个虚拟角色也可以像人类艺术家一样发布音乐。当然，这并不新鲜，但在过去，虚拟偶像的音乐仍然是由人类创作的。例如在Gorillaz背后，有Damon Albarn和不断轮换的客座音乐人团队。英雄联盟游戏已经产生了几个虚拟组合，但音乐还是由人类制作的。如果将人工智能生成的音乐与虚拟角色混合会发生什么？一些公司正在尝试这种可能性。

Authentic Artists出现于2021年4月，投资方有媒体高管James Murdoch和林肯公园主唱Mike Shinoda，后来还获得了华纳音乐的投资。Authentic Artists正在构建虚拟艺术家和创意人工智能需要的音乐。它的角色包括一条龙、半机械人和一只兔子，音乐由人工智能制作。在2022年，该公司参与进行非同质化代币发行。

Auxuman是一家由音乐家Ash Koosha在英国共同创立的初创公司。它创建了一个名为Yona的虚拟艺人，并建立了一个人工智能系统来为她创作音乐，然后在2019年建立了一个更大的虚拟艺人团队。Auxuman后来转向开发auxWorld，一个将于2022年晚些时候推出的“元宇宙体验平台”。

人工智能音乐、虚拟偶像和元宇宙的融合也可以从虚拟现实初创公司 Sensorium的做法中看出。它正在构建一个名为Sensorium Galaxy 的虚拟世界，音乐将成为其中的重要组成部分。其中一些音乐将来自人类DJ，合作者包括David Guetta、Carl Cox、Steve Aoki和Charlotte de Witte等人。Sensorium也在打造自己的虚拟DJ形象。Kara Mar，一个虚拟的techno DJ，将在Sensorium Galaxy中表演，并通过文字聊天和视频通话与粉丝互动。但重要的是，她演奏的音乐将由人工智能生成——特别是来自Mubert，我们之前谈到的初创公司之一。

人工智能音乐的用途：老歌手的新歌曲

我们将在段讨论的人工智能音乐的最终用途是为老一辈，甚至是已经过世的歌手创作新的作品新歌。在艺术家的作品库上训练人工智能，然后看看它想出了什么新音乐。

这种方法是2016年首次获得广泛关注的人工智能音乐公开演示之一，当时索尼计算机科学实验室发布了一首名为“Daddys Car”的歌曲。它是由一个名为Flow Machines的系统创建的，索尼计算机科学实验室在披头士乐队的歌曲库上进行了训练，看它是否可以创作出有足够披头士乐队风味的歌曲。你听听看？

需要注意的是这不仅仅是人工智能的产物：Flow Machines的输出随后由人类音乐家Benoit Carré编曲制作。Benoit Carré是当代人工智能音乐的另一个重要人物。2019年，Carré还发行了一张名为“American Folk Songs”的EP，它收录了美国传奇民谣歌手Pete and Peggy Seeger以及Horton Barker的无伴奏合唱录音，并使用人工智能为其创作编曲。

另一个登上头条的项目是2021年的“Lost Tapes of the 27 Club”。在这里，人工智能系统接受了Nirvana、Amy Winehouse、Jim Morrison和Jimi Hendrix的歌曲数据训练，然后根据这些歌曲创作“新”音乐。人类再次在整理人工智能的输出以及决定哪些音乐片段可以组合成新歌曲方面发挥了重要作用。一位致敬乐队的歌手演唱了Nirvana的新曲目“Drowned In The Sun”。该项目的名称来自所有艺人都于27岁时去世的事实，希望借此提高人们对音乐行业心理健康问题的认识。

当然，不是加入27岁俱乐部才有资格参与其中。2020年的Travisbott项目来自于一家名为Space150的数字机构，该机构在美国说唱歌手Travis Scott的音乐和歌词上训练了一个人工智能。最后的作品是一首名为“Jack Park Canny Dope Man”的歌曲，并附有一段怪异的deepfake音乐视频。这不是一个商业项目，也不是Travis Scott本人的营销噱头。它更多的是对技术能力的探索。

互联网科技巨头与人工智能音乐

到目前为止，我们已经讨论了很多关于涉及人工智能音乐的初创公司和艺术家。一些最大的互联网公司也涉足这一领域。

我们之前谈到的来自Benoit Carré的美国民歌重构项目就是使用 Spotify内部实验室开发的工具完成的。2017年，Spotify聘请了François Pachet来领导一个实验室。 François Pachet之前是巴黎索尼实验室的总监，Daddys Car”歌曲背后的团队的核心，也是世界上最杰出的人工智能音乐专家之一。当时的一些报道认为François Pachet将帮Spotify打造一个情绪音乐生成音乐库，但该公司一直坚持这项雇佣是为音乐家构建工具。福布斯杂志最近对此的跟进表明这些工具也可能可供音乐爱好者使用。“一个可以让你调整歌曲的节奏或旋律的工具。你可以将贾斯汀比伯或Drake的流行和声与舒伯特或巴赫赋格的旋律节奏结合起来。”

苹果在这方面也值得密切关注。2022年2月，苹果公司收购了前面谈到的英国初创公司AI Music。AI Music的最初使命是构建一个能够适应提供的音乐的人工智能——或者按照公司的描述，“改变现有音乐”。它希望能够将歌曲改编成不同的风格和流派以满足听众的需求。例如，将一首歌变成健身房的deep house单曲，或适合放松的深夜爵士曲目。苹果经常收购初创公司，而且几乎从不谈论之后的计划安排。它可能被用在苹果音乐或苹果锻炼+服务中。它也可以使用该技术为库乐队GarageBand添加新的辅助工具，或将其部署在iMovie或Final Cut Pro产品中，以帮助人们将音乐适配于视频内容。我们没有确切答案，但苹果收购人工智能音乐专家团队肯定是很有趣的举动。

第一家有名的人工智能音乐初创公司Jukedeck在2019年被TikTok的母公司字节跳动收购。Jukedeck的首席执行官成为TikTok内部人工智能实验室的产品总监，尽管此后他辗转其他工作岗位。TikTok的增长受到商业音乐的推动，并且随着与唱片公司和发行商的授权关系增加，商用授权已成为唱片公司的重要收入来源而不仅仅是宣传渠道。人工智能生成的音乐显然也有可能在TikTok中发挥作用。想象一下，你可以在制作视频时按下一个按钮来创建即时的、原创的、生成的配乐……

谷歌是另一家探索人工智能音乐方向的互联网科技巨头，尽管感觉上它的兴趣主要是实验性的。它在这方面没有具体业务，但确实将音乐视为测试其更通用人工智能平台能力的途径。2016年，谷歌宣布了Magenta，这是一个探索机器学习技术（人工智能的子集之一）用于创作引人入胜的艺术和音乐的项目。Magenta旗下的成果包括2017年的AI Duet，它是一个人工智能钢琴演奏者，可以响应你作为人类演奏的内容，以及Nsynth，一个人工智能驱动的基于软件合成器，能够创造全新的声音。2019年，谷歌在其搜索主页上将著名的谷歌涂鸦用于人工智能音乐展示。用户在网页上创作旋律，然后使用人工智能将其编配为约翰·塞巴斯蒂安·巴赫(Johann Sebastian Bach)的标志性四部和声。2020年的Lo-Fi Player是由人工智能生成的低保真嘻哈音乐，这种音乐风格在YouTube上非常受欢迎。人们还可以通过点击屏幕上的不同对象可以与音乐互动。同年，谷歌还推出了Blob Opera，这是一组可爱的水滴形歌剧歌手，由受过人类歌手训练的人工智能驱动。所有这些都是有趣、创新的演示，但Magenta更大的价值在于它可以被任何构建自己的人工智能音乐系统的人使用，无论他们是开发人员还是音乐家。谷歌已经为整个世界的人工智能音乐可能性构建了底层技术支撑。

还有两家大型科技公司需要介绍。首先是OpenAI，一家由特斯拉创始人埃隆马斯克支持的非营利性人工智能公司。它靠文本生成的GPT-3深度学习模型而闻名。该公司也致力于人工智能音乐研究。2019年，它发布了MuseNet，这是一个可以用10种不同的乐器生成四分钟的作品的神经网络。MuseNet声称可以“结合从乡村音乐到莫扎特到披头士的任意风格”。在2020年，它发布了Jukebox，这是另一个可以生成音乐和人声的神经网络。该公司表示可以创作原创音乐；重写现有曲目；截取一段12秒的音乐片段并将其完成为一首完整的歌曲，并按照猫王、弗兰克·辛纳屈、凯蒂·佩里和其他歌手的风格创作deepfake翻唱版本。与谷歌一样，OpenAI与其说是在人工智能音乐上建立业务，不如说是创建其他开发人员和艺术家可以在他们的项目中使用的框架。

最后，电商巨头亚马逊通过2019年的项目DeepComposer涉足人工智能音乐。这也是为开发人员制作的工具，带有示例代码和训练数据的钢琴键盘可帮助人们探索生成音乐。这更像是一个针对机器学习学生的教育项目，而不是与亚马逊音乐相关的任何业务。

围绕人工智能音乐的讨论

我们已经讨论了人工智能音乐的一些主要用户场景，介绍了在该领域运营的主要初创公司；也探索了一些最大的科技公司正在做什么。我们接下来将通过围绕人工智能音乐及其对人类音乐家和更广泛的音乐产业的影响来结束这篇文章。

最棘手的争论之一是关于人工智能是否可以合法地成为音乐作者。我们提到其中一家初创公司AIVA已被法国的作曲家协会Sacem接受为成员。但在其他地方，这是一个有争议的问题。2022年2月，美国版权局驳回了发明家Steven Thaler针对他的 Creativity Machine AI无法对其作品（本案中为视觉艺术）的决定提出的上诉。版权局的观点是由机器或单纯的机械过程制作的作品，因为没有人类作者的任何创造性投入，所以不受到版权保护。在商业人工智能音乐的背景下，这意味着合法作者要么是人工智能系统的创造者，要么是使用人工智能创作音乐的人。

围绕人工智能音乐的另一场争议涉及侵权的定义。确切地说，在受版权保护的音乐数据上训练音乐人工智能是否涉及侵权？该过程通常涉及复制音乐数据库，因此答案可能是涉及侵权。然而，正如律师事务所Reed Smith的合伙人Sophie Goossens在2019年接受采访时向我们解释的那样，事情并非如此简单。在美国，根据过去的多项法院判例，在受版权保护的音乐上训练人工智能被认为是合理使用。日本、新加坡和中国等国家也是如此。这些国家都是人工智能技术的新兴参与者。然而，在欧洲，情况就不同了。最近的版权立法允许权利人保留对其内容的文本和数据挖掘的权利——无论是音乐、文本、视频或其他材料。这为版权所有方创造了一个将人工智能训练数据授权给欧洲的人工智能初创公司的商业机会。当然，初创公司只需在世界其他地方注册办公室，就可以为此类数据训练寻找更有利的法律环境。

Trance音乐人Brian Transeau（人称BT）在2021年接受《连线》杂志采访时谈到了这场持续的争论。他质疑人工智能公司“拿走他人的作品来训练模型”是否合理，并建议公司应该“首先与艺术家本人沟通”。BT的观点是，需要有“保护机制”来保护音乐家、视觉艺术家、程序员和任何其他可能用于训练人工智能的创造性工作者。这将是一种对人工智能公司商业模式的一记闷棒，但你也可以从乐观的角度来看待。这将刺激初创公司将人类艺术家视为合作伙伴，共同创作，而不是简单地为模型训练的数据提供方。当这篇文章发表时（2022年7月），英国音乐产业机构UK Music正在其代表唱片公司、出版商和音乐家等各个成员机构的支持下抗议英国政府的计划。该计划会允许人工智能对音乐进行数据挖掘，而公司无需获得其创作者和版权所有者的许可。

前文讨论了Endel和Aimi等初创公司如何与艺术家合作，以及Holly Herndon和Yacht等艺术家如何构建自己的人工智能系统。这种人机协作是可行的，而且应该得到鼓励和支持。艺术家越多地接触这项技术，他们就越有能力塑造技术的发展方向以和商业模式。这点也适用于更广泛的音乐产业。唱片公司和发行商在参与或投资人工智能音乐初创公司方面多少有些遮遮掩掩，至少在公开宣传上是这样。为什么呢？一个原因是担心旗下的艺人对此类举动的反感。然而，就像音乐家一样，音乐版权所有方也可以通过与初创公司和开发人员共同建立人工智能系统来帮助塑造这项技术及其发展方式。

华纳音乐集团于2022年3月对LifeScore的投资在这方面是一个令人鼓舞的迹象。近年来，唱片公司已成为音乐科技初创公司的积极投资方，而人工智能音乐无疑是一个值得参与的领域。在2021年下半年和2022年年初，对人工智能音乐初创的投资规模正在大幅提高。Splash和Aimi均获得了2000万美元的融资，而LifeScore的融资额为1440万美元。随着这项技术从实验性演示转向实际业务，我们预计在2022年和2023年会看到更多用于人工智能音乐的千万级融资。

围绕人工智能音乐的最大问题一直是关于它是否会抢走人类音乐家的工作，威胁作曲家的生计构成生存。这个问题还没有一个简单的答案。毫无疑问，人工智能音乐将在某些领域与人类音乐竞争。制成音乐就是其中之一。Hans Zimmer不必担心被人工智能竞争对手打败而失去大片配乐的工作，但在为社交视频或企业培训影片提供快速、廉价的配乐时……情况可能就不太一样。情绪音乐是另一个受威胁的领域。如果有人正在寻找一个音乐电台来工作、学习、放松或睡觉，生成音乐是绝对可行的。尽管如此，像Endel和 Aimi这样专注情绪音乐的初创公司似乎依然热衷于与人类艺术家合作，而不是取代他们。

也许更具正面意义的问题是，创造性人工智能将如何帮助提升人类的创造力？这些系统可以将音乐家跳出创作屏障，或者激发他们的音乐舒适区之外的想法。它们可能是鼓机和合成器等乐器的下一次迭代，而人类艺术家依靠创造力和音乐才能得以充分利用了这些工具。

考虑非专业音乐人也很重要，或者更准确地说，那些潜在的音乐家。BandLab、Splash和Boomy都是利用创意人工智能怎样向没有受过音乐或乐器训练的人打开音乐创作大门的例子。他们可能会使用这些音乐在社交网络上分享，也可能是更认真地制作音乐的垫脚石，当然最可能只是单纯为了好玩。另外人工智能音乐娱乐为心理健康服务也一个有值得探索的方向。

所以，读过这篇文章最重要的收获可能是，无论人工智能音乐会成为什么样，以及它可以帮助人类做什么，音乐行业需要通过不断接触这些前沿技术才能真正理解。尝试这些人工智能，与这些初创公司交谈，探究他们现在的技术水平，并帮助塑造他们未来的发展方向。

本文出自《midifan月刊》2022年08月第197期

可下载 Midifan for iOS 应用在手机或平板上阅读（直接在App Store里搜索Midifan即可找到，或扫描下面的二维码直接下载），在 iPad 或 iPhone 上下载并阅读。