N/A - LALAL.AI
-
设备类型:
声音分离
- 媒体价格: 免费起
- 产品状态: 暂无
详细介绍
LALAL.AI 宣布旗下神经网络模型 Andromeda 完成重大更新,正式将鼓组与贝斯音轨分离功能整合至统一 Transformer 架构,打破此前不同音轨依赖独立模型处理的局限,为音乐制作人提供更连贯、高质量的音轨分离解决方案。
当前音轨分离工具市场竞争激烈,相关技术宣传层出不穷,而本次 Andromeda 更新的核心突破并非单纯新增鼓组与贝斯支持,而是底层技术架构的优化升级。鼓组与贝斯音轨不再由独立的旧版模型处理,而是与人声、乐器音轨共用同一套 Transformer 网络,从根源上去解决多模型处理带来的失真不一致、串音明显等问题。
事实上,不同音轨由不同模型处理时,会产生不同类型的失真痕迹:贝斯模型对瞬态的处理方式与人声模型处理齿音的方式存在差异,鼓组模型的串音特征也无法与人声音轨的表现保持统一。而升级后的 Andromeda 凭借单一 Transformer 架构,可实现人声、乐器、鼓组、贝斯的统一处理,显著提升跨音轨一致性,减少串音问题,让音轨从开头到结尾的表现更连贯稳定。针对贝斯分离,本次更新还进行了专项优化,通过拓展频率范围采集,有效保留高频泛音、手指触弦声、拨片起音及合成器质感等细节。这些细节在传统分离技术中常被丢失,导致贝斯音轨听感单薄,仅能呈现基础低频,对于非纯净 DI 信号的处理效果尤为突出。
作为 LALAL.AI 平台最先进的神经网络模型,Andromeda 于 2025 年 12 月首次推出,其训练数据量是前代模型 Perseus 的 4 倍,依托 Transformer 架构,处理速度最高提升4成,基准测试中的 SDR 分数也实现显著优化。初期该模型仅支持人声与乐器音轨分离,而鼓组作为平台第三大分离音轨类型,仅 2025 年就完成超过 500 万次拆分,此次将鼓组与贝斯整合进 Andromeda,是贴合用户需求的顺理成章的升级。
此次更新也进一步巩固了 LALAL.AI 在音轨分离领域的行业地位。第三方评测与认可数据显示,2025 年 12 月 Meta 发布 SAM Audio 研究模型并开展商用方案对比测试时,LALAL.AI 与 Moises、AudioShake、FADR 等一同作为参考工具,在专业乐器分离任务中,LALAL.AI 与 SAM Audio 的性能差距是所有商用方案中最小的;2026 年 1 月 MusicRadar 对 11 款音轨分离工具的独立评测中,LALAL.AI 获得 15/20 分,总排名第三,仅次于 Apple Logic Pro(16/20),与 Steinberg SpectraLayers Pro 12 并列,其乐器识别能力,尤其是钢琴、原声吉他等扩展音轨类型的处理表现,获得评测方高度认可。此外,在 2026 年威比奖中,LALAL.AI 从超过 13000 件参赛作品中脱颖而出,入围人工智能与机器学习最佳应用五强提名,并在创作者、创意与媒体工具类别获得荣誉奖。
Sonarworks 2026 年对 1100 多位音乐制作人的调查显示,音轨分离与音频清理、降噪、工程整理并列,成为制作人认可的“有用且无威胁”的 AI 任务。制作人更倾向于让 AI 处理输出清晰可验证的技术工作,而音轨分离恰好符合这一需求,这也让专用音轨分离工具在 Logic Pro 12、PreSonus Studio One Pro 7、Akai MPC XL 等 DAW 软件纷纷将 AI 音轨分离作为标配功能的当下,依然保持着强劲的商业竞争力。更新后的 LALAL.AI Andromeda 模型已正式上线。采用点数订阅模式,提供免费层级供用户初步试用,同时支持网页、桌面端、移动端、API 及 VST 插件等多种使用方式,其中 VST 插件仅对 Pro 订阅用户开放。用户可通过官方渠道探索新版 Andromeda 模型的全新功能,体验统一神经网络带来的音轨分离革新。
官网:https://www.lalal.ai/
LALAL.AI正式推出其迄今为止最先进的音频分离模型:Andromeda,该AI音轨分离模型以近乎人类的精度解析音频。
Andromeda神经网络建立在LALAL.AI六代音源分离技术的基础之上,其成果不仅处理速度比前代提升高达百分之40,提供更精准的音轨分离模型,还同时减少了失真,提高了清晰度。
Andromeda能够解决困扰以往AI模型的常见问题,例如人声串音入乐器声、不必要的混响,以及高频清晰度的损失。Andromeda并非简单地将声音作为单一波形处理,而是采用了更细致的方法,从时间、频率和音调角度分析音频,能更精确地分离复杂的音层,很大程度上免去了在DAW中进行手动清理的工作。
过去,LALAL.AI的用户面临一个权衡,选择Clear Cut清晰剪切模式会获得更干净的音轨但细节较少,选择Deep Extraction深度提取模式会获得更精细的细节但音轨间串音更多。Andromeda彻底消除了这种妥协。现在用户可以提取丰富、细节饱满的音轨,无需担心交叉串音,一次处理即可获得干净、精确的结果。
Andromeda延伸至LALAL.AI的多项网络服务,API客户也能利用其强大功能。集成的工具包括有用于人声伴奏或人声噪音音轨的音轨分离器、主唱与和声分离器、回声和混响去除器、人声清洁工具。这些解决方案利用Andromeda增强的分离能力,比以往更有效地提取更干净的音轨、降低背景噪音、去除回声和混响,并分离人声。
Andromeda新模型特点:
- 处理音频的速度比前代模型快高达40,工作流程更快捷,等待时间更少,适合需要高效处理大量内容的专业人士。
- 与前模型相比,新模型的SDR提高了10,其增强的能力能够更准确地分离更广泛的音频类型。
- 在立体声处理下,频率范围保持一致,最高可达22kHz,提供了业界期望的高保真分离度。
- 能够以更高的精度处理具有挑战性的音频场景和复杂的乐器混合,减少人工痕迹并提高一致性。
- 采用先进的DSP技术,在安静或响亮的音轨上都能提供一致的分离效果,处理不同类型的音频源时无需担心音量不一致。
Andromeda将加入LALAL.AI软件,推出首款VST插件,制作人和音频工程师可以直接在DAW中执行无缝的人声和乐器分离。
LALAL.AI是一款全新的人声提取解决方案,采用行业领先的AI技术,提供更高质量的人声提取和切片音频。
市面上有很多种实现声音提取的方法,AU自带简单的频谱提取功能,现在有个Vocal Isolation工具可以快速简单实现,但是比较粗糙;Logic则是利用相位反转技术和多个均衡器来实现声音提取;iZotope RX8的比较出名也比较贵,但是它的音乐重新平衡功能并不能保证提取出完美的人声。
而LALAL.AI完全基于机器学习和人工智能技术,和同类型服务比起来,它更复杂也更精确。我们可以用简单的吉他伴唱、经过大量混音处理的音乐和带有大量和声的音乐对LALAL.AI进行测试,测试结果表明,机器学习算法在处理轨道数(配器数)较少的音频是,效果更好,轨道数增多,结果会略显混乱。
但这属于正常处理结果范畴,毕竟目前人声提取还没有完美的解决方案,类比起其他同类服务,LALAL.AI做的已经很好了,提取出来的人声不会有太大损坏。
BPB编辑Tomislav也对LALAL.AI进行了测试,他们对LALAL.AI的测试结果感到非常惊喜······LALAL.AI并不能准确提供干净的录音棚品质人声,也没有任何一款软件可以做到这一点,但它远远要比我过去测试过的人声提取工具更先进。这个处理过程让人联想到CSI电视剧那些浮夸的场景,剧中警察可以从垃圾背景噪音中提取出完美无瑕的音频信号作为证据,这在过去显得非常不科学,但有了LALAL.AI就显得不这么浮夸了。
相信开发团队会不断改进优化这项新服务,将来它的处理结果会越来越好。无论是看音质、速度还是易用性,LALAL.AI未来可期。
LALAL.AI有三种会员计划,Free免费版、Lite精简版(10美元)和Professional(优惠价20美元,原价30美元)。