GPU Audio 发布实时音频分离 SDK 模块,大幅提高分轨性能
GPU Audio(现更名为 Soundcore for Pro Audio)正式发布全新 SDK 模块,聚焦超低延迟实时音频分离技术。该模块曾于 2025 年音频开发者大会首次亮相,可为现场演出、音乐制作等场景的音频应用提供低延迟处理方案,重新定义专业音频领域的实时分离技术标准。
本次发布的实时音频分离 SDK 模块基于 L-Acoustics 研究的 HSTASNET(混合频谱时域音频分离网络)模型开发,创新性融合频谱域与波形域数据,实现超高分辨率、自然的音频处理。据 L-Acoustics 白皮书显示,该模型理论延迟为 23 ms,而 GPU Audio 通过技术优化,在初期阶段就将 GPU 运行延迟控制在仅 512 采样点,完全满足实时处理需求。
性能方面该模块展现出压倒性优势。对比测试显示,CPU 版本(搭配 Eigen)实时因子(RTR)仅为 0.18 倍,Meta 的 PyTorch(GPU 版)也仅达 0.58 倍,而 GPU Audio SDK 模块实时因子高达 6.95 倍,性能提升约 12 倍。同时,该技术无需依赖历史数据(区别于 Meta Demucs v4),且支持单设备与多设备灵活扩展,仅增加数毫秒延迟,用户借助此 SDK 可实现近 7 倍实时处理效果,为实时混音、音频降噪等场景开辟新可能。该 SDK 模块免费提供下载,但商业使用需获取授权,目前已在 GitHub 页面开放 Windows 和 Mac 版本下载。
官网免费下载 SDK:https://gpu.audio/sdk
文章出处 https://sonicstate.com/news/2026/02/02/real-time-source-separation-on-gpu/
转载新闻请注明出自 Midifan.com