GPU Audio 发布实时音频分离 SDK 模块，大幅提高分轨性能

GPU Audio（现更名为 Soundcore for Pro Audio）正式发布全新 SDK 模块，聚焦超低延迟实时音频分离技术。该模块曾于 2025 年音频开发者大会首次亮相，可为现场演出、音乐制作等场景的音频应用提供低延迟处理方案，重新定义专业音频领域的实时分离技术标准。

本次发布的实时音频分离 SDK 模块基于 L-Acoustics 研究的 HSTASNET（混合频谱时域音频分离网络）模型开发，创新性融合频谱域与波形域数据，实现超高分辨率、自然的音频处理。据 L-Acoustics 白皮书显示，该模型理论延迟为 23 ms，而 GPU Audio 通过技术优化，在初期阶段就将 GPU 运行延迟控制在仅 512 采样点，完全满足实时处理需求。

性能方面该模块展现出压倒性优势。对比测试显示，CPU 版本（搭配 Eigen）实时因子（RTR）仅为 0.18 倍，Meta 的 PyTorch（GPU 版）也仅达 0.58 倍，而 GPU Audio SDK 模块实时因子高达 6.95 倍，性能提升约 12 倍。同时，该技术无需依赖历史数据（区别于 Meta Demucs v4），且支持单设备与多设备灵活扩展，仅增加数毫秒延迟，用户借助此 SDK 可实现近 7 倍实时处理效果，为实时混音、音频降噪等场景开辟新可能。该 SDK 模块免费提供下载，但商业使用需获取授权，目前已在 GitHub 页面开放 Windows 和 Mac 版本下载。

官网免费下载 SDK：https://gpu.audio/sdk

GPU Audio 发布实时音频分离 SDK 模块，大幅提高分轨性能

共有 0 条评论