买不起专业 De-Esser 消齿音插件?DAW 自带与免费插件照样做得到(一)

安小匠 发布于2025-12-27 暂无评论

“齿音(sibilance)”,又称“嘶声”,是人声录制过程中可能会时常遇到的情况。无论是说话还是演唱,人声中总会有一些因发声方式而带来的高频声音元素,例如普通话中的“s”“z”“c”等声母、英语的“ts”“s”“sh”等辅音带来的尖锐摩擦音,这些声音被称为“齿音”。当它们被麦克风录制下来,我们再回听录音时,那些高频元素可能会听起来非常刺耳,令人不快。 

对于录音工程师来说,齿音可以在前期通过巧妙的方式避免,例如增设防喷罩或防喷网、录音时告知歌手正确的站位(与麦克风保持合适的距离与角度)、使用吸音材料减少高频反射等。然而,在某些情况下,受限于设备条件、歌手唱法等原因,齿音仍然无法避免,加之在一些“录—混分离”的工作流程下,混音工程师拿到的可能就是带有齿音的音频文件。这时候,就需要混音师对音频做“De-Ess(去齿音)”处理了。 

齿音已经是业界常见的技术问题。就和研发均衡器、压缩器等基础插件一样,各大音频厂商早已研发了成熟的De-Esser(去齿音插件),投入市场十余年。然而,专业的De-Esser插件价格昂贵,例如,截至2025年8月,oeksound soothe2售价209美元(约合人民币1500.67元),FabFilter Pro-DS售价169欧元(约合人民币1417元)。对于经济条件有限的卧室音乐人来说,其录音环境可能有限,决定了De-Esser插件是刚需,但如此昂贵的价格,或许一时间很难负担得起。注:汇率以2025年8月15日计算。)


图 1 oeksound soothe2与FabFilter Pro-DS这两款旗舰级的De-Esser,价格不菲。(截至2025年8月) 

那么,对于预算有限的音乐人,是否还有更加经济实惠且行之有效的办法?完全没问题!DAW自带的均衡器、压缩器、多段压缩与动态均衡器等插件,都能胜任。即使DAW缺少一些自带插件(例如REAPER缺少动态参数均衡器),也有免费的专业插件可供选择。如此,“穷人”照样能做好专业的De-Ess工作。 

接下来这篇系列教程,我将提供几套常用思路,按“简单—精细—极致”排布,你可以根据人声素材的齿音严重程度和你手边插件的阵容挑一套用,或者混搭。首先,我给大家带来轻量、简单的两套方案。


笔者的电脑环境

在正式开始之前,先向各位读者说说我使用的软硬件环境:

  • 声卡:Focusrite Scarlett Solo 3rd Gen
  • 麦克风:Lewitt LCT 240 PRO
  • 监听耳机:铁三角ATH-M20x
  • DAW:REAPER 7.39
  • 操作系统:Windows 11
  • 音频驱动:ASIO

以下的教程,我将以REAPER自带的插件,加上免费插件TDR Nova为例进行讲解。理论上,我讲解的方法具有普适性,可以适用于多款DAW与多个系统环境,你可以把我的思路套用在你的DAW自带的插件里。若你手上有专业的付费插件,你当然也可以实践这篇教程。


最轻量:宽带压缩器 + 动态均衡器(两步)

如果你的设备和录音环境相对理想一些,麦克风收录的齿音并不算特别尖锐,而你想要尽快完成去齿音工作,那么我们有一个最轻量级的方案:用一个宽带压缩器(broadband compressor),配合一个动态均衡器(dynamic EQ),即可搞定。


原理

歌手在演唱过程中,当进入容易发出齿音的辅音音节时(例如“c”、“s”),口腔收缩,牙关趋于闭合,此时气流在一瞬间从口腔喷出,到达麦克风,产生齿音。齿音会在短时间内带来较高的瞬态电平,在回放时不仅刺耳,还格外响亮,而响亮的听感更是加剧了齿音给人带来的不适感。 

因此,我们先使用宽带压缩器驯服齿音的动态,降低齿音的刺耳感。这里的“宽带压缩器”,指的就是普通的压缩器,它的作用范围通常是单独的声音频段,作用范围宽广且可调节(最低为0 Hz,最高为20000 Hz或更高),故名。 

经过宽带压缩器的处理,整个人声峰值压下来2~3 dB,齿音能量随之整体削减,但仍可能存在2~3 dB的局部尖峰。此时,动态EQ就来“补一刀”,只削那2~3 dB的局部尖峰,而不影响其它频率和瞬态细节。 

默认情况下,宽带压缩器作用于整个频谱,如果只靠宽带压缩器继续加大量,人声会被压扁、呼吸感消失;而动态EQ的“局部、瞬时”特性不会触发整条人声的压缩泵(pumping)效应,意味着不会给声音带来令人不悦的抽吸感。因此,这套方案先后由宽带压缩器与动态EQ进行处理,二者协同工作——先由宽带压缩器统一控制整体峰值,再由动态EQ做最后一击,只削齿音、不碰人声主体,实现“轻量但透明”的去齿音。


第一道工序:使用宽带压缩器,驯服峰值

这里,笔者录制了一段齿音特别明显的“绕口令”素材——刻意选择一句摩擦音很多的句子来强调齿音效果,便于直观演示处理前后的表现。(注:素材已经使用高通滤波器削除多余的低频。)

试听附件音频素材:1.1_绕口令录音.mp3

在素材所在的音轨插入一个普通压缩器,也就是宽带压缩器。这里选用REAPER自带的ReaComp。

  • 第一步将压缩比率(ratio)设定为3:1~4:1,这种压缩比率较为温和,既能有效驯服动态,也能防止过度压缩造成音频动态异常。
  • 第二步设置启动时间(attack),要将其设置得很短,取值为0.1~1 ms。这是因为齿音峰值持续时间非常短暂,足够短的启动时间会让齿音峰值来不及逃跑。你要留意一个隐藏的坑:哪怕启动时间稍微长那么一些(例如ReaComp默认的3.0 ms),压缩器也难以反应过来及时把齿音“抓住”——这很容易让用户误以为压缩器不起作用。
  • 第三步:再来调整压缩阈值(threshold),将阈值设到只在齿音瞬间触发。一边反复聆听音频,一边调低阈值,直至齿音发生的瞬间压缩器刚好起作用。具体可以观察压缩器的压缩电平表(如ReaComp右侧的红色电平表),确保在齿音发生时,压缩的电平量大于0 dB;当齿音结束后,确保压缩电平回零。
  • 第四步设置释放时间(release),以30~50 ms为宜,在将齿音的动态驯服完毕后及时释放,以免压缩器持续作用而将人声压扁。
  • 根据音频的实际情况,反复聆听并微调参数,直至满意。


图 2 在本例中,用于演示的ReaComp配置。 

完成设置后,宽带压缩器先把人声削掉 2~3 dB 峰值,让齿音不那么扎耳。听听看,是不是比处理前舒服一些了: 

试听附件音频素材:1.2_绕口令录音,经过宽带压缩器处理.mp3


第二道工序:使用动态均衡器,定点去除局部尖锋

正如我在“原理”所说,驯服峰值后,音频仍然存在2~3 dB的局部尖峰,仍有可能在一些设备上造成尖锐的听感。例如,以ThinkPad R400为代表的老式笔记本电脑扬声器,齿音所在的频段会格外突出。 

此时,我们就要用动态均衡器去除尖峰,把齿音“磨”得圆润一些,使去齿音的效果更自然。

第一阶段:扫频

在使用动态EQ之前,我们要在3~7 kHz之间扫频,找到齿音最集中的1/3倍频程(一个倍频程就是一个八度〔octave〕的频宽)。虽然齿音分布在这个频率范围内,但真正刺耳的尖峰通常只占其中0.2~0.3的倍频程,人耳能分辨的最小区间就是1/3倍频程,这也是经典De-Esser削减齿音的默认频宽。 

当然,以上频率范围更多源于经验,我们仍应当以实际素材为准。有些素材,其齿音分布频率并不局限于3~7 kHz这个范围,有可能位于更高的频率。经实测,本章使用的音频素材,其齿音就位于10.4 kHz的地方。 

我们可以利用参数均衡器,创建一个钟形曲线(bell)来进行扫频。以REAPER自带的ReaEQ为例:

  • 在当前音轨插入一个新的ReaEQ实例,命名为“Scanning”,然后把音轨上其余的插件全部禁用;
  • 在ReaEQ曲线上的任意位置双击,创建一个钟形调整曲线(下方“Type”显示为“Band”),将“Bandwidth(频宽)”设置为一个较小的值(例如0.2~0.5),并设置“Gain”使得声音清晰可辨;
  • 中心频率从3 kHz开始,一边播放同一句人声,一边慢慢调节“Frequency”滑杆,向右扫频,直到你听到齿音变得最为刺耳,乃至失真。这个地方的频率就是“齿音最集中的1/3倍频程”所在的地方,记下这个频率
  • 找到后,禁用“Scanning”均衡器实例,恢复你原本的插件状态,准备做动态EQ。


图 3 使用ReaEQ扫频时的均衡器配置。 

需要注意的是,ReaEQ没有“Band Solo(只播放特定频段)”的功能,以上的扫频操作实际上是在原始音频的基础上“放大”特定频率的信号,帮助你更清晰地找到齿音。如果你只希望听到特定频段的音频,可以使用支持“Band Solo”的均衡器,请参考下一章“常规方法:只用动态均衡器,单插件就能搞定 ”的“⬛ 第二阶段:找“齿音带” ”这一节。

第二阶段:应用动态EQ

完成扫频之后,我们在宽带压缩器的后面添加一个动态均衡器实例——也就是,让音频经由压缩器处理后,进入动态均衡器中。 

由于REAPER没有自带动态均衡器,这里使用TDR Nova这款免费的专业动态EQ(https://www.tokyodawn.net/tdr-nova/)。根据你使用的DAW,你还可以选择Logic的Channel EQ、Cubase的Frequency等内置动态EQ。注:REAPER自带的ReaFIR也可以用作动态均衡器,但是其操作与FabFilter Pro-Q等专业动态均衡器有根本区别。)

TDR Nova支持4个EQ频段,我们只使用其中一个。点选第三个频段(也就是曲线图中标有“III”的控制点),并点击界面下方的“Threshold”开关以允许调节阈值等参数,此时原本灰色不可调节的“Threshold”、“Ratio”等参数就被激活。 

然后,依次设置以下参数:

  • 第一步频率(Freq)设为我们在“⬛ 第一阶段:扫频 ”里记下来的、齿音最强的频率点。
  • 第二步Q值设置在2.5~4这个区间,使得调节的带宽能包裹住齿音所在的区域,不至于太宽而影响到其他元素。
  • 第三步阈值(Threshold)设置比齿音RMS低3 dB左右。要找到齿音的RMS,可以遵循以下步骤:注:RMS即均方根,表示音频设备在稳定工况下输出的电平。)
  • 暂时禁用宽带压缩器(设为旁通),播放一段齿音明显的片段。
  • 观察TDR Nova的峰值表,找到齿音的峰值(假设是 -10 dBFS)。
  • 将阈值设置到一个较低的值(比如 -20 dBFS),然后播放齿音片段。
  • 逐渐提高阈值,直到动态 EQ 开始工作(假设是 -16 dBFS)。
  • 再将阈值下调 3 dB,最终设置为 -19 dBFS。
  • 重新启用宽带压缩器。
  • 第四步增益(Gain)设置为-3 dB,这样就能刚好削除尖峰。
  • 第五步压缩比率(Ratio)设置为3:1,同样是温和的压缩比。
  • 第六步启动时间(Attack)设为2.0~5.0 ms,确保能立即抓住齿音;释放时间(Release)设置为15~20 ms,防止压缩时间过长导致齿音后的人声被过度压缩。
  • 一边聆听,一边微调上述参数,直到听起来满意。
  • 其余所有参数保持默认值


图 4 用于演示的TDR Nova配置,已经按上述步骤设置了参数。 

经过设置后,动态均衡器只在齿音出现时工作,人声主体频段不受影响。


完成处理

最终,经过压缩器与动态EQ这两道工序的处理,我们完成了简单实用的去齿音工作。一起来听听处理后的效果: 

试听附件音频素材:1.3_绕口令录音,经过动态EQ处理.mp3

是不是比处理之前舒适多了? 

一句话回顾:这个方案,先以宽带压缩器驯服动态,再利用动态EQ“查缺补漏”,以轻巧的“两步走”完成轻量级的去齿音任务。


常规方法:只用动态均衡器,单插件就能搞定

在“最轻量:宽带压缩器 + 动态均衡器(两步) ”这一效果器组合中,挑大梁的是压缩器。而接下来我要介绍的方案,就是只使用动态EQ来完成去齿音的任务,这也是更为常规的方案。 

这个方案,适用于人声齿音集中在3~7 kHz,且动态不大(例如播客、旁白、较为舒缓的流行演唱)的情况。并且由于只使用一款插件,该方案在时间紧、任务重的场景下也非常胜任。


原理

动态EQ,本质上就是在参数均衡器的基础上,加入了压缩器的功能。它可以对特定的频率进行压缩处理,频率的信号到达我们设定的压缩阈值时,就会立刻启动压缩,控制该频率信号的动态,随后当信号在压缩阈值之下时就会立刻释放。动态EQ全程只在特定频率的电平达到阈值时才起作用。 

齿音的特点,就是在特定的频率点上具有瞬时较高的电平,这正好是动态EQ擅长处理的地方。根据动态EQ的原理,我们只需找到齿音的频率,然后利用动态EQ来稍微削弱齿音:

  • 基于其“动态”的特性,只有当齿音发生时,才触发动态EQ的压缩功能,降低齿音的电平;
  • 而在齿音未发生时,动态EQ不工作,不会削弱信号。

如此,不该削弱的信号(例如齿音所在频率的大部分人声信号)不会被削弱,而是得以充分保留,避免了音质损失。形象地说,动态EQ则像一把“只在齿音所在频率处开合的小钳子”,齿音探头就夹,齿音离开就松开。


如何去齿音

考虑到REAPER没有自带动态均衡器,我同样使用免费的TDR Nova来进行演示。 

这里我选择了综艺制作人、主持人王伟忠的一小段播客音频,由于设备关系,这段音频有明显的齿音,例如音频中“一开”的“”字,声母“Sh”的尖锐感格外明显。如果你使用笔记本(如笔者的ThinkPad R400)、便携屏等设备的扬声器聆听,则更为尖锐。 

试听附件音频素材:2.1_王伟忠播客,原始音频.mp3

⬛ 第一阶段:插入TDR Nova

建立一个新的音轨,插入TDR Nova插件。其初始界面如下所示,可见插件支持4个频段。在这一节中,我们只使用第3个频段。 


图 5 TDR Nova的默认设置。

第二阶段:找“齿音带”

TDR Nova自带“Band Solo(只播放指定的频段)”模式,我们可以借助这个功能来扫频,寻找“齿音带”——齿音所在的频率或频段。步骤如下:

  • 第一步:点选第2或第3个频段,确保当前频段设置为钟型曲线模式。
  • 第二步点击“Band Solo”按钮,让TDR Nova只播放该频段的信号。
  • 第三步:随后,将Q值设在2.5~4.0这个区间,以尽可能收窄监听范围(但不要太窄,否则声音会“呲”,造成听感不适)。
  • 第四步:接下来,循环播放人声最刺耳的一句(如 “Si-Su-Sh”多的词),同时从2.0 kHz开始逐渐调高“Freq”旋钮,逐步提升中心频率,直到你听到明显的尖锐齿音。一般女声5~7 kHz,男声4~5.5 kHz会出现最尖锐的“嘶啦”峰;在王伟忠的这段播客中,尖锐的齿音则位于3.2 kHz(这是由于翘舌音的齿音频率本身比平舌音要低一些)


6 使用TDR Nova的“Band Solo”模式来查找“齿音带”。 

值得一提的是,与FabFilter Pro-Q等参数均衡器一样,TDR Nova也提供了频谱图。你可以在聆听的同时,结合频谱图上显示的尖峰,更快地找到齿音集中的频率。在本例中,3.2 kHz的“Sh”音最为尖锐响亮,相应地该齿音也在频谱图上造出了一座奇高的尖峰,如图 6所示。我最早就是通过频谱图来找到齿音的位置的,再结合耳朵的聆听,最终确定了齿音的确切位置。 

如果你选用的动态EQ没有“Band Solo”功能,可参考上一章使用ReaEQ扫频的步骤。

⬛ 第三阶段:开启动态处理

找到“齿音带”后,我们就可以着手对齿音进行动态均衡处理了。点选第3个频段,然后依次进行以下步骤:

  • 第一步:先把该频段的“Gain(增益)”归零(0 dB)
  • 第二步调节“Freq(中心频率)”旋钮,将其设为“齿音带”所在的频率。在本例中,我设置为3.2 kHz。
  • 第三调节“Q”旋钮,将Q值设置在2.5~4这个区间,使得钟形曲线包裹齿音所在的频段,不至于太宽而影响到其他的元素。
  • 第四调节“Ratio(压缩比率)”旋钮,将其设为3:1这个温和的比率。
    • 如果齿音顽固,还可以进一步拉到6:1(或其他能驯服齿音的值)。
  • 第五调节“Gain(增益)”旋钮将增益设置为-3 dB~-6 dB,适度削弱齿音。
  • 第六点击“Threshold”按钮,激活该频段的动态处理功能。然后,一边回放齿音音频,一边调低“Threshold(阈值)”旋钮,直到齿音听起来没有那么刺耳。
    • 你也可以回到上一章“最轻量:宽带压缩器 + 动态均衡器(两步) ”→“第二道工序:使用动态均衡器,定点去除局部尖锋 ”,根据我介绍的“查找齿音RMS”的方法来找出最合适的阈值。在本例中,我设置为-19.0 dB。
    • 如果对齿音驯服的效果不满意,你可能还需要适当调节增益和压缩比率。
  • 调节启动时间(Attack)与释放时间(Release):
    • Attack:设置为0.00~5.00 ms,短暂的启动时间可以让TDR Nova立刻抓住齿音,如果设置得过长则齿音会“逃跑”。
    • Release:设置为15~40 ms,这个区间适中,适合齿音压缩。注意,太短会导致抽吸效应(pumping effect),压缩器释放的太快,使得音量不稳定;太长则会过度压缩人声导致声音发闷。

在推荐的区间范围内,你还需要反复聆听并微调参数,找到最适合你音频的去齿音参数。 


7 本例中使用的De-Ess参数。回放过程中,插件会直观显示输入信号电平(Threshold旋钮的灯条),以及动态EQ削弱的电平(Gain旋钮的灯条,以及频谱图中的金色曲线)。 

在处理过程中,TDR Nova会实时显示动态EQ的工作状态。从图 7中你可以看到,当TDR Nova削弱齿音时,金色的钟形曲线会往下探,“Gain”旋钮也会亮起灯条,直观显示出频率削弱的信号强度。你可以据此来检查动态EQ是否正常工作。 

经过处理后,王伟忠播客的齿音明显减弱了不少,在容易引发齿音的音节上听起来更为柔和。至此,我们达成了单独使用动态EQ去齿音的目标。一起来听听处理后的效果: 

试听附件音频素材:2.2_王伟忠播客,去齿音处理.mp3


特殊技巧:并行干湿比(Parallel Blend)保留原声“空气感”

通常,按照以上的思路进行的De-Ess处理,对于动态不大的人声,其效果已经非常可观。 

不过,如果是在一些编曲层次较为复杂的作品里,例如J-Pop(尤其是二次元快节奏的曲风)、摇滚乐(如Linkin Park的作品)、电子乐,其频谱比较复杂,容易掩蔽人声的高频部分。另一些作品更注重声乐的演绎,制作人希望通过人声细节的细腻表现,尤其是高频的细节,来营造独特的艺术氛围。在这两种场景下,De-Ess可能会在去齿音的同时,削弱人声的“空气感”,使人声的细节打一些折扣,甚至可能被伴奏掩盖。 

这个时候,就可以利用动态均衡器的“并行干湿比(parallel blend)”功能,也就是并行播放原始信号(干信号)和经过处理的信号(湿信号),按照一定的比例将两路信号混合。以TDR Nova为例,你可以找到右下角的“Dry Mix(原始信号百分比)”旋钮。默认值为0.0,表示只输出经过处理的信号。如果你想保留空气感,则可以逐渐调高该旋钮,直至30~40。注意不可过高,否则会抵消动态EQ的处理。 

应用并行干湿比技巧,你就可以在保留动态均衡器去齿音效果的同时,引入原始信号的质感——尤其是高频的质感,从而保留原始人声的空气感,让人声在De-Ess后依旧脱颖而出。


特别需要注意的地方:避免“先入为主”

当你大幅度调整EQ时,音频前后的对比很明显,你能充分把握其中的差异。然而,De-Ess前后的对比则细微得多,只有齿音所在的那一处频率有区别,而且差异并不是很大,这往往意味着你要仔细聆听才能听出差异。 

如此特性,引出了另一个问题:先入为主。音乐人可能会一时疏忽,误把已经处理的音频当作未经过去齿音处理的音频。


为什么会先入为主?

当你的De-Ess工作告一段落,休息一段时间后返回你的工程,重新监听去齿音后的音频时,由于人耳对齿音频率的敏感度,你可能会盯着削减后仍部分留存的齿音不放,下意识以为这是没有经过去齿音处理的音频,于是又重新进行一轮De-Ess,影响正常工作流程。 

我自己在测试“常规方法:只用动态均衡器,单插件就能搞定 ”这一章的音频素材时就是这样,由于播客里齿音集中的“Sh”音在处理前后差异也不明显,我也总是误以为自己没做好去齿音工作。然而,当我禁用动态均衡器,再对比监听处理前后的音频时,才意识到:原来TDR Nova早已发挥了作用!


如何避免先入为主?

要想避免去齿音工作时的先入为主,有以下两点注意事项,值得成为你日常遵循的要点。

⬛ 第一:对比原始音频

在你打算给音频进行De-Ess处理之前,务必检查目标音轨(或音频片段〔take〕)是否已经有了去齿音的效果器。如果有,那么你需要对比聆听启用去齿音前后的音频效果,看看是否已经达到你的目标,再决定下一步的操作。 

如果你采用的方案使用了多个插件(例如压缩器与动态EQ的组合),那么你也可以“拆分步骤”,通过启用/禁用其中一个插件来比对效果。这一过程还可以帮助你“查缺补漏”,进一步完善插件的参数。

⬛ 第二:使用恒定的监听设备

即使是经过De-Ess的音频,在不同的设备上听起来感受也是不一样的。就拿我自己的情况来说,同一段去齿音后的音频,戴上铁三角ATH-M20x监听时,留下来的部分齿音听起来柔和舒适,已经达成了目标。然而,放在我的ThinkPad R400扬声器上聆听时,由于这类扬声器的特性,齿音所在的频段会被格外“放大”,如果不仔细听,还以为我忘记做De-Ess了。 

因此,在进行De-Ess时,使用恒定的监听设备是必要的——整个De-Ess流程只使用一款监听设备,可以防止因频响曲线差异而导致你误判。


总结

当录制的人声里有明显的尖锐齿音,引人不快的时候,可以通过去齿音处理,改善听感,雕琢出更为“耐听”的人声音轨。而如果齿音相对简单、温和,就可以使用我在本文中讲解的两大方案,快速、轻量地完成处理:

  • 压缩器 + 动态EQ:最轻量的方案,适用于录制环境理想、齿音不算特别尖锐的情况。以压缩器驯服齿音动态,辅以动态EQ“查缺补漏”。
  • 单独使用动态EQ:通用方案,适合于温和场景下录制的音频——播客、流行演唱、旁白等。

同时,我还强调了一个注意事项:因人耳容易对齿音频率敏感,而容易误把已处理的音频当作未处理者,造成“先入为主”。为此,养成对比原始音频的习惯,以及使用恒定的监听设备,有利于我们更精准把握混音的工作流程,防止“二次De-Ess”造成不必要的麻烦。 

当然,条条大路通罗马,可实现的方案不止一种,并且实践中需要处理的齿音也不局限于简单温和的情况。在下一篇教程里,笔者还会继续分享几种实用的去齿音方案,包括多段压缩、动态EQ进阶技巧等,相信可以胜任你的De-Ess工作。



本文出自《midifan月刊》2025年11月第235期

 

可下载 Midifan for iOS 应用在手机或平板上阅读(直接在App Store里搜索Midifan即可找到,或扫描下面的二维码直接下载),在 iPad 或 iPhone 上下载并阅读。

 


文章出处 https://magazine.midifan.com/detail.php?month=2025-10#23

转载新闻请注明出自 Midifan.com

共有 0 条评论