“齿音（sibilance）”，又称“嘶声”，是人声录制过程中可能会时常遇到的情况。无论是说话还是演唱，人声中总会有一些因发声方式而带来的高频声音元素，例如普通话中的“s”“z”“c”等声母、英语的“ts”“s”“sh”等辅音带来的尖锐摩擦音，这些声音被称为“齿音”。当它们被麦克风录制下来，我们再回听录音时，那些高频元素可能会听起来非常刺耳，令人不快。

对于录音工程师来说，齿音可以在前期通过巧妙的方式避免，例如增设防喷罩或防喷网、录音时告知歌手正确的站位（与麦克风保持合适的距离与角度）、使用吸音材料减少高频反射等。然而，在某些情况下，受限于设备条件、歌手唱法等原因，齿音仍然无法避免，加之在一些“录—混分离”的工作流程下，混音工程师拿到的可能就是带有齿音的音频文件。这时候，就需要混音师对音频做“De-Ess（去齿音）”处理了。

齿音已经是业界常见的技术问题。就和研发均衡器、压缩器等基础插件一样，各大音频厂商早已研发了成熟的De-Esser（去齿音插件），投入市场十余年。然而，专业的De-Esser插件价格昂贵，例如，截至2025年8月，oeksound soothe2售价209美元（约合人民币1500.67元），FabFilter Pro-DS售价169欧元（约合人民币1417元）。对于经济条件有限的卧室音乐人来说，其录音环境可能有限，决定了De-Esser插件是刚需，但如此昂贵的价格，或许一时间很难负担得起。（注：汇率以2025年8月15日计算。）

图 1 oeksound soothe2与FabFilter Pro-DS这两款旗舰级的De-Esser，价格不菲。（截至2025年8月）

那么，对于预算有限的音乐人，是否还有更加经济实惠且行之有效的办法？完全没问题！DAW自带的均衡器、压缩器、多段压缩与动态均衡器等插件，都能胜任。即使DAW缺少一些自带插件（例如REAPER缺少动态参数均衡器），也有免费的专业插件可供选择。如此，“穷人”照样能做好专业的De-Ess工作。

接下来这篇系列教程，我将提供几套常用思路，按“简单—精细—极致”排布，你可以根据人声素材的齿音严重程度和你手边插件的阵容挑一套用，或者混搭。首先，我给大家带来轻量、简单的两套方案。

笔者的电脑环境

在正式开始之前，先向各位读者说说我使用的软硬件环境：

声卡：Focusrite Scarlett Solo 3rd Gen
麦克风：Lewitt LCT 240 PRO
监听耳机：铁三角ATH-M20x
DAW：REAPER 7.39
操作系统：Windows 11
音频驱动：ASIO

以下的教程，我将以REAPER自带的插件，加上免费插件TDR Nova为例进行讲解。理论上，我讲解的方法具有普适性，可以适用于多款DAW与多个系统环境，你可以把我的思路套用在你的DAW自带的插件里。若你手上有专业的付费插件，你当然也可以实践这篇教程。

最轻量：宽带压缩器 + 动态均衡器（两步）

如果你的设备和录音环境相对理想一些，麦克风收录的齿音并不算特别尖锐，而你想要尽快完成去齿音工作，那么我们有一个最轻量级的方案：用一个宽带压缩器（broadband compressor），配合一个动态均衡器（dynamic EQ），即可搞定。

原理

歌手在演唱过程中，当进入容易发出齿音的辅音音节时（例如“c”、“s”），口腔收缩，牙关趋于闭合，此时气流在一瞬间从口腔喷出，到达麦克风，产生齿音。齿音会在短时间内带来较高的瞬态电平，在回放时不仅刺耳，还格外响亮，而响亮的听感更是加剧了齿音给人带来的不适感。

因此，我们先使用宽带压缩器驯服齿音的动态，降低齿音的刺耳感。这里的“宽带压缩器”，指的就是普通的压缩器，它的作用范围通常是单独的声音频段，作用范围宽广且可调节（最低为0 Hz，最高为20000 Hz或更高），故名。

经过宽带压缩器的处理，整个人声峰值压下来2～3 dB，齿音能量随之整体削减，但仍可能存在2～3 dB的局部尖峰。此时，动态EQ就来“补一刀”，只削那2～3 dB的局部尖峰，而不影响其它频率和瞬态细节。

默认情况下，宽带压缩器作用于整个频谱，如果只靠宽带压缩器继续加大量，人声会被压扁、呼吸感消失；而动态EQ的“局部、瞬时”特性不会触发整条人声的压缩泵（pumping）效应，意味着不会给声音带来令人不悦的抽吸感。因此，这套方案先后由宽带压缩器与动态EQ进行处理，二者协同工作——先由宽带压缩器统一控制整体峰值，再由动态EQ做最后一击，只削齿音、不碰人声主体，实现“轻量但透明”的去齿音。

第一道工序：使用宽带压缩器，驯服峰值

这里，笔者录制了一段齿音特别明显的“绕口令”素材——刻意选择一句摩擦音很多的句子来强调齿音效果，便于直观演示处理前后的表现。（注：素材已经使用高通滤波器削除多余的低频。）

试听附件音频素材：1.1_绕口令录音.mp3

在素材所在的音轨插入一个普通压缩器，也就是宽带压缩器。这里选用REAPER自带的ReaComp。

第一步：将压缩比率（ratio）设定为3:1～4:1，这种压缩比率较为温和，既能有效驯服动态，也能防止过度压缩造成音频动态异常。
第二步：设置启动时间（attack），要将其设置得很短，取值为0.1～1 ms。这是因为齿音峰值持续时间非常短暂，足够短的启动时间会让齿音峰值来不及逃跑。你要留意一个隐藏的坑：哪怕启动时间稍微长那么一些（例如ReaComp默认的3.0 ms），压缩器也难以反应过来及时把齿音“抓住”——这很容易让用户误以为压缩器不起作用。
第三步：再来调整压缩阈值（threshold），将阈值设到只在齿音瞬间触发。一边反复聆听音频，一边调低阈值，直至齿音发生的瞬间压缩器刚好起作用。具体可以观察压缩器的压缩电平表（如ReaComp右侧的红色电平表），确保在齿音发生时，压缩的电平量大于0 dB；当齿音结束后，确保压缩电平回零。
第四步：设置释放时间（release），以30～50 ms为宜，在将齿音的动态驯服完毕后及时释放，以免压缩器持续作用而将人声压扁。
根据音频的实际情况，反复聆听并微调参数，直至满意。

图 2 在本例中，用于演示的ReaComp配置。

完成设置后，宽带压缩器先把人声削掉 2～3 dB 峰值，让齿音不那么扎耳。听听看，是不是比处理前舒服一些了：

试听附件音频素材：1.2_绕口令录音，经过宽带压缩器处理.mp3

第二道工序：使用动态均衡器，定点去除局部尖锋

正如我在“原理”所说，驯服峰值后，音频仍然存在2～3 dB的局部尖峰，仍有可能在一些设备上造成尖锐的听感。例如，以ThinkPad R400为代表的老式笔记本电脑扬声器，齿音所在的频段会格外突出。

此时，我们就要用动态均衡器去除尖峰，把齿音“磨”得圆润一些，使去齿音的效果更自然。

⬛ 第一阶段：扫频

在使用动态EQ之前，我们要在3～7 kHz之间扫频，找到齿音最集中的1/3倍频程（一个倍频程就是一个八度〔octave〕的频宽）。虽然齿音分布在这个频率范围内，但真正刺耳的尖峰通常只占其中0.2～0.3的倍频程，人耳能分辨的最小区间就是1/3倍频程，这也是经典De-Esser削减齿音的默认频宽。

当然，以上频率范围更多源于经验，我们仍应当以实际素材为准。有些素材，其齿音分布频率并不局限于3～7 kHz这个范围，有可能位于更高的频率。经实测，本章使用的音频素材，其齿音就位于10.4 kHz的地方。

我们可以利用参数均衡器，创建一个钟形曲线（bell）来进行扫频。以REAPER自带的ReaEQ为例：

在当前音轨插入一个新的ReaEQ实例，命名为“Scanning”，然后把音轨上其余的插件全部禁用；
在ReaEQ曲线上的任意位置双击，创建一个钟形调整曲线（下方“Type”显示为“Band”），将“Bandwidth（频宽）”设置为一个较小的值（例如0.2～0.5），并设置“Gain”使得声音清晰可辨；
中心频率从3 kHz开始，一边播放同一句人声，一边慢慢调节“Frequency”滑杆，向右扫频，直到你听到齿音变得最为刺耳，乃至失真。这个地方的频率就是“齿音最集中的1/3倍频程”所在的地方，记下这个频率。
找到后，禁用“Scanning”均衡器实例，恢复你原本的插件状态，准备做动态EQ。

图 3 使用ReaEQ扫频时的均衡器配置。

需要注意的是，ReaEQ没有“Band Solo（只播放特定频段）”的功能，以上的扫频操作实际上是在原始音频的基础上“放大”特定频率的信号，帮助你更清晰地找到齿音。如果你只希望听到特定频段的音频，可以使用支持“Band Solo”的均衡器，请参考下一章“常规方法：只用动态均衡器，单插件就能搞定 ”的“⬛ 第二阶段：找“齿音带” ”这一节。

⬛ 第二阶段：应用动态EQ

完成扫频之后，我们在宽带压缩器的后面添加一个动态均衡器实例——也就是，让音频经由压缩器处理后，进入动态均衡器中。

由于REAPER没有自带动态均衡器，这里使用TDR Nova这款免费的专业动态EQ（https://www.tokyodawn.net/tdr-nova/）。根据你使用的DAW，你还可以选择Logic的Channel EQ、Cubase的Frequency等内置动态EQ。（注：REAPER自带的ReaFIR也可以用作动态均衡器，但是其操作与FabFilter Pro-Q等专业动态均衡器有根本区别。）

TDR Nova支持4个EQ频段，我们只使用其中一个。点选第三个频段（也就是曲线图中标有“III”的控制点），并点击界面下方的“Threshold”开关以允许调节阈值等参数，此时原本灰色不可调节的“Threshold”、“Ratio”等参数就被激活。

然后，依次设置以下参数：

第一步：频率（Freq）设为我们在“⬛ 第一阶段：扫频 ”里记下来的、齿音最强的频率点。
第二步：Q值设置在2.5～4这个区间，使得调节的带宽能包裹住齿音所在的区域，不至于太宽而影响到其他元素。
第三步：阈值（Threshold）设置比齿音RMS低3 dB左右。要找到齿音的RMS，可以遵循以下步骤：（注：RMS即均方根，表示音频设备在稳定工况下输出的电平。）
暂时禁用宽带压缩器（设为旁通），播放一段齿音明显的片段。
观察TDR Nova的峰值表，找到齿音的峰值（假设是 -10 dBFS）。
将阈值设置到一个较低的值（比如 -20 dBFS），然后播放齿音片段。
逐渐提高阈值，直到动态 EQ 开始工作（假设是 -16 dBFS）。
再将阈值下调 3 dB，最终设置为 -19 dBFS。
重新启用宽带压缩器。
第四步：增益（Gain）设置为-3 dB，这样就能刚好削除尖峰。
第五步：压缩比率（Ratio）设置为3:1，同样是温和的压缩比。
第六步：启动时间（Attack）设为2.0～5.0 ms，确保能立即抓住齿音；释放时间（Release）设置为15～20 ms，防止压缩时间过长导致齿音后的人声被过度压缩。
一边聆听，一边微调上述参数，直到听起来满意。
其余所有参数保持默认值。

图 4 用于演示的TDR Nova配置，已经按上述步骤设置了参数。

经过设置后，动态均衡器只在齿音出现时工作，人声主体频段不受影响。

完成处理

最终，经过压缩器与动态EQ这两道工序的处理，我们完成了简单实用的去齿音工作。一起来听听处理后的效果：

试听附件音频素材：1.3_绕口令录音，经过动态EQ处理.mp3

是不是比处理之前舒适多了？

一句话回顾：这个方案，先以宽带压缩器驯服动态，再利用动态EQ“查缺补漏”，以轻巧的“两步走”完成轻量级的去齿音任务。

常规方法：只用动态均衡器，单插件就能搞定

在“最轻量：宽带压缩器 + 动态均衡器（两步） ”这一效果器组合中，挑大梁的是压缩器。而接下来我要介绍的方案，就是只使用动态EQ来完成去齿音的任务，这也是更为常规的方案。

这个方案，适用于人声齿音集中在3～7 kHz，且动态不大（例如播客、旁白、较为舒缓的流行演唱）的情况。并且由于只使用一款插件，该方案在时间紧、任务重的场景下也非常胜任。

原理

动态EQ，本质上就是在参数均衡器的基础上，加入了压缩器的功能。它可以对特定的频率进行压缩处理，频率的信号到达我们设定的压缩阈值时，就会立刻启动压缩，控制该频率信号的动态，随后当信号在压缩阈值之下时就会立刻释放。动态EQ全程只在特定频率的电平达到阈值时才起作用。

齿音的特点，就是在特定的频率点上具有瞬时较高的电平，这正好是动态EQ擅长处理的地方。根据动态EQ的原理，我们只需找到齿音的频率，然后利用动态EQ来稍微削弱齿音：

基于其“动态”的特性，只有当齿音发生时，才触发动态EQ的压缩功能，降低齿音的电平；
而在齿音未发生时，动态EQ不工作，不会削弱信号。

如此，不该削弱的信号（例如齿音所在频率的大部分人声信号）不会被削弱，而是得以充分保留，避免了音质损失。形象地说，动态EQ则像一把“只在齿音所在频率处开合的小钳子”，齿音探头就夹，齿音离开就松开。

如何去齿音

考虑到REAPER没有自带动态均衡器，我同样使用免费的TDR Nova来进行演示。

这里我选择了综艺制作人、主持人王伟忠的一小段播客音频，由于设备关系，这段音频有明显的齿音，例如音频中“一开始”的“始”字，声母“Sh”的尖锐感格外明显。如果你使用笔记本（如笔者的ThinkPad R400）、便携屏等设备的扬声器聆听，则更为尖锐。

试听附件音频素材：2.1_王伟忠播客，原始音频.mp3

⬛ 第一阶段：插入TDR Nova

建立一个新的音轨，插入TDR Nova插件。其初始界面如下所示，可见插件支持4个频段。在这一节中，我们只使用第3个频段。

图 5 TDR Nova的默认设置。

⬛ 第二阶段：找“齿音带”

TDR Nova自带“Band Solo（只播放指定的频段）”模式，我们可以借助这个功能来扫频，寻找“齿音带”——齿音所在的频率或频段。步骤如下：

第一步：点选第2或第3个频段，确保当前频段设置为钟型曲线模式。
第二步：点击“Band Solo”按钮，让TDR Nova只播放该频段的信号。
第三步：随后，将Q值设在2.5～4.0这个区间，以尽可能收窄监听范围（但不要太窄，否则声音会“呲”，造成听感不适）。
第四步：接下来，循环播放人声最刺耳的一句（如 “Si-Su-Sh”多的词），同时从2.0 kHz开始逐渐调高“Freq”旋钮，逐步提升中心频率，直到你听到明显的尖锐齿音。一般女声5～7 kHz，男声4～5.5 kHz会出现最尖锐的“嘶啦”峰；在王伟忠的这段播客中，尖锐的齿音则位于3.2 kHz（这是由于翘舌音的齿音频率本身比平舌音要低一些）。

图 6 使用TDR Nova的“Band Solo”模式来查找“齿音带”。

值得一提的是，与FabFilter Pro-Q等参数均衡器一样，TDR Nova也提供了频谱图。你可以在聆听的同时，结合频谱图上显示的尖峰，更快地找到齿音集中的频率。在本例中，3.2 kHz的“Sh”音最为尖锐响亮，相应地该齿音也在频谱图上造出了一座奇高的尖峰，如图 6所示。我最早就是通过频谱图来找到齿音的位置的，再结合耳朵的聆听，最终确定了齿音的确切位置。

如果你选用的动态EQ没有“Band Solo”功能，可参考上一章使用ReaEQ扫频的步骤。

⬛ 第三阶段：开启动态处理

找到“齿音带”后，我们就可以着手对齿音进行动态均衡处理了。点选第3个频段，然后依次进行以下步骤：

第一步：先把该频段的“Gain（增益）”归零（0 dB）。
第二步：调节“Freq（中心频率）”旋钮，将其设为“齿音带”所在的频率。在本例中，我设置为3.2 kHz。
第三：调节“Q”旋钮，将Q值设置在2.5～4这个区间，使得钟形曲线包裹齿音所在的频段，不至于太宽而影响到其他的元素。
第四：调节“Ratio（压缩比率）”旋钮，将其设为3:1这个温和的比率。

如果齿音顽固，还可以进一步拉到6:1（或其他能驯服齿音的值）。

第五：调节“Gain（增益）”旋钮，将增益设置为-3 dB～-6 dB，适度削弱齿音。
第六：点击“Threshold”按钮，激活该频段的动态处理功能。然后，一边回放齿音音频，一边调低“Threshold（阈值）”旋钮，直到齿音听起来没有那么刺耳。

你也可以回到上一章“最轻量：宽带压缩器 + 动态均衡器（两步） ”→“第二道工序：使用动态均衡器，定点去除局部尖锋 ”，根据我介绍的“查找齿音RMS”的方法来找出最合适的阈值。在本例中，我设置为-19.0 dB。
如果对齿音驯服的效果不满意，你可能还需要适当调节增益和压缩比率。

调节启动时间（Attack）与释放时间（Release）：

Attack：设置为0.00～5.00 ms，短暂的启动时间可以让TDR Nova立刻抓住齿音，如果设置得过长则齿音会“逃跑”。
Release：设置为15～40 ms，这个区间适中，适合齿音压缩。注意，太短会导致抽吸效应（pumping effect），压缩器释放的太快，使得音量不稳定；太长则会过度压缩人声导致声音发闷。

在推荐的区间范围内，你还需要反复聆听并微调参数，找到最适合你音频的去齿音参数。

图 7 本例中使用的De-Ess参数。回放过程中，插件会直观显示输入信号电平（Threshold旋钮的灯条），以及动态EQ削弱的电平（Gain旋钮的灯条，以及频谱图中的金色曲线）。

在处理过程中，TDR Nova会实时显示动态EQ的工作状态。从图 7中你可以看到，当TDR Nova削弱齿音时，金色的钟形曲线会往下探，“Gain”旋钮也会亮起灯条，直观显示出频率削弱的信号强度。你可以据此来检查动态EQ是否正常工作。

经过处理后，王伟忠播客的齿音明显减弱了不少，在容易引发齿音的音节上听起来更为柔和。至此，我们达成了单独使用动态EQ去齿音的目标。一起来听听处理后的效果：

试听附件音频素材：2.2_王伟忠播客，去齿音处理.mp3

特殊技巧：并行干湿比（Parallel Blend）保留原声“空气感”

通常，按照以上的思路进行的De-Ess处理，对于动态不大的人声，其效果已经非常可观。

不过，如果是在一些编曲层次较为复杂的作品里，例如J-Pop（尤其是二次元快节奏的曲风）、摇滚乐（如Linkin Park的作品）、电子乐，其频谱比较复杂，容易掩蔽人声的高频部分。另一些作品更注重声乐的演绎，制作人希望通过人声细节的细腻表现，尤其是高频的细节，来营造独特的艺术氛围。在这两种场景下，De-Ess可能会在去齿音的同时，削弱人声的“空气感”，使人声的细节打一些折扣，甚至可能被伴奏掩盖。

这个时候，就可以利用动态均衡器的“并行干湿比（parallel blend）”功能，也就是并行播放原始信号（干信号）和经过处理的信号（湿信号），按照一定的比例将两路信号混合。以TDR Nova为例，你可以找到右下角的“Dry Mix（原始信号百分比）”旋钮。默认值为0.0，表示只输出经过处理的信号。如果你想保留空气感，则可以逐渐调高该旋钮，直至30～40。注意不可过高，否则会抵消动态EQ的处理。

应用并行干湿比技巧，你就可以在保留动态均衡器去齿音效果的同时，引入原始信号的质感——尤其是高频的质感，从而保留原始人声的空气感，让人声在De-Ess后依旧脱颖而出。

特别需要注意的地方：避免“先入为主”

当你大幅度调整EQ时，音频前后的对比很明显，你能充分把握其中的差异。然而，De-Ess前后的对比则细微得多，只有齿音所在的那一处频率有区别，而且差异并不是很大，这往往意味着你要仔细聆听才能听出差异。

如此特性，引出了另一个问题：先入为主。音乐人可能会一时疏忽，误把已经处理的音频当作未经过去齿音处理的音频。

为什么会先入为主？

当你的De-Ess工作告一段落，休息一段时间后返回你的工程，重新监听去齿音后的音频时，由于人耳对齿音频率的敏感度，你可能会盯着削减后仍部分留存的齿音不放，下意识以为这是没有经过去齿音处理的音频，于是又重新进行一轮De-Ess，影响正常工作流程。

我自己在测试“常规方法：只用动态均衡器，单插件就能搞定 ”这一章的音频素材时就是这样，由于播客里齿音集中的“Sh”音在处理前后差异也不明显，我也总是误以为自己没做好去齿音工作。然而，当我禁用动态均衡器，再对比监听处理前后的音频时，才意识到：原来TDR Nova早已发挥了作用！

如何避免先入为主？

要想避免去齿音工作时的先入为主，有以下两点注意事项，值得成为你日常遵循的要点。

⬛ 第一：对比原始音频

在你打算给音频进行De-Ess处理之前，务必检查目标音轨（或音频片段〔take〕）是否已经有了去齿音的效果器。如果有，那么你需要对比聆听启用去齿音前后的音频效果，看看是否已经达到你的目标，再决定下一步的操作。

如果你采用的方案使用了多个插件（例如压缩器与动态EQ的组合），那么你也可以“拆分步骤”，通过启用／禁用其中一个插件来比对效果。这一过程还可以帮助你“查缺补漏”，进一步完善插件的参数。

⬛ 第二：使用恒定的监听设备

即使是经过De-Ess的音频，在不同的设备上听起来感受也是不一样的。就拿我自己的情况来说，同一段去齿音后的音频，戴上铁三角ATH-M20x监听时，留下来的部分齿音听起来柔和舒适，已经达成了目标。然而，放在我的ThinkPad R400扬声器上聆听时，由于这类扬声器的特性，齿音所在的频段会被格外“放大”，如果不仔细听，还以为我忘记做De-Ess了。

因此，在进行De-Ess时，使用恒定的监听设备是必要的——整个De-Ess流程只使用一款监听设备，可以防止因频响曲线差异而导致你误判。

总结

当录制的人声里有明显的尖锐齿音，引人不快的时候，可以通过去齿音处理，改善听感，雕琢出更为“耐听”的人声音轨。而如果齿音相对简单、温和，就可以使用我在本文中讲解的两大方案，快速、轻量地完成处理：

压缩器 + 动态EQ：最轻量的方案，适用于录制环境理想、齿音不算特别尖锐的情况。以压缩器驯服齿音动态，辅以动态EQ“查缺补漏”。
单独使用动态EQ：通用方案，适合于温和场景下录制的音频——播客、流行演唱、旁白等。

同时，我还强调了一个注意事项：因人耳容易对齿音频率敏感，而容易误把已处理的音频当作未处理者，造成“先入为主”。为此，养成对比原始音频的习惯，以及使用恒定的监听设备，有利于我们更精准把握混音的工作流程，防止“二次De-Ess”造成不必要的麻烦。

当然，条条大路通罗马，可实现的方案不止一种，并且实践中需要处理的齿音也不局限于简单温和的情况。在下一篇教程里，笔者还会继续分享几种实用的去齿音方案，包括多段压缩、动态EQ进阶技巧等，相信可以胜任你的De-Ess工作。

本文出自《midifan月刊》2025年11月第235期

可下载 Midifan for iOS 应用在手机或平板上阅读（直接在App Store里搜索Midifan即可找到，或扫描下面的二维码直接下载），在 iPad 或 iPhone 上下载并阅读。

买不起专业 De-Esser 消齿音插件？DAW 自带与免费插件照样做得到（一）