V2EX  ›  英汉词典

MFCC

Definition / 释义

MFCC 是 Mel-frequency cepstral coefficients 的缩写,中文常译为梅尔频率倒谱系数。它是一种把音频信号(尤其是语音)的频谱特征压缩成一组数字特征的表示方法,广泛用于语音识别、说话人识别、音频分类等任务。(在不同领域还可能有其他含义,但最常见的是语音信号处理中的这一项。)

Pronunciation / 发音(IPA)

/ˌɛm ˌɛf ˌsiː ˌsiː/

Examples / 例句

We extracted MFCC features from the recording.
我们从这段录音中提取了 MFCC 特征。

Because MFCCs approximate how humans perceive sound frequency, they are often used as input features for speech recognition models.
由于 MFCC 能近似反映人类对频率的感知方式,它们常被用作语音识别模型的输入特征。

Etymology / 词源

MFCC 来自信号处理术语组合:Mel-frequency(梅尔频率,基于人耳感知建立的频率尺度)+ cepstral(倒谱,源自对 spectrum “频谱”一词进行字母调换的幽默式命名,用来表示对数频谱再做变换得到的域)+ coefficients(系数)。整体指“在梅尔尺度下计算得到的倒谱系数”。

Related Words / 相关词汇

Literary Works / 作品与文献中的用例

  • Speech and Language Processing(Daniel Jurafsky & James H. Martin)——在语音特征部分讨论 MFCC 等经典特征
  • Fundamentals of Speech Recognition(Lawrence R. Rabiner & Biing-Hwang Juang)——介绍语音识别中常用的特征提取方法,包括 MFCC
  • The HTK Book(Cambridge University Engineering Department)——在使用 HMM 的语音识别流程中频繁使用 MFCC 作为默认特征表示
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2191 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 12ms · UTC 15:28 · PVG 23:28 · LAX 07:28 · JFK 10:28
♥ Do have faith in what you're doing.