上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
第I部分
传统声学模型
第2章
混合高斯模型
摘要 本章首先介绍随机变量和概率分布的基本概念。然后这些概念会被应用在高斯随机变量和混合高斯随机变量中。我们将讨论标量和向量形式的随机变量,以及它们的概率密度函数。当将混合高斯随机变量的分布用于匹配真实世界的数据(如语音特征)时,就形成了混合高斯模型(GMM)。GMM作为描述基于傅里叶频谱语音特征的统计模型,在传统语音识别系统的声学建模中发挥了重要作用。我们将讨论GMM在声学模型中的关键优势,这些优势使得期望最大化(EM)算法可以被有效地用来训练模型,以匹配语音特征。我们将详细描述最大似然准则和EM算法,这些仍然是目前在语音识别中被广泛使用的方法。最后将讨论GMM在语音识别的声学模型中的一个严重缺点,并由此引出本书主要介绍的新模型和方法。