人工智能:语音识别理解与实践
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第3章
隐马尔可夫模型及其变体

摘要 本章建立在对第2章关于概率理论与统计理论的综述的基础上,包括随机变量与混合高斯模型,并延伸至马尔可夫链与隐马尔可夫序列或者模型(Hidden Markov Model,HMM)。HMM的核心是状态这个概念,状态本身是一个随机变量,通常取离散值。从马尔可夫链延伸至隐马尔可夫模型(HMM),涉及在马尔可夫链的每一个状态上增加不确定性或统计分布。因此,一个HMM是一个马尔可夫链的双随机过程(Doubly-stochastic Process)或者概率函数。当马尔可夫序列或者HMM的状态被限定为离散的,且HMM状态的各分布间没有重叠时,它便成为一个马尔可夫链。本章首先讨论HMM的一些关键点,包括它的参数特征;通过离散随机数生成器对它的仿真、参数的最大似然估计,尤其是期望最大化(EM)算法;以及通过维特比(Viterbi)算法对它进行状态解码。接着讨论HMM作为一种生成模型如何产生语音特征序列,以及它如何被用作语音识别的基础模型。最后讨论HMM的局限性,引出它的各种延伸变体,在延伸变体里,每个状态与一个动态系统或者一个隐时变轨迹相关联,而不是与时序独立的稳态分布(如混合高斯分布)相关联。HMM的这些变体是用状态空间公式描述的基于状态的动态系统,它们的基本概念与在第12章详细介绍的循环神经网络是一致的。