登录

隐马尔可夫模型

百科 > 隐马尔可夫模型

1.什么是隐马尔可夫模型

隐马尔可夫模型是统计模型,它用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数。然后利用这些参数来作进一步的分析,例如模式识别。

在正常的马尔可夫模型中,状态对于观察者来说是直接可见的。这样状态的转换概率便是全部的参数。而在隐马尔可夫模型中,状态并不是直接可见的,但受状态影响的某些变量则是可见的。每一个状态在可能输出的符号上都有一概率分布。因此输出符号的序列能够透露出状态序列的一些信息

图:隐马尔可夫模型状态变迁图(例子)

x — 隐含状态

y — 可观察的输出

a — 转换概率(transition probabilities)

b — 输出概率(output probabilities)]]

2.隐马尔可夫模型的历史

“隐马尔可夫模型”最初是在二十世纪六十年代后半期Leonard E.Baum和其它一些作者在一系列的统计学论文中描述的。HMM最初的应用之一是开始于二十世纪七十年代中期的语音识别。

在二十世纪八十年代后半期,HMM开始应用到生物序列尤其是DNA的分析中。从那时开始,在生物信息学领域它们已经变得无处不在。

3.隐马尔可夫模型的使用

HMM有三个经典(canonical)问题:

  • 已知模型参数,计算某一特定输出序列的概率.通常使用forward算法解决.
  • 已知模型参数,寻找最可能的能产生某一特定输出序列的隐含状态的序列.通常使用Viterbi算法解决.
  • 已知输出序列,寻找最可能的状态转移以及输出概率.通常使用Baum-Welch算法以及Reversed Viterbi算法解决.

另外,最近的一些方法使用Junction tree算法来解决这三个问题。

4.隐马尔可夫模型的应用

  • 语音识别或光学字符识别
  • 机器翻译
  • 生物信息学和基因组学
    • 基因组序列中蛋白质编码区域的预测
    • 对于相互关联的DNA或蛋白质族的建模
    • 从基本结构中预测第二结构元素
评论  |   0条评论