Marginalized Probabilities and Counts of HMM
Forward Algorithm,Backward AlgorithmのDP変数,fi(t),bi(t)を用いて,周辺確率や周辺化カウントを計算できる.
States and Outputs
出力列が x1…T=x1…xTであるとき,時刻 t の状態が si である確率は,
P(ht=si|x1…T)=P(x1…T,ht=si)P(x1…T)=P(x1…t,ht=si)P(xt+1…T|ht=si)P(x1…T)=fi(t)bi(t)∑jfj(T).
このとき,状態が si が記号 c を出力した回数の期待値 ^Ei(c) は,上の確率を xt=c である t についてだけ和をとれば求まる.
^Ei(c)=E[si emits c|x1…T]=∑t|xt=cP(ht=si|x1…T)=∑t|xt=cfi(t)bi(t)∑jfj(T).
Transitions
出力列が x1…T=x1…xTであるとき,時刻 t から時刻 t+1 で状態 si から状態 sj に遷移した確率は,
P(ht=si,ht+1=sj|x1…T)=P(x1…T,ht=si,ht+1=sj)P(x1…T)=P(x1…t,ht=si)P(xt+1…T,ht+1=sj|ht=si)P(x1…T)=fi(t)ai,jej(xt+1)bj(t+1)∑jfj(T).
このとき,状態 si から状態 sj に遷移した回数の期待値 ^Ai,j は,上の確率を以下のように t について合計すれば求まる.
^Ai,j=E[si→sj|x1…T]=T−1∑t=1P(ht=si,ht+1=sj|x1…T)=∑T−1t=1fi(t)ai,jej(xt+1)bj(t+1)∑jfj(T).