Marginalized Probabilities and Counts of HMM

Forward Algorithm,Backward AlgorithmのDP変数,fi(t),bi(t)を用いて,周辺確率や周辺化カウントを計算できる.

States and Outputs

出力列が x1T=x1xTであるとき,時刻 t の状態が si である確率は,
P(ht=si|x1T)=P(x1T,ht=si)P(x1T)=P(x1t,ht=si)P(xt+1T|ht=si)P(x1T)=fi(t)bi(t)jfj(T).

このとき,状態が si が記号 c を出力した回数の期待値 ^Ei(c) は,上の確率を xt=c である t についてだけ和をとれば求まる.
^Ei(c)=E[si emits c|x1T]=t|xt=cP(ht=si|x1T)=t|xt=cfi(t)bi(t)jfj(T).

Transitions

出力列が x1T=x1xTであるとき,時刻 t から時刻 t+1 で状態 si から状態 sj に遷移した確率は,
P(ht=si,ht+1=sj|x1T)=P(x1T,ht=si,ht+1=sj)P(x1T)=P(x1t,ht=si)P(xt+1T,ht+1=sj|ht=si)P(x1T)=fi(t)ai,jej(xt+1)bj(t+1)jfj(T).


このとき,状態 si から状態 sj に遷移した回数の期待値 ^Ai,j は,上の確率を以下のように t について合計すれば求まる.
^Ai,j=E[sisj|x1T]=T1t=1P(ht=si,ht+1=sj|x1T)=T1t=1fi(t)ai,jej(xt+1)bj(t+1)jfj(T).