Next: Box 7.1 Getting Reliable
Up: Chapter7Ambiguity Resoltion: Statistical Methods
Previous: 7.3 Part-of-Speech Tagging
の2つの行列 SEQSCORE と BACKPTR を用意する
この2つの matrix を用意し,最後に
maxj=1..N(SEQSCORE(j,T)) から
BACKPTR(i,t) を後ろ向きにたどって行けば確率を最大にするパスが求まる,
(Figure 7,9)
(例) ``flies like a flower`` (T=4,N=4)
Figure 7.4,Figure 7.6 を見ながら matrix を作っていく,
(Figure 7,4 に載ってない連接確率は 0.0001 とする)
- 初期化
T=1 (flies), Figure 7.10 左図
- 繰り返し
T=2 (like), Figure 7.10 右図
T=3,4 (like,flower) Figure 7.11,Figure 7.12
省略..
- 最大パスの取得
SEQSCORE(N,flower) が最大, ここから
BACKSTORE(i,t) を逆に
たどれば (flies/N)
(like/V)
(a/ART)
(flower/N) という結果が得られる
Table 1:
上
SEQSCORE(i,j),下
BACKPTR(i,t)
|
V |
N |
P |
ART |
flies |
 |
0.00725 |
0 |
0 |
like |
0.00031 |
 |
0.00022 |
0 |
a |
0 |
 |
0 |
 |
flower |
 |
 |
0 |
0 |
|
|
|
|
|
|
|
|
|
|
|
V |
N |
P |
ART |
flies |
 |
 |
 |
 |
like |
N |
N |
N |
 |
a |
 |
V |
 |
V |
flower |
ART |
ART |
 |
 |
|
trigram を使うと高い精度を得ることが知られている(95%)
Next: Box 7.1 Getting Reliable
Up: Chapter7Ambiguity Resoltion: Statistical Methods
Previous: 7.3 Part-of-Speech Tagging
1999-08-03