Next: 15.1.3 The probability ranking
Up: 15.1 Some Background on
Previous: 15.1.1 Common design features
- precision(適合率), recall(再現率)
- query に対して,すべての document を正解と出力する system
recall 100%
- query に対して 正しい document ただ1つを答える system
precison 100%
一般的に trade off の関係
- CUTOFF
- N 位 の precison
- N を cutoffという (5,10,20,100)
(例 Table 15.2)
- Uninterpolated average precision
(例 Figure 15.2)
ranking 3 の Uninterpolated average precison は?
- Interpolated average precison (11-point)
- 一般的な評価基準, recall を考慮
- recall 0% 10% 20%
100% (11 points) における
precision の平均値
- recall を
という値に固定して その時の precison
を求めることは一般的に困難
- 正解が 2つしか無い場合は, recall は 0,50,100% の3
通りしかない
正解が十分な個数あれば可能
- precison が単調減少しない場合(Figure 15.2上),
これまでの最大値を precison とする
- interpolate (Figure 15.2下)
- precision-recall curves
- F measures
- これらの値は, 検索system の性能評価に用いられる,
しかし,偶然, system に依存した query 等が原因で,
絶対的な評価基準となりうるとは限らない
t検定などを用いる
- 余談
TREC の tool にこれらの評価値を計算する program があります
1999-08-03