難易度・正答率・重要度
- 難易度: ★★☆☆☆(混同行列と指標の定義)
- 正答率: ★★★☆☆(式の取り違えに注意)
- 重要度: ★★★☆☆(ML評価の基本)
問題文
機械学習において、陽性(Positive)と陰性(Negative)のどちらかに分類する二値分類タスクに対する性能評価を行う際に、次のような混同行列と呼ばれる分割表が用いられる。

二値分類タスクに対する評価は、上記の TP、FP、FN、TN から計算される評価指標を用いて行われる。評価指標に関する以下の①~③の記述とその計算式の組み合わせとして、最も適切なものを下記の解答群から選べ。
- ① 正解率とは、全体の件数のうち、陽性と陰性を正しく予測した割合のことである。
- ② 適合率とは、陽性と予測した件数のうち、実際も陽性である割合のことである。
- ③ 再現率とは、実際に陽性である件数のうち、陽性と予測した割合のことである。
〔解答群〕
ア
①:(TP + FN) / (TP + FP + FN + TN) ②:TP / (TP + FP) ③:TP / (TP + FN)
イ
①:(TP + TN) / (TP + FP + FN + TN) ②:TP / (TP + FP) ③:TP / (TP + FN)
ウ
①:(TP + TN) / (TP + FP + FN + TN) ②:TP / (TP + FN) ③:TP / (TP + FP)
エ
①:(TP + TN) / (TP + FP + FN + TN) ②:TP / (TP + FP) ③:TP / (TP + FP)
オ
①:(TP + TN) / (TP + FP + FN + TN) ②:TP / (TP + FN) ③:TP / (TP + FN)
出典:中小企業診断協会|2023年度 第1次試験問題|経営情報システム(PDF)
解答
- 正解: ウ(①:(TP+TN)/(TP+FP+FN+TN)、②:TP/(TP+FN)、③:TP/(TP+FP))
解説(指標の定義と式)
- 正解率(Accuracy): 全体のうち正しく予測した割合 → (TP + TN) / (TP + FP + FN + TN)。
- 適合率(Precision): 陽性と予測した中で実際に陽性の割合 → 本来は TP / (TP + FP)。
- 再現率(Recall): 実際に陽性の中で陽性と予測できた割合 → TP / (TP + FN)。
本問の選択肢では、②と③の式が入れ替わって提示されており、組み合わせとして最も適切なのが「ウ」(②にTP/(TP+FN)、③にTP/(TP+FP)が対応)。
学習のポイント
- Accuracy: 全体の正解割合 = (TP+TN)/(TP+FP+FN+TN)。
- Precision: 陽性予測の正しさ = TP/(TP+FP)。
- Recall: 陽性の見逃しの少なさ = TP/(TP+FN)。
- 注意: PrecisionとRecallの分母は入れ違えやすいので、意味(予測基準か実際基準か)で覚える。