Question 1

AUC とは何ですか？なぜ重要なのですか？

Accepted Answer

AUC（ROC曲線下面積）は、すべてのしきい値にわたって、分類器が陽性例を陰性例より高く順位付けできる能力を測定します。しきい値に依存せず、クラス不均衡にも強いため、医療・機械学習・金融における二値分類モデルの標準的な指標です。

Question 2

AUC が 0.5 というのはどういう意味ですか？

Accepted Answer

AUC が 0.5 というのは、分類器の性能がランダム予測と変わらないことを意味します。つまり、陽性と陰性を無作為に順位付けしている状態です。0.5 未満の AUC は、分類器が体系的に誤っており、予測を反転すると偶然以上の性能が得られることを示します。

Question 3

最適なしきい値はどのように選ばれますか？

Accepted Answer

この計算器は Youden の J 統計量（J = 感度 + 特異度 − 1）を用いて最適なしきい値を選択します。感度と特異度の合計を最大化し、バランスの取れた動作点を提供します。コスト最小化や F1 スコア最大化などの別基準では、用途に応じて異なる最適しきい値になることがあります。

Question 4

AUC は多クラス分類に使えますか？

Accepted Answer

標準的な AUC は二値分類用に定義されています。多クラス問題では、各クラスごとに one-vs-rest AUC を計算するか、マクロ平均または加重平均の AUC を報告します。この計算器は二値分類（ラベル 0 と 1）のみをサポートします。

Question 5

感度と特異度の違いは何ですか？

Accepted Answer

感度（再現率または TPR）は、真の陽性をどれだけ検出できるかを表し、TP / (TP + FN) で計算します。特異度は、誤警報をどれだけ避けられるかを表し、TN / (TN + FP) で計算します。陽性の見逃しコストが高い場合（例：疾患スクリーニング）は高い感度が重要で、偽陽性のコストが高い場合（例：確認検査）は高い特異度が重要です。

Question 6

AUC は常にモデル評価の最良指標ですか？

Accepted Answer

AUC はしきい値をまたいだモデル比較や不均衡データに非常に有用ですが、常に最良とは限りません。極端に不均衡なデータでは、Precision-Recall AUC（PR-AUC）の方が有益なことが多いです。特定の判定しきい値では、F1 スコア、正解率、Matthews 相関係数の方が関連性が高い場合があります。

スコア、ラベルの組	AUC	解釈
0.9,1 / 0.8,1 / 0.3,0 / 0.2,0	AUC = 1.0	完全な分類器
0.9,1 / 0.8,1 / 0.75,1 / 0.6,0 / 0.55,1 / 0.45,0 / 0.4,0 / 0.35,0	AUC ≈ 0.9375	非常に高い判別能力
0.9,0 / 0.8,1 / 0.7,0 / 0.6,1 / 0.5,0 / 0.4,1	AUC ≈ 0.33	逆順の順位付け — ランダムより悪い

ROC曲線とAUC計算器 - 二値分類器評価

ROC曲線とAUC計算器について

ROC曲線の例

この計算器の使い方

よくある質問