Question 1

什麼是 AUC，為什麼它很重要？

Accepted Answer

AUC（ROC 曲線下面積）衡量分類器在所有閾值下將正樣本排在負樣本之前的能力。它不依賴閾值，且對類別不平衡具有魯棒性，因此是醫學、機器學習與金融領域二元分類模型的標準基準。

Question 2

AUC 為 0.5 代表什麼？

Accepted Answer

AUC 為 0.5 表示分類器的表現不比隨機猜測更好——它會隨機地對正負樣本排序。任何低於 0.5 的 AUC 都表示分類器系統性地判斷錯誤，反轉其預測後會得到高於隨機的表現。

Question 3

最佳閾值是如何選擇的？

Accepted Answer

本計算器使用 Youden 的 J 統計量（J = 靈敏度 + 特異度 − 1）來選擇最佳閾值。它會最大化靈敏度與特異度之和，提供一個平衡的操作點。根據應用情境不同，最小化成本或最大化 F1 分數等其他準則可能會得到不同的最佳閾值。

Question 4

AUC 可以用於多分類嗎？

Accepted Answer

標準 AUC 是為二元分類定義的。對於多分類問題，可以分別為每個類別計算 one-vs-rest AUC，或報告宏平均或加權平均 AUC。此計算器僅支援二元分類（標籤 0 和 1）。

Question 5

靈敏度和特異度有什麼差別？

Accepted Answer

靈敏度（召回率或 TPR）衡量分類器偵測真正陽性的能力：TP / (TP + FN)。特異度衡量其避免誤報的能力：TN / (TN + FP)。當漏掉陽性的代價很高時（例如疾病篩檢），高靈敏度至關重要；當誤報的代價很高時（例如確認性檢驗），高特異度更重要。

Question 6

AUC 總是最適合模型評估的指標嗎？

Accepted Answer

AUC 很適合用來跨閾值比較模型以及處理類別不平衡資料，但並不總是最佳選擇。對於高度不平衡的資料，精確率-召回率曲線下面積（PR-AUC）通常更有資訊量。對於特定決策閾值，F1 分數、準確率或馬修斯相關係數可能更相關。

ROC 曲線與 AUC 計算器 - 二元分類器評估

關於 ROC 曲線與 AUC 計算器