機械学習の回帰分析の評価関数

概要

回帰分析の評価関数がいくつかあるので、それらをまとめる。  y, \hat{y}はそれぞれ、正解値、予測値を表す。今回は、全データが n個あるとしている。

R2 (決定係数)

機械学習でよく用いられる。次元がなく、比べられる値。


\begin{align}
\rm{R ^ 2}(y, \widehat{y}) =1- \frac{\sum _ {i=1} ^ {n}(\hat{y} _ i-\bar{\hat{y}}) ^ 2}{\sum _ {i=1}^{n}(y _ i-\bar{y}) ^ 2}
\end{align}

RMSE (Root Mean Squared Error)

直感的にわかりやすいが、他のRMSEと比べられるかどうかはしっかり注意しなければならない。


\begin{align}
\text{RMSE}(y, \widehat{y}) = \sqrt{\frac{1}{n}\sum_{i=1}^{n}(y_i-\hat{y} _ i) ^ 2}
\end{align}

MAE (Mean Absolute Error)

RMSEと同様に直感的でわかりやすいが、比べられるかどうかは注意しなければならない。


\begin{align}
\text{MAE}(y, \widehat{y}) = \sqrt{\frac{1}{n}\sum_{i=1}^{n}|y_i-\hat{y} _ i|}
\end{align}

ピアソンの相関係数 (R)

ピアソンの相関係数は次元がなく、比べられる値となっている。


\begin{align}
\text{R}(y, \widehat{y}) = \frac{\sum _ {i=1} ^ {n}(y _ i-\bar{y})(\hat{y} _ i-\bar{\hat{y}} _ i)}{\sqrt{\sum _ {i=1}^{n}(y _ i-\bar{y}) ^ 2}\sqrt{\sum _ {i=1} ^ {n}(\hat{y} _ i-\bar{\hat{y}}) ^ 2}}
\end{align}

スピアマンの順位相関係数 ( \rho)

式の形はピアソンの相関係数と全く同じ形をしている。しかし、ここでの変数 y, \hat{y}は値そのものではなく、順位であることに注意してほしい。


\begin{align}
\rho(y, \widehat{y}) = \frac{\sum _ {i=1} ^ {n}(y _ i-\bar{y})(\hat{y} _ i-\bar{\hat{y}} _ i)}{\sqrt{\sum _ {i=1}^{n}(y _ i-\bar{y}) ^ 2}\sqrt{\sum _ {i=1} ^ {n}(\hat{y} _ i-\bar{\hat{y}}) ^ 2}}
\end{align}

参考文献

精度評価指標と回帰モデルの評価 ピアソンの相関係数、Spearman(スピアマン)の順位相関係数 役に立つ薬の情報 専門薬学