此條目需要
精通或熟悉相关主题的编者 参与及协助编辑。
(2016年7月3日 ) 請邀請 適合的人士改善本条目 。更多的細節與詳情請參见討論頁 。
均方根偏差 (均方根差 ,英語:root-mean-square deviation ,RMSD )或均方根误差 (root-mean-square error ,RMSE )是常用於衡量模型预测值或估计量 (样本值或总体值)与观测值之间差异的一种指标。均方根偏差代表預測值和觀察值之差的二阶样本矩 的平方根(樣本標準差 ),或該差值的平方平均数 。當這些离差 是以用來計算估計量的數據樣本本身來計算時,通常稱差值為殘差 (residual );當差值不基於樣本得出的估計量時,通常稱為误差(error )或預測誤差(prediction errors )。均方根誤差主要作用是將各個數據點的預測的誤差大小彙總為一個預測力的度量。均方根誤差是精度 的度量,用于比较特定数据集的不同模型的预测误差,但不能比較数据集之间的预测误差,因为它是尺度依賴的。[ 1]
均方根誤差總是非負的,值為0(實際極少出現)的情況表示與數據完全吻合。一般而言,低RMSD比高RMSD要好。然而,在不同類型的數據之間進行比較是無意義的,因為度量取決於所使用的數字的尺度。
均方根誤差是平方誤差平均值的平方根。各個誤差對均方根誤差的影響與平方誤差的大小成正比;因此,較大的誤差對均方根誤差有不成比例的大影響。因此,均方根誤差對離群值很敏感。[ 2] [ 3]
公式
估计量
θ θ -->
^ ^ -->
{\displaystyle {\hat {\theta }}}
相對於被估計參數
θ θ -->
{\displaystyle \theta }
的均方根誤差的定義是均方误差 的平方根:
RMSD
-->
(
θ θ -->
^ ^ -->
)
=
MSE
-->
(
θ θ -->
^ ^ -->
)
=
E
-->
(
(
θ θ -->
^ ^ -->
− − -->
θ θ -->
)
2
)
.
{\displaystyle \operatorname {RMSD} ({\hat {\theta }})={\sqrt {\operatorname {MSE} ({\hat {\theta }})}}={\sqrt {\operatorname {E} (({\hat {\theta }}-\theta )^{2})}}.}
對於一個无偏估计量 (unbiased estimator),均方根差是變異數的平方根,即標準差 。
迴歸分析 中,時間為t 時應變數
y
t
{\displaystyle y_{t}}
的迴歸預測值
y
^ ^ -->
t
{\displaystyle {\hat {y}}_{t}}
在觀察次數為T 時的均方根差,可以作為T 次不同的預測,計算方式為离差 平方的均值的平方根:
RMSD
=
∑ ∑ -->
t
=
1
T
(
y
^ ^ -->
t
− − -->
y
t
)
2
T
.
{\displaystyle \operatorname {RMSD} ={\sqrt {\frac {\sum _{t=1}^{T}({\hat {y}}_{t}-y_{t})^{2}}{T}}}.}
(對於横截面数据 回歸,下標t 以i 取代,T 以n 取代。)
在某些情況下,均方根差被用來比較兩個事物之間的不同(可能沒有哪個被視為「標準」)。例如,在量度兩個時間序列
x
1
,
t
{\displaystyle x_{1,t}}
和
x
2
,
t
{\displaystyle x_{2,t}}
的平均偏差時,均方根偏差的式子會變成
RMSD
=
∑ ∑ -->
t
=
1
n
(
x
1
,
t
− − -->
x
2
,
t
)
2
n
.
{\displaystyle \operatorname {RMSD} ={\sqrt {\frac {\sum _{t=1}^{n}(x_{1,t}-x_{2,t})^{2}}{n}}}.}
正規化均方根誤差
將均方根誤差正規化,可以使不同數值範圍的資料集之間更易於比較。雖然目前並沒有一個一致的方法來正規化均方根差,但較常用平均值或是極差 (最大和最少值之差)來正規化被量測的資料。
N
R
M
S
D
=
R
M
S
D
y
max
− − -->
y
min
{\displaystyle \mathrm {NRMSD} ={\frac {\mathrm {RMSD} }{y_{\max }-y_{\min }}}}
或
N
R
M
S
D
=
R
M
S
D
y
¯ ¯ -->
{\displaystyle \mathrm {NRMSD} ={\frac {\mathrm {RMSD} }{\bar {y}}}}
.
這個值常稱為正規化均方根偏差(NRMSD)或正規化均方根誤差(NRMSE),常以百分比形式表示。比例的值較低時代表殘差變異數較小。在很多情況下,特別是取較小的樣本的時候,樣本的範圍容易被樣本的大小影響,其準確度可能就受到影響。
另一種使均方根誤差能用於橫向比較的方法是將其除以四分位距 。用四分位距來除均方根誤差,得到的正規化數值對目標變量中的極端值不那麼敏感。
R
M
S
D
I
Q
R
=
R
M
S
D
I
Q
R
{\displaystyle \mathrm {RMSDIQR} ={\frac {\mathrm {RMSD} }{IQR}}}
,其中
I
Q
R
=
Q
3
− − -->
Q
1
{\displaystyle IQR=Q_{3}-Q_{1}}
Q
1
=
CDF
− − -->
1
(
0.25
)
{\displaystyle Q_{1}={\text{CDF}}^{-1}(0.25)}
,
Q
3
=
CDF
− − -->
1
(
0.75
)
{\displaystyle Q_{3}={\text{CDF}}^{-1}(0.75)}
,其中「−1 」為分位函数 。
當以量測值的平均值來正規化時,可使用術語「均方根誤差变异系数 」來避免歧義,記作CV(RMSD)。[ 4] 它的計算方式和變異係數相似,但是以均方根差取代標準差:
C
V
(
R
M
S
D
)
=
R
M
S
D
y
¯ ¯ -->
{\displaystyle \mathrm {CV(RMSD)} ={\frac {\mathrm {RMSD} }{\bar {y}}}}
應用
在气象学 上,可用來評估一個數值模型可以多好地預測大氣層 的行為。
在生物資訊學 中,均方根差被用來量測重疊蛋白質(superimposed proteins)分子間的距離。
在結構藥物設計中,均方根差被用來測量配體 (ligand)的晶格構造以及對接預測(docking prediction)。
在經濟學 中,均方根差被用來確定一個模型是否吻合經濟指標。部分專家曾提出均方根差不如相對絕對誤差(relative absolute error)可靠。[ 5]
在實驗心理學中,分均根差被用來指示一個數學或計算行為模型(mathematical or computational models)能解釋實際觀察行為的良好程度。
在地理信息系统 (GIS)中,均方根誤差是一種用來評價空间分析 和遥感 精度的量度。
在水文地質學 中,均方根差和正規化均方根差被用來評估地下水模型校正。[ 6]
在影像科學中,均方根差是一種峰值信噪比 ,是一種用來評價一個方法相對原始圖像能多好地重建原來的圖像的方法。
在計算神經科學 中,均方根差被用來檢視一個系統能學習一個給定模型的能力。[ 7]
在蛋白質 核磁共振光譜學中,均方根差被用來當作一個評估結構品質的量度。
參見
参考文献
^ Hyndman, Rob J.; Koehler, Anne B. Another look at measures of forecast accuracy. International Journal of Forecasting. 2006, 22 (4): 679–688. CiteSeerX 10.1.1.154.9771 . doi:10.1016/j.ijforecast.2006.03.001 .
^ Pontius, Robert; Thontteh, Olufunmilayo; Chen, Hao. Components of information for multiple resolution comparison between maps that share a real variable. Environmental Ecological Statistics. 2008, 15 (2): 111–142. doi:10.1007/s10651-007-0043-y .
^ Willmott, Cort; Matsuura, Kenji. On the use of dimensioned measures of error to evaluate the performance of spatial interpolators. International Journal of Geographical Information Science. 2006, 20 : 89–102. doi:10.1080/13658810500286976 .
^ FAQ: What is the coefficient of variation? . [19 February 2019] . (原始内容存档 于2021-12-16).
^ Armstrong, J. Scott; Collopy, Fred. Error Measures For Generalizing About Forecasting Methods: Empirical Comparisons (PDF) . International Journal of Forecasting. 1992, 8 (1): 69–80 [2022-06-16 ] . CiteSeerX 10.1.1.423.508 . doi:10.1016/0169-2070(92)90008-w . (原始内容存档 (PDF) 于2021-07-06).
^ Anderson, M.P.; Woessner, W.W. Applied Groundwater Modeling: Simulation of Flow and Advective Transport 2nd. Academic Press. 1992.
^ Ensemble Neural Network Model . [2022-06-16 ] . (原始内容存档 于2021-09-21).