각 밴드의 너비가 1 표준편차인 정규분포 의 구상. 68-95-99.7 규칙 참고.
예측값 0과 표준편차 1을 나타낸 정규분포의 누적 확률.
표준 편차 (標準 偏差, 영어 : standard deviation , SD )는 통계집단의 분산 의 정도 또는 자료의 산포도 를 나타내는 수치로, 분산 의 음이 아닌 제곱근 즉, 분산을 제곱근한 것으로 정의된다. 표준편차가 작을수록 평균값에서 변량들의 거리가 가깝다.[ 1] 통계학 과 확률 에서 주로 확률의 분포, 확률변수 혹은 측정된 인구나 중복집합 에 적용된다. 관례에 따라 모집단은 그리스문자 로 표본은 영어 알파벳 으로 표기하는데, 모집단 의 표준편차는
σ σ -->
{\displaystyle \sigma }
(시그마)로, 표본 의 표준편차는
s
{\displaystyle s}
(에스)로 나타낸다.[ 2]
편차 (deviation)는 관측값 에서 평균 또는 중앙값 을 뺀 것이다.
분산 (variance)은 관측값에서 평균을 뺀 값을 제곱 하고, 그것을 모두 더한 후 전체 갯수로 나눠서 구한다. 즉, 차이값의 제곱의 평균이다. 관측값에서 평균을 뺀 값인 편차를 모두 더하면 0이 나오므로 제곱해서 더한다.
표준 편차(standard deviation)는 분산을 제곱근 한 것이다. 편차들(deviations)의 제곱합 (SS, sum of square)에서 얻어진 값의 평균치인 분산의 성질로부터 다시 제곱근해서 원래 단위로 만들어줌으로써 얻게된다.
모 표준 편차(population standard deviation) σ는 모집단의 표준 편차이다. 모 분산 σ2 에 제곱근을 씌워서 구한다.
표본 표준 편차(sample standard deviation) s는 표본의 표준 편차이다. 표본 분산 s2 에 제곱근을 씌워서 구한다.
정의
확률 변수 X 의 기댓값
E
-->
[
X
]
{\displaystyle \operatorname {E} [X]}
를
μ μ -->
{\displaystyle \mu }
라 하자. 이 때 모집단 X 의 표준편차
σ σ -->
X
{\displaystyle \sigma _{X}}
는 다음과 같이 정의한다.[ 3]
σ σ -->
=
E
-->
[
(
X
− − -->
μ μ -->
)
2
]
=
E
-->
[
X
2
]
+
E
-->
[
− − -->
2
μ μ -->
X
]
+
E
-->
[
μ μ -->
2
]
=
E
-->
[
X
2
]
− − -->
2
μ μ -->
E
-->
[
X
]
+
μ μ -->
2
=
E
-->
[
X
2
]
− − -->
2
μ μ -->
2
+
μ μ -->
2
=
E
-->
[
X
2
]
− − -->
μ μ -->
2
=
E
-->
[
X
2
]
− − -->
(
E
-->
[
X
]
)
2
{\displaystyle {\begin{aligned}\sigma &={\sqrt {\operatorname {E} \left[(X-\mu )^{2}\right]}}\\&={\sqrt {\operatorname {E} \left[X^{2}\right]+\operatorname {E} [-2\mu X]+\operatorname {E} \left[\mu ^{2}\right]}}\\&={\sqrt {\operatorname {E} \left[X^{2}\right]-2\mu \operatorname {E} [X]+\mu ^{2}}}\\&={\sqrt {\operatorname {E} \left[X^{2}\right]-2\mu ^{2}+\mu ^{2}}}\\&={\sqrt {\operatorname {E} \left[X^{2}\right]-\mu ^{2}}}\\&={\sqrt {\operatorname {E} \left[X^{2}\right]-(\operatorname {E} [X])^{2}}}\end{aligned}}}
유도과정에서 기댓값의 성질 이 사용되었다. 표준편차는 분산 의 제곱근과 같은 의미를 가진다.
통계적 추정
동일 경중률인 경우
경중률 이 동일한 경우 표본 내의 어떤 변인 x가 가지는 모집단 에서 표본(sample)의 표준편차의 추정치 s는 다음과 같다.
s
=
± ± -->
Σ Σ -->
(
x
− − -->
x
¯ ¯ -->
)
2
n
− − -->
1
=
± ± -->
Σ Σ -->
ν ν -->
2
n
− − -->
1
{\displaystyle s=\pm {\sqrt {\frac {\Sigma (x-{\overline {x}})^{2}}{n-1}}}=\pm {\sqrt {\frac {\Sigma \nu ^{2}}{n-1}}}}
s
{\displaystyle s}
: 표본의 표준편차
x
{\displaystyle x}
: 변인
x
¯ ¯ -->
{\displaystyle {\overline {x}}}
: 표본의 평균
n
{\displaystyle n}
: 표본의 크기
ν ν -->
{\displaystyle \nu }
: 잔차
분모를 n-1로 나누는 이유는 분산을 계산할 때 모평균이 아닌 표본 평균을 사용했기 때문에 모집단의 편의 추정량 (biased estimator)이 되므로, 분산이 불편 추정량 (unbiased estimator)이 되도록 하기 위해서이다.[ 4] n-1을 자유도 (degree of freedom)라고 본다.[ 5]
경중률이 다른 경우
경중률 을 w라 할 때,
Σ Σ -->
w
=
n
{\displaystyle \Sigma w=n}
인 경우에는 표본(sample) 표준편차 s를 다음과 같이 구한다.[ 4]
s
=
± ± -->
Σ Σ -->
w
(
x
− − -->
x
¯ ¯ -->
)
2
n
− − -->
1
=
± ± -->
Σ Σ -->
w
ν ν -->
2
n
− − -->
1
{\displaystyle s=\pm {\sqrt {\frac {\Sigma w(x-{\overline {x}})^{2}}{n-1}}}=\pm {\sqrt {\frac {\Sigma w\nu ^{2}}{n-1}}}}
같이 보기
각주