Statistics/Statistics

[Statistics] 표준 편차의 분모가 n-1가 쓰이는 이유는?

눈곱만큼도모름 2023. 8. 18. 15:33
728x90
반응형

표준 편차의 공식을 만날때 우리는 분모가 n-1인 공식과 아래와 같이 N인 공식을 만나게 된다.

N이 쓰인 이유는 쉽게 이해할수 있고 당연하다고 생각하겠지만

n-1은 고개를 갸우뚱 하게 만든다.

쉽게 결론부터 이야기 하자면 모집단인가 표본인가의 차이이다.

모집단에서의 분산은 N을 사용하지만

표본의 경우 모집단의 편균을 알지못하기에 표본의 평균을 사용하여, 표준편차를 추정한다.

이때. 모집단의 평균을 사용할때는 표본의 평군을 사용할 때의 편향성과 불편성(unbiasedness)을 고려하게 된다.

 

표본의 평균을 사용할때, 분모를 N으로 하게 될경우 표준편차가 실제 모집단의 표준편차보다 작게 나올수 있다.

쉽게 이야기 하자면 분포가 보다 중앙값에 몰리게 된다.

이는 표본의 표본의 평균을 사용하는 것만으로 변동성이 일부 툭소되기 때문이다.

따라서 표본의 크기가 클 수록 이런 편향성이 감소한다.

 

n-1은 이러한 편향성을 보정하기 위한 것이다.

이를 비편향 추정량(nubiased estimator)을 얻기 위한 보정이라고 한며,

이러한 보정을 Bessel's Correction라고 한다.


모집단에서의 표준편차
비편향 추정량을 얻기 위한 보정이 있는 표본집단의 분산


 

728x90
반응형