빅데이타 & 머신러닝/통계학 이론

확률분포에서 T분포의 사용 예제

Terry Cho 2014. 12. 1. 23:34

T분포 and 잡담


지난 주에 확률분포를 보고, 어디다 써먹어야 되는지... 고민이 많았는데.

받은 조언은

보통 정규분포를 많이 사용하고, T분포나, F분포, 카이제곱 분포는 검정(가설 검증)에 많이 사용한다는 의견이었는데.

 

오늘 손안의 통계를 보니까는 T 분포 예제가 나옵니다.

T 분포는 정규 분포와 형태가 비슷하지만, 중앙의 높이는 더 낮고, 양쪽옆의 높이는 더 높은 형태로

데이타 분포가 정규 분포에 비해서 조금 더 산개된 모양을 가지고 있습니다.

 

어디다 쓰는지 봤더니

모집단의 평균이나 분산 값을 알지 못할때, 표본의 평균과 분산으로 모집단의 평균등의 신뢰 구간을 측정하는데 T 분포를 사용합니다.

 

손안의 통계 33페이지에 보면

대졸 신입 사원의 초임 표본 평균을 75만원이라고 하고, 표본 표준편차가 5만원일때, 전체 모집단의 초임을 신뢰도 95% 신뢰도 구간으로 구하는 문제입니다.

 

이 경우, T 분포를 이용하여, T 분포 신뢰구간 95%를 구하면 72.9361~77.0.639 가 됨을 볼 수 있습니다.


예제보고 다시 위키에 나와 있는 T분포를 보니

"모집단의 분산을 모를때, 모집단의 평균을 추정하는데 사용됨"

이제 이해가되네..

그리드형