빅데이타 & 머신러닝/통계학 이론

근대 통계학의 개념과 유례

Terry Cho 2014. 11. 12. 22:21

근대 통계학의 개념과 유례


통계학이란,(네이버 지식 백과 참고)-기술통계학과, 추론 통계학

통계학(統計學, statistics)은 주어진 자료에서 합계나 평균과 같이 필요한 정보를 계산하는 등 자료를 수집·정리·요약하는 기술통계학(記述統計學, descriptive statistics)표본(자료)에서 얻은 정보를 이용하여 모집단(자료를 뽑은 대상 전체)에 대한 정보를 예측하고 불확실한 사실에 대한 결론을 이끌어 내는 데 필요한 이론과 방법을 제시하는 추론통계학(推論統計學 , inferential statistics)으로 구성되어 있다.


통계학은 표본 그 자체보다는 모집단에 관심을 가지고 일부분으로 전체에 대한 정보를 알아내려고 하는 것이며 이러한 것을 통계적 추론(statistical inference)이라 한다. 부분으로 전체에 대한 정보를 구하다 보니 오차가 나타나며 이러한 오차를 줄이고 또한 오차의 크기를 계산하여 정보 이용자에게 제공하는 것이 통계학의 목적이라고 할 수 있다.


통계학은 응용수학(應用數學, applied mathematics)의 한 분야로써 관찰 및 조사를 통해 얻을 수 있는 불균형적인 데이터로부터 응용수학의 기법을 이용하여 데이터의 성질, 규칙성 또는 불규칙성을 찾아낸다.


근대 통계학의 아버지 케틀레

근대 통계학은 19세기에 벨기에 천문학자 케틀레 아돌프 자크 케틀레 (Lambert Adolphe Jacque Quetelet) 에 의해서 정립 되었는데,

케틀레17세부터 아이들에게 수학을 가르키고, 23세에 박사 학위를 받았다. (아마 천재인듯)



17~18세기에는 천문학이 발전하는 시기였고, 이때문에, 천체의 움직임을 정확하게 측정하기 위해서 물리학이 함께 발전했던 시기 였다. 이때 천문학자들이 동일한 측량에도 불구하고 오차가 발생하는 것을 줄이기 위해서 통계학의 개념이 발전하게 되었다.

이 시기에 케틀레는 천문학을 공부하면서 자연스럽게 통계학을 배우게 되고, 이런 자연 통계학의 개념을 사회 통계학의 개념에 적용 시켰는데, 


자연통계학에서 근대 통계학으로의 발전

"1835년에 케틀레는 《인간과 능력 개발에 대하여 Sur l’homme et le developpement de ses faculte s, ou essai de physique sociale》을 발표하게 됩니다. 이는 인구통계와 범죄통계를 연구하여 구현상 이외의 도덕현상이나 범죄현상 같은 무질서해 보이는 사회현상에 있어서도 일종의 규칙성이 존재한다는 것을 증명한 연구였습니다. 케틀레는 월별ㆍ지역별ㆍ기온별ㆍ시간별 출생률과 연령ㆍ직업ㆍ지역ㆍ계절과 장소에 따른 사망률을 조사하며 신장과 체중ㆍ성장률ㆍ음주와 정신병력 여부, 자살ㆍ범죄 등도 변수에 넣어 계산한 끝에, 어떤 사회에서의 출생률과 사망률, 자살자의 수 등이 매년 거의 일정하다는 사실을 발견하였습니다. 그리고 인간특질측정이 정규분포 확률곡선에 따라 그 값 주위로 나타나는 중간 값을 기준으로 '보통사람'의 개념을 나타내어 평균인의 개념을 도입하였습니다. 케틀레의 이 연구를 기점으로 범죄 같은 자발적 행위가 모순 없이 수로 표시되는 그의 연구로 '도덕통계학'의 광범위한 연구와 자유의지설 대 사회결정론의 폭넓은 토론이 발전되었습니다."

즉 랑베르에 의해서, 자연 통계학이 사회 현상에도 적용 가능하다는 사실을 밝히면서 기존의 자료나 사실을 근거로 하여 자료에서 의미를 찾아내는 통계에서, 불확실성을 기반으로 미래를 예측하거나 표본 집단을 통해서 전체를 예측하는, 예측 기반의 근대 통계학이 성립되어 간것이다.



참고

- http://hikostat.kr/1986

- http://terms.naver.com/print.nhn?docId=2164900&cid=44413&categoryId=44413