빅데이타 & 머신러닝 155

맨땅에 해딩 머신러닝 #2 - 선형 회귀 모델 (1)

Linear Regression (선형 회귀 문제)선형 회귀 문제란, 데이타의 분포를 분석하였을때, y=a1+a2x와 같은 선형 그래프 형태로 정의될 수 있는 문제를 이야기 한다.“집 평수에 따른 가격” 문제로 다시 돌아와보자.다음과 같은 트레이닝 셋(Training Set)데이터가 있다고 하자 평수 (x) 가격 (y) 2104 460 1416 232 1534 315 예를 들면, 이 트레이닝 셋에서 x1 = 2104가 되고,x3=1534가 된다. 그리고 y^2=232가 된다.그러면 머신러닝은 아래 그림을 이해하면 전체 개념을 잡을 수 있다. 그러면 머신 러닝이 어떤 흐름으로 작동하는지를 살펴보자. Hypothesis(추론)는 추론 알고리즘의 집합으로, Hypothesis h는 Feature를 넣으면 Ta..

맨땅에 해딩 머신러닝 #1-기본 개념 잡기

맨땅에 해딩 머신러닝 #1 어떻게 강의도 보고 이야기를 듣다 보니, 빅데이타 분석등에서 중요한 것은 데이타 저장/통계뿐만 아니라 데이타 분석을 기반으로 예측등과 같은 의미를 찾아내는 것이 중요하다는 것을 알게 되었는데, 후배가 DEVIEW 컨퍼런스에서 딥러닝 강의등을 듣고 대략적인 원리를 듣고 감명 받은 소감을 이야기 해줘서 관심을 가지고 있던 중, 아프리카 TV의 추천 시스템 등의 강의를 접하게 되었습니다.모든게 기본적으로 머신러닝이라는 것을 기본으로하고 있었는데, 이 분야를 공부하려고 봤더니, 수학(선형대수), 통계학 그리고 빅데이타 분석 시스템, 대용량 분산 처리 시스템등 여러가지 학문이 엮어 있더군요.지금까지 기술 흐름을 봤을때, 이 부분이 중요한 부분이 될것 같기도 해서 막상 공부를 시작하려고 ..

머신러닝 관련 온라인 강좌 사이트

코넬 대학 강의 http://www.cs.cornell.edu/courses/cs4780/2013fa/스탠포드 Cousera https://www.coursera.org/course/ml머신 러닝에 대해서 잘 정리해놓은 자료 http://sanghyukchun.github.io/ 코세라 앤드류교수님 강의를 정리해놓은 노트가 있어서 같이 보면 좋음Naive Bayes classification 알고리즘에 대한 하호진님의 글 http://www.mimul.com/pebble/default/2012/04/03/1333431077222.html오픈소스 matlab Octave : https://www.gnu.org/software/octave/Octave 기본 사용법 : http://apmath.kku.ac.k..