Apache Spark 소개 - 스파크 스택 구조

빅데이타 & 머신러닝/스트리밍 데이타 처리

Apache Spark 소개 - 스파크 스택 구조

Terry Cho 2015. 5. 22. 00:36

Spark의 전체적인 스택 구조

조대협 (http://bcho.tistory.com)

스파크의 전체적인 스택 구조를 보면 다음과 같다.

인프라 계층 : 먼저 스파크가 기동하기 위한 인프라는 스파크가 독립적으로 기동할 수 있는 Standalone Scheudler가 있고 (그냥 스팍만 OS위에 깔아서 사용한다고 생각하면 된다). 또는 하둡 종합 플랫폼인 YARN 위에서 기동될 수 있고 또는 Docker 가상화 플랫폼인 Mesos 위에서 기동될 수 있다.
스파크 코어 : 메모리 기반의 분산 클러스터 컴퓨팅 환경인 스팍 코어가 그 위에 올라간다.
스파크 라이브러리 : 다음으로는 이 스파크 코어를 이용하여 특정한 기능에 목적이 맞추어진 각각의 라이브러리가 돌아간다. 빅데이타를 SQL로 핸들링할 수 있게 해주는 Spark SQL, 실시간으로 들어오는 데이타에 대한 리얼타임 스트리밍 처리를 해주는 Spark Streaming, 그리고 머신러닝을 위한 MLib, 그래프 데이타 프로세싱이 가능한 GraphX가 있다.

현재 글에서 설명하고 있는 부분은 먼저 스파크에 대한 기본을 이해하기 위해서 Spark Core 부분을 중점적으로 설명하고 있다.

저작자표시 비영리 (새창열림)

'빅데이타 & 머신러닝 > 스트리밍 데이타 처리' 카테고리의 다른 글

Apache Spark - RDD (Resilient Distributed DataSet) 이해하기 - #2 (1)	2015.05.26
Apache Spark - RDD (Resilient Distributed DataSet) 이해하기 - #1 (0)	2015.05.22
Apache Spark 클러스터 구조 (0)	2015.05.18
Apache Spark 설치 하기 (0)	2015.05.18
Apache Spark이 왜 인기가 있을까? (7)	2015.05.18

현재글Apache Spark 소개 - 스파크 스택 구조

실리콘밸리에서 살고 있는 평범한 엔지니어 입니다 이메일-bwcho75골뱅이지메일 닷컴. 아키텍처 디자인, 머신러닝 시스템, 빅데이터 설계, DEVOPS/SRE, 애자일 방법론,쿠버네티스,마이크로서비스, ChatGPT 생성형 AI , CTO 등에 대한 기술 멘토링과 강의 진행합니다. Linkedin : https://www.linkedin.com/in/terrycho75/

소개, node.js, 클라우드, cloud, tensorflow, Machine Learning, google, 머신러닝, 딥러닝, 빅데이타, Tutorial, 강좌, 조대협, Kubernetes, 쿠버네티스, 텐서플로우, 클라우드 컴퓨팅, 튜토리얼, 구글, 초보,

Today :
Yesterday :

일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

조대협의 블로그