조대협의 블로그

  • HOME
  • TAGS
  • MEDIA
  • GUESTBOOK
  • ADMIN
  • WRITE

Databricks 1

빅데이터 분석을 위한 메달리온 아키텍처

빅데이터 분석을 위한 메달리온 아키텍처조대협 (http://bcho.tistory.com) 메달리온 아키텍처는 데이터를 품질에 따라서 계층별로 나눠서 저장하는 데이터 분석 아키텍처이다. Databricks에서 데이터 엔지니어링과 분석 워크플로우를 단순화하기 위해서 소개된 개념으로 데이터 레이크 기반 시스템에서 데이터의 품질과 정제 수준을 체계적으로 관리하기 위해서 등장했다. 데이타를 품질에 따라서, 올림픽 메달처럼 Bronze ⇒ Silver ⇒ Gold 등급으로 나눠서 저장한다. 특히 데이터 레이크 (하둡과 같은 파일 시스템 기반)과 데이터 웨어하우스(빅쿼리,오라클,스노우플레이크와 같은 SQL 기반)을 통합하여, 데이터 정제 단계를 계층화 하였다.  이해를 돕기 위해서 아래 그림을 보자. 먼저 데이터 ..

빅데이타 & 머신러닝 2025.03.04
이전
1
다음
더보기
프로필사진

실리콘밸리에서 살고 있는 평범한 엔지니어 입니다 이메일-bwcho75골뱅이지메일 닷컴. 아키텍처 디자인, 머신러닝 시스템, 빅데이터 설계, DEVOPS/SRE, 애자일 방법론,쿠버네티스,마이크로서비스, ChatGPT 생성형 AI , CTO 등에 대한 기술 멘토링과 강의 진행합니다. 쓰레드 : https://www.threads.net/@byungwookcho

  • 분류 전체보기
    • 조대협의 소프트웨어 개발
    • IT 이야기
      • 트렌드
      • IT와 사람
    • 사는 이야기
      • 골프
      • 책
      • 일정 자료 관리 방법
      • 육아
    • 빅데이타 & 머신러닝
      • 통계학 이론
      • 스트리밍 데이타 처리
      • 머신러닝
      • R
      • Zepplin
      • Google BigQuery
      • 생성형 AI (ChatGPT etc)
      • Pytorch
    • 비지니스
      • 비지니스와 세일즈
      • 스타트업
    • 클라우드 컴퓨팅 & NoSQL
      • Data Grid (IMDG)
      • Identity Management
      • Apache Httpd
      • IIS
      • NginX
      • NoSQL 일반
      • RabbitMq
      • Redis
      • MongoDB
      • Hadoop
      • HBase
      • Cassandra
      • CouchBase
      • Riak
      • IaaS 클라우드
      • PaaS 클라우드
      • SaaS
      • 개인 클라우드
      • google cloud
      • Azure
      • Amazon Web Service
      • 분산컴퓨팅&클라우드
      • VDI
      • 운영 & Devops
      • Vert.x & Node.js
      • M2M & IOT
      • 도커 & 쿠버네티스
    • 아키텍쳐
      • 머신러닝
      • BI
      • WEB 2.0
      • SCA
      • SOA
      • Enterprise 2.0
      • Domain Driven Design
      • EAI
      • 대용량 아키텍쳐
      • Security & IDM
      • 모바일
    • 성능과 튜닝
      • JVM
      • APM (AP 성능 측정)
      • 자바 성능팁
      • WAS 튜닝
    • ALM
      • 애자일
      • 배포(Deployment)
      • JIRA
      • 에세이
      • SCM/VCS
      • Build Automation (빌드..
      • Test Automation
      • Build Automation(이클립..
      • Task Management
    • 프로그래밍
      • 알고리즘
      • 안드로이드
      • Ruby
      • JavaScript
      • Python
      • Spring & Maven
      • LIBS
      • Hibernate(하이버네이트)
      • 프로그래밍팁
      • MVC
      • XML 관련
      • J2EE
      • Groovy
      • JSF & Oracle ADF Fac..
      • Visual Studio
      • C# & .NET
      • ASP.NET
      • Windows Phone7
      • 아두이노
      • Nest.js
    • 엔터프라이즈 솔루션
      • Wiki
      • 우분투
      • 포탈
      • Oracle BPEL
      • Oracle Service Bus (..
      • BEA Tuxedo
      • MS-SQL
      • SharePoint
      • BEA WebLogic
      • 빅데이타

Tag

쿠버네티스, 빅데이타, node.js, 튜토리얼, 조대협, 클라우드, 딥러닝, Tutorial, 구글, Machine Learning, Kubernetes, cloud, 머신러닝, 클라우드 컴퓨팅, google, 소개, 강좌, 초보, 텐서플로우, tensorflow,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/09   »
일 월 화 수 목 금 토
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30

방문자수Total

  • Today :
  • Yesterday :

  • 서버사이드 아키텍트 그룹
  • Dzone
  • InfoQ
  • 마틴파울러 옹
  • Craig Larman 홈페이지
  • 강대명님(Redis) 블로그
  • 수학공부닷컴(중학교수준)
  • Udacity
  • 커니의 안드로이드
  • 코드 스쿨
  • 랭귀지 튜토리얼
  • Code Academy
  • Coursera
  • 온라인강좌-Udemy
  • 데이타 과학 놀이터
  • 데이타 관련 튜토리얼

티스토리툴바