분산 대용량 큐-Apache Kafka에 대한 검토

클라우드 컴퓨팅 & NoSQL/분산컴퓨팅&클라우드

분산 대용량 큐-Apache Kafka에 대한 검토

Terry Cho 2015. 1. 29. 19:00

분산 대용량 큐-Apache Kafka에 대한 검토 내용 정리

실시간 빅데이타 분석 아키텍쳐를 검토하다가 아파치 스톰을 보다보니, 실시간 데이타 스트림은 큐를 이용해서 수집하는 경우가 많은데, 데이타의 양이 많다 보니 기존의 큐 솔루션으로는 한계가 있어서 분산 대용량 큐로 아파치 카프카(Kafka)가 많이 언급된다.

그래서, 아키텍쳐를 대략 보고, 실효성에 대해서 고민을 해봤는데, 큐의 기능은 기존의 JMS나 AMQP 기반의 RabbitMQ(데이타 기반 라우팅,페데레이션 기능등)등에 비해서는 많이 부족하지만 대용량 메세지를 지원할 수 있는 것이 가장 큰 특징이다. 특히 분산 환경에서 용량 뿐 아니라, 복사본을 다른 노드에 저장함으로써 노드 장애에 대한 장애 대응 성을 가지고 있기 때문에 용량에는 확실하게 강점을 보인다.

실제로 마이크로소프트 社의 엔지니어가 쓴 논문을 보면http://research.microsoft.com/en-us/um/people/srikanth/netdb11/netdb11papers/netdb11-final12.pdf

카프카의 경우 10만 TPS 이상의 성능을 RabbitMQ는 2만 TPS 정도의 성능을 내는 것으로 나와 있는데, 여기서 생각해볼 문제가 큐는 비동기 처리 솔루션이다. 즉 응답 시간에 그렇게 민감 하지 않다는 것이다.

그리고 일반적인 웹 시스템의 성능이 1500~2000 TPS (엔터프라이즈 시스템의 경우) 내외인 것이 일반적이기 때문에, Rabbit MQ의 2만 TPS의 성능은 충분하다고 볼 수 있지 않을까 한다.

물론 네이버나 해외의 대형 SNS 서비스의 경우에는 충분히 저정도의 용량이 필요하겠지만, 현재로써는 일반적인 시스템에서는 카프카의 용량과 성능은 약간 오버 디자인이 아닌가 하는 생각이 든다.

Rabbit MQ is scalable and

저작자표시 비영리 (새창열림)

'클라우드 컴퓨팅 & NoSQL > 분산컴퓨팅&클라우드' 카테고리의 다른 글

구글 클라우드-AppDev 알아보기 #1 EventArc를 이용한 EDA 구축 (1)	2025.10.31
분산 코디네이터 Zookeeper(주키퍼) 소개 (0)	2015.04.12
Thrift, Avro and Protocol Buffers (0)	2014.10.01
임시 파일 작업 공간 (Working storage)에 대한 노트 (1)	2014.10.01
REST API의 이해와 설계-#3 API 보안 (15)	2014.09.25

현재글분산 대용량 큐-Apache Kafka에 대한 검토

실리콘밸리에서 살고 있는 평범한 엔지니어 입니다 이메일-bwcho75골뱅이지메일 닷컴. 아키텍처 디자인, 머신러닝 시스템, 빅데이터 설계, DEVOPS/SRE, 애자일 방법론,쿠버네티스,마이크로서비스, ChatGPT 생성형 AI , CTO 등에 대한 기술 멘토링과 강의 진행합니다. Linkedin : https://www.linkedin.com/in/terrycho75/

google, 튜토리얼, 조대협, 텐서플로우, 강좌, 소개, 클라우드 컴퓨팅, 초보, tensorflow, Tutorial, 쿠버네티스, 빅데이타, 구글, Machine Learning, 클라우드, node.js, cloud, Kubernetes, 딥러닝, 머신러닝,

Today :
Yesterday :

일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

조대협의 블로그