[CS] Apache Kafka란? (캐시, 버퍼/큐..) - 2

ssoxong·2024년 10월 17일

CS

목록 보기

3/13

Apache Kafka

Linkedin에서 만든 고성능 분산메세징용 오픈소스로, 안정적인 버퍼링(큐잉)을 제공한다.
인스타그램을 예시로 들면, 한 인플루언서가 게시글을 올렸을 때 realtime에 가깝게 5억명에게 알람을 띄우기 어렵다.
Kafka는 이러한 대용량 알림을 안정적으로 띄워줄 수 있도록 한다.

버퍼링을 사용해서 realtime에 가깝게 처리한다.
대용량 처리 도중 서버가 죽지/뻗지 않아야한다.
병렬처리

-> 이를 위해 모든 요청 사이에 kafka를 두는 추세이다.

+) 비슷한 기술로 RabbitMQ, ActiveMQ가 존재하지만 kafka의 성능이 압도적으로 좋다.

기본 개념

큐를 토픽으로 정의한다.
토픽 기준으로 메세지(데이터)를 관리한다.
Producer: 토픽 write
Consumer: 토픽 read

빠른 write 성능이 필요하다면 토픽을 쪼개서(파티셔닝 해서) write를 진행한다.
빠른 read 성능이 필요하다면 같은 토픽에 접근하는 Consumer끼리 그룹으로 묶어서 토픽(파티션)을 읽는다.

토픽: Foo, Bar (3개로 파티셔닝된 형태)
브로커: 하나의 브로커 안에 여러 토픽 가능 (위 그림은 3중화된 형태이다)
주키퍼: 브로커 당 하나씩 존재하며, 브로커의 상태를 관리한다.