Kafka

Log·2022년 9월 14일

data engineering kafka 실무로 배우는 빅데이터 기술

0

Kafka(Kafka cluster)

Partition / Offset

Message / Record

실무로 배우는 빅데이터 기술

목록 보기

2/6

문서 목적

해당 문서는 Kafka에 대해 대략적으로 설명한 문서이다.

Kafka

분산 이벤트 스트리밍 플랫폼
- Event streaming : DB, log, sensor, applicaion과 같은 이벤트 소스에서 이벤트 스트림의 형태로 실시간으로 데이터를 캡쳐하는 방식
- What is Stream Processing
기존에는 어플리케이션 끼리 메시지를 날리는 방식이었으나, Kafka는 kafka Cluster와 어플리케이션 끼리 메시지를 날리면서 교환하는 방식으로 기존보다 확장성이 높다

구성 요소

Zookeeper

아파치 프로젝트 애플리케이션
kafka의 metadata 관리 및 broker의 health check를 담당
https://bcho.tistory.com/1016

Kafka(Kafka cluster)

여러대의 broker를 구성한 클러스터

Broker

Kafka application이 설치된 서버 또는 노드
Kafka cluster는 여러 대의 Broker로 구성
각 broker는 고유한 id로 구분되며 특정 topic partition을 포함함
Replication factor
- https://www.popit.kr/kafka-운영자가-말하는-topic-replication/

Producer

Kafka로 메시지를 보내는 역할을 하는 클라이언트

Consumer

Kafka에서 메시지를 꺼내가는 역할을 하는 클라이언트
데이터는 각 partition내에서 순서대로 읽어온다
Consumer group
- https://www.popit.kr/kafka-consumer-group/

Topic

특정 스트림 데이터이며, kafka cluster에서 데이터를 관리할 시 기준이 됨
Similar to a table in a database (without all the constraints)
원하는 수만큼 topic 생성 가능
partition으로 나누어서 처리되며 각 partition은 순서가 존재
데이터 보존 주기 기본 7일(log.retention.hours)
특정 파티션에 데이터가 쓰여지면 절대 변경이 이루어지지 않음

Partition / Offset

Partition
- 각 topic 당 데이터를 분산 처리하는 단위
- topic안에 partition을 나누어 그 수대로 데이터를 분산처리 함
- replica의 수만큼 partition이 서버에 복제
Offset
- partition에서만 의미가 있는 순서로 partition내에서만 보장

Segment

Producer가 전송한 실제 메시지가 broker의 로컬 디스크에 저장되는 파일

Message / Record

Producer가 broker로 전송하거나 consumer가 읽어가는 데이터

Architecture

1대의 카프카 서버만 설치하고, 1개의 broker만 구성한 아키텍처로, 대량의 발행 / 소비 요건이 없고, 업무 도메인이 단순할 때 이용
kafka 서버 2개에 Broker를 구성
물리적인 카프카 서버는 1대이므로 대량의 발행/ 소비 여건에는 사용하기 어려우나, 업무 도메인이 복잡해서 메시지 처리를 분리 관리해야 할 때 이용

2대 이상의 kafka 서버로 멀티 브로커 생성
대규모 발행/소비 데이터 처리에 적합하며, 물리적으로 나눠진 브로커 간의 데이터 복제가 가능해 안정성 높음
업무 도메인별 메시지 그룹을 분류할 수 있어 복잡한 메시지 송/수신에 적합

활용

플럼이 데이터를 수집해서 카프카 토픽에 전송받은 데이터를 컨슈머로 가져오는 형식으로 사용할 예정

출처

열심히 정리하는 습관 기르기..

이전 포스트

Flume

다음 포스트

Hadoop

0개의 댓글

관련 채용 정보

서버 엔지니어 (비즈니스 트라이브)

퀸잇을 운영하는 라포랩스에서 서버 엔지니어를 찾습니다. Kotlin, Spring 등으로 비즈니스 성장을 이끄는 인프라를 개발하고, 임팩트 있는 도전의 주인공이 되어보세요!

브레이브모바일(숨고,Soomgo)

Back-end Engineer

종합 라이프스킬 플랫폼 숨고에서 백엔드 엔지니어를 모집합니다. Python을 활용해 안정적인 백엔드 시스템을 운영하며, 함께 성장하는 문화를 만들어갈 기회를 놓치지 마세요!

카테노이드

백엔드 개발자 (1년이상)

콜러스(Kollus)에서 안정적인 VTaaS 사업을 통해 다양한 기업에 최적의 비디오 솔루션을 제공하는 카테노이드에서 백엔드 개발자를 모집합니다. Go 언어 및 다양한 기술 스택을 활용하여 백엔드 모듈 개발에 기여하며, 유연한 근무 시간과 성장 지원 프로그램이 마련되어 있습니다.