대용량 트래픽과 데이터 처리를 위해 공부할 내용

슬터디·2024년 3월 27일

[YOU] 기술분석

목록 보기

16/24

예상치 못한 트래픽 처리, MAU가 늘어난 대규모 서비스 등 E-commerce Business의 핵심은 트래픽과 데이터이다.

실제 비즈니스에서 발생한 예기치 못한 트래픽에 자유자재로 대응할 수 있는 능력을 키우려면, 각 단계에서 사용할 수 있는 처리 방법을 모두 알고 있어야 한다.

아키텍처 변경 및 개선
오토스케일링
- 서비스 불능 상황(서버 과부하, 장애 등) 발생 시, 자동으로 서버를 복제하여 서버 대수를 늘려주는 작업을 주는 AWS 서비스 (가용성)
- 회사의 서버를 일일이 업그레이드 할래? 서버 대수를 일일이 늘릴래? 아니면 클라우드 환경에서 자동으로 늘려지게 할래? -> Auto-Scaling
CDN(Content Delivery Network)
- 지리적 제약 없이, 전 세계 사용자에게 빠르고 안전하게 컨텐츠를 전송할 수 있는 기술
  
  우리나라에 있는 사람이 미국에 있는 서버로부터 이미지나 파일을 다운받으려고 한다면 시간이 오래 걸림. 서버를 분산시켜 캐싱해둠 → 사용자 요청이 들어옴 → 사용자와 가장 가까운 위치에 존재하는 서버로 매핑 → 캐싱된 내용을 내어줌 : 빠른 데이터 전송!
- Static Caching, Dynamic Caching
- 활용 사례
  - netflix: 동영상 스트리밍 전세계 제공 업체이므로, 최대한 지연 없이 빠르게 제공하기 위해서는 CDN 기술 필수
  - 온라인 게임의 정식 서비스 시작 시점에, 다운로드 트래픽이 크게 증가하게 되면, 병목 현상이 발생하거나 서버가 다운될 수 있으므로 CDN 활용

요즘 주목받는 아키텍처인 MSA가 적용된 시스템을 EDA가 보완할 수 있다

Event Driven Architecture란
- (보통 분산 아키텍처 환경에서) 이벤트를 생성[발행]하고, 발행된 이벤트를 수신자에게 전송하고, 수신자는 그 이벤트를 처리하는 방식
- 상호 간 결합도를 낮추기 위해 비동기 방식으로 메시지를 전달하는 패턴
- 주로 Message Broker(Kafka, RabbitMQ)와 결합하여 구성
  - Kafka와 Redis
사용 목적
- 이벤트 기간, 순식간에 몰리는 트래픽에도 안정적인 대용량 트래픽 처리를 위함.
- 서버가 다운되지 않게 확장성 높고 안정적인 백엔드 서버를 구축할 필요
  - 순간적으로 몰리는 요청을 캐시로 처리
  - 수많은 주문 처리를 Event-Driven 구조로 처리
  - 많은 정보가 대량으로 빠르게 생성+수정+조회될 수 있도록 DB 관리
장단점
- 분산 시스템 간 느슨한 결합도, 시스템 간 의존성 배제, 확장 및 탄력성 향상
- Message broker 의존성, 시스템 Flow 파악 어렵

데이터를 Cassandra에 저장하여 대용량 데이터의 빠른 Read/Write 환경에서 부하가 최소화 + 수평 확장에 용이하게 함
- NoSQL 비교

마이그레이션은 보통 기존 레거시 시스템을 신규로 교체하는 상황에서 발생
- 이때 기술스택이 다를 수 있음
- 또한 서비스 중단 없이 다수의 데이터를 마이그레이션해야 함
- 배치성 마이그레이션 || 점진적 마이그레이션
CDC