DevCourse TIL Day5 Week8

김태준·2023년 5월 26일
0

Data Enginnering DevCourse

목록 보기
35/93
post-thumbnail

✅ BI Tool

KPI 지표나 중요한 데이터 포인트들을 시각화하여 데이터 기반 결정을 가능케 해주는 도구
EXCEL, Python-EDA, Tableau, Power BI 등등이 존재한다.
회사 인턴과 여러 데이터 분석 프로젝트들을 경험하며 대부분 tool들을 다루어보았고,

✅ Superset

  • 손쉬운 인터페이스, 대시보드 share 지원, SQLAlchemy와 연동
  • API와 플러그인 Architecture 제공으로 인한 확장성 좋음
  • Flask, React JS로 구성됨
  • default로 sqlite를 메타데이터 DB로 사용
  • Redis를 캐싱레이어로 사용하며 SQLAlchemy가 백엔드 DB 접근에 사용된다.

🎈 코호트 분석

코호트란?

  • 특정 Attribute를 바탕으로 나뉘는 사용자 그룹으로, 보통 MAU에선 month를 의미한다.
    -> 코호트 분석: 코호트 기반으로 사용자이탈률, 잔존률, 총 소비금액 등 지표 계산하는 기법

✅ Docker

특정 프로그램, 해당 프로그램을 실행하는 데 필요한 기타 SW들을 하나의 패키지로 만듬으로써 해당 프로그램의 개발과 사용을 도와주는 오픈소스 플랫폼

  • docker image : 이 패키지를 먼저 파일 시스템 형태로 만든 것으로 타인과 공유가능하며 docker image 공유소를 docker registry(Hub)라고 부른다.
  • docker image를 실행시킨 것을 docker container라 부르며 이 container 내에서 해당 프로그램이 실행된다. (단, 이때 docker engine이 먼저 실행해야 다양한 SW를 충돌없이 실행 가능)

✅ AWS Cloud special lesson

가상환경인 container 기반 Docker를 활용한 서비스 배포가 현 시점 주를 이루고 있다.
AWS에서는 이러한 container를 활용한 서비스가 상당히 많다.

  • ECR : container image 업로드
  • EC2 : IP, Network, Domain이 자동으로 할당되는 인스턴스 서비스
  • ECS : image를 바로 서비스화(컨테이너 개별) - 소규모
  • EKS : 쿠버네티스(컨테이너가 여러개일 경우 복잡하기에 중앙 집중으로 활용) - 대규모
    : etcd라 불리는 DB, Scheduler, API 서버 등 자동 control 및 설정되는 부분 多
    -> ECR 저장 후 pod로 이미지 옮겨 docker 실행

    k8s라고도 부르며, 다음과 같은 목적이 있다.
  • 서비스 디스커버리와 로드밸런싱
  • 자동화된 롤백, 롤아웃, 복구
  • 스토리지 오케스트레이션

🎈 Cloud 9

브라우저만으로 코드 작성, 실행, 디버깅이 가능한 클라우드 기반 IDE로 Develop machine이라고 보면 된다.
❗ CLI 작업을 위해 매번 region, ID, PW 입력하는 과정이 귀찮다면, 이를 Settings에서 미리 환경변수로 설정해둘 수 있다.

AWS CLI 사용하며 error 발생 시 해당 서비스 이동 후 IAM 정책(역할, 그룹, 권한) checking 하기

profile
To be a DataScientist

0개의 댓글