SQL_Analysis

넘어산·2024년 1월 10일
0

TIL

목록 보기
26/37

SQL 중요성

데이터 관련 직군

  1. 데이터 엔지니어
  • 파이썬, 자바/스칼라, sql, 데이터베이스, etl/elt, spark, hadoop
  1. 데이터 분석가
  • sql, 비즈니스 도메인 지식, 통계(AB 테스트 분석)
  1. 데이터 과학자
  • 머신러닝, sql, 파이썬, 통계

배움

  1. 버티는 힘
    • 어느 정도는 즐겨야 하고, 포기하지 마라, 적어도 3개월간 8시간 정도 해보자
  2. 내가 뭘 모르는 지 생각 해보기
    • 어디서 막혔는 지
  3. 잘 하는 사람보다 기죽지 않기
    • 나보다 더 많은 시간을 투입했기 때문에
  4. 질문 잘 하기
    • 대충 알거나 모르면서 안 물어보는 게 더 문제
    • 어제의 나와 비교

관계형 데이터 베이스

  • 구조화된 데이터를 저장하고 질의할 수 있도록 해주는 스토리지
  • 엑셀 스프레드 시트 형태의 테이블로 데이터를 정의하고 저장
  • 테이블에는 컬럼(열)과 레코드(행)이 존재
  • DDL, DML

프로덕션 데이터 베이스(OLTP)

  • 빠른 속도, 서비스에 필요한 정보 저장
  • MySQL, PostgrSQL, Oracle..

데이터 웨어하우스(OLAP)

  • 처리 데이터 크기에 집중
  • 데이터 분석 혹은 모델 빌딩을 위한 데이터 저장
  • Redshift, Snowflake

Q. 프로덕션 데이터 베이스만 있다면?
A. 서비스와 연관되어 있기 때문에, 무거운 쿼리를 날리면 느려짐

구조

  • 가장 밑단에는 테이블들이 존재
  • 테이블들은 데이터베이스(스키마)라는 폴더 밑으로 구성
    ex) raw_data -- patient, patientData, patientProfile..
    analytics -- patientSummary, vitalSummary...

0개의 댓글