SQL 중요성
데이터 관련 직군
- 데이터 엔지니어
- 파이썬, 자바/스칼라, sql, 데이터베이스, etl/elt, spark, hadoop
- 데이터 분석가
- sql, 비즈니스 도메인 지식, 통계(AB 테스트 분석)
- 데이터 과학자
배움
- 버티는 힘
- 어느 정도는 즐겨야 하고, 포기하지 마라, 적어도 3개월간 8시간 정도 해보자
- 내가 뭘 모르는 지 생각 해보기
- 잘 하는 사람보다 기죽지 않기
- 질문 잘 하기
- 대충 알거나 모르면서 안 물어보는 게 더 문제
- 어제의 나와 비교
관계형 데이터 베이스
- 구조화된 데이터를 저장하고 질의할 수 있도록 해주는 스토리지
- 엑셀 스프레드 시트 형태의 테이블로 데이터를 정의하고 저장
- 테이블에는 컬럼(열)과 레코드(행)이 존재
- DDL, DML
프로덕션 데이터 베이스(OLTP)
- 빠른 속도, 서비스에 필요한 정보 저장
- MySQL, PostgrSQL, Oracle..
데이터 웨어하우스(OLAP)
- 처리 데이터 크기에 집중
- 데이터 분석 혹은 모델 빌딩을 위한 데이터 저장
- Redshift, Snowflake
Q. 프로덕션 데이터 베이스만 있다면?
A. 서비스와 연관되어 있기 때문에, 무거운 쿼리를 날리면 느려짐
구조
- 가장 밑단에는 테이블들이 존재
- 테이블들은 데이터베이스(스키마)라는 폴더 밑으로 구성
ex) raw_data -- patient, patientData, patientProfile..
analytics -- patientSummary, vitalSummary...