정형 데이터 : 표의 형태로 고정된 스키마를 가지고 있음SQL 쿼리 사용고정된 스키마비정형 데이터 : 구조가 없는 데이터 및 이미지, 오디오구조가 없음고도의 전처리가 필요반정형 데이터 : 일부만 구조화된 정보(마크업, 태그)일부 구조화된 정보데이터 파싱 필요유연성실시간
Noise Data 식별Anomaly Data 식별 : 편향된 데이터누락 Data 식별입력 데이터의 특성중에서 가장 관련성이 높거나 유용한 특성을 선택 및 불필요한 특성을 제거하는 과정ANOVAChi-squared test피어슨 상관계수두 변수 간의 선형 관계의 강도와
머신러닝을 훈련시켜 예측이나 분류 등 작업을 수행하는 모델 생성회귀분류클러스터링생성형Batch Training : 전체 훈련데이터를 한번에 사용하여 모델을 학습online Training : 데이터를 작은 묶음으로 나누어 순차적으로 모델을 학습Transfer Lear
데이터 저장, 관리, 검색안정성 접근성 확장성 보장종류클라우드 스터리지분산 파일 시스템데이터 웨어하우스데이터 레이크데이터 처리, 분석, 모델 트레이닝성능, 유연성, 확장성GPU 활용종류클라우드 기반 컴퓨팅GPU/TPU서버리스 컴퓨팅컨테이너화된 컴퓨팅프로젝트별 독립적인