데이터 탐색

rokky·2023년 8월 9일
0

딥러닝

목록 보기
3/18

데이터 탐색

  1. data 형식이 뭐인가?
  • 데이터 범위, 차원, 기본적으로 확인
  • 모든 데이터가 동일한 형식인가?
  • 압축등 노이즈 유발 요인이 없는가?
  1. 데이터 수집 방식이 무엇인가?
  • 데이터 단위(cm, inch)
  • 데이터 편향 유발 요인
  1. 데이터 통계
  • 최대/최소 비롯한 통계량 확인
  • 산점도, 히스토그램 등 시각화를 통해 데이터 분포 확인

라이브러리

import xrarray as xr //  NetCDF-4 형식의 데이터를 불러올 수 있다. 또 numpy.ndarray 변환이 쉽다.
// 각 feature에 접근하고 이를 numpy.ndarray로 변환 -> load한 dataset feature.data 
import matplotlib.pyplot as plt // 데이터 시각화 라이브러리
//주피터 노트북 show() 이용하지 않고 그래프 출력 magic commend 
%matplotlib inline // 정적인 그래프 보여줌
%matplotlib notebook // 동적인 그래프 보여줌

0개의 댓글