Day76

김재현·2023년 9월 8일

JUPYTER/DL/ML

목록 보기
49/73

분석순서

실무에서는 QGIS를 사용해 지도 데이터를 시각화.

행을 추출하기 위해서 before = df[df['독립변수'] == 0] 또는 defore = df.query('독립변수 == 0')를 사용.

종속변수가 없으므로 파생변수를 생성해 종속변수화를 유도할 수 있음.

데이터는 스케일링 이후에는 numpy 배열 형태로 변환됨을 유의.


소프트맥스(다항분류)

분류분석과 군집분석

분류분석 - 종속변수 존재

군집분석 - 종속변수 전무

다항분류에서 산점도 행렬을 통한 상관관계가 아닌 그룹별로 나누어지는 특성이 있는지를 확인 -> 군집화 가능 여부 확인

소프트맥스(mnist데이터셋)

  • MNIST는 인공지능 연구의 권위자 LeCun교수가 만든 데이터 셋.
  • 딥러닝을 공부할 때 반드시 거쳐야할 Hello, World같은 존재.
  • MNIST는 60,000개의 트레이닝 셋과 10,000개의 테스트 셋으로 이루어져 있고 이중 트레이닝 셋을 학습데이터로 사용하고 테스트 셋을 신경망을 검증하는 데에 사용.
  • 레이블(종속변수)에 대한 one-hot-encoding(더미변수화)

이미지 정규화

  • 각 픽셀의 색상값은 0~255 사이의 값을 갖는다.
  • 그러므로 색상값을 255로 나누면 0~1 사이의 범위를 갖도록 데이터 정규화가 수행.

    MinMax 스케일을 하되 import 대신 범위가 0~255이므로 (/255)실행

0개의 댓글