박해선님의 『혼자 공부하는 머신러닝+딥러닝』(한빛미디어, 2020)를 2회독하며 시작하는 시리즈입니다.
K-최근접 이웃 알고리즘을 학습하기 위한 학습 데이터로 공시지가 데이터를 선정하였습니다.
RDB에 소스 데이터 업로드하여 분석에 사용할 데이터 준비하는 글입니다.
지난 [혼공머신] 2-2. RDB에 데이터 업로드하기에서 DB에 업로드한 공시지가 데이터 중 학습에 적합한 항목을 추출하여 학습용 데이터를 구축합니다.
『혼자 공부하는 머신러닝+딥러닝』(박해선, 2020)의 'Chapter 01-3. 마켓과 머신러닝'을 앞서 준비한 공시지가 데이터를 활용해 지역 분류 모델을 만들어 보았습니다.