1. 붓꽃(Iris) 품종 분류 머신러닝 모델 만들기 문제정의 데이터 준비하기 데이터 확인하기 데이터 셋을 훈련 및 테스트 데이터로 분리하기 머신러닝 모델 설정(k-최근접 이웃 알고리즘) 학습하기 예측하기 모델 평가하기 1) 문제정의 붓꽃의 품종을 분류하고 싶다 > 3개 품종 중 하나를 예측하는 다중 분류 문제로 정의 문제집 -> 데이터, 특성(feat...
1. KNeighborsClassifier 알고리즘 활용한 타이타닉 생존자 예측 1) 문제정의 KNeighborsClassifier 타이타닉 생존자(1), 사망자(0) 예측 2) 데이터 준비하기 3) 데이터 탐색 및 데이터 전처리 df.info()를 통해 데이터 구성과 형태를 확인한다. 독립변수(x)와 종속변수(y)가 하나의 df에 통합되어 있어 분리 추...
1. 선형분류모델 로지스틱 회귀 1) 선형 분류 모델의 C(규제) 설정에 따른 결정 경계 비교 선형분류 모델에는 두가지 방식이 있는데 하나는 로지스틱 회귀 하나는 Linear SVC 두 모델이 어떻게 결정 경계를 그리는지 확인하기 위해 아래와 같이 차트를 그려보고자 한다. 싸이킷 런에서 제공하는 분류함수를 임포트한다. 기본적으로 mglearn에서 제공...
3. 결정트리 분류모델 활용한 유방암 예측 0) 문제정의 DecisionTreenClassifier 사용하여 유방암 양성(2), 악성(4) 예측 1) 라이브러리 임포트 2) 데이터 준비하기 url을 변수에 담고 변수로 데이터 셋을 읽어 들인다. 'header = None'은 컬럼명이 없다는 뜻이고 판다스는 0부터 순서대로 header를 부여한다. 데이터...
1. 비지도 학습 K-Means 도매업 고객 군집 분석 1) 문제정의 도매업(clients of a wholesale distributor) 데이터 셋을 활용한 군집 분석 2) 데이터 준비하기 wholesale customers 데이터 셋 가져오기 clients of a wholesale distributor: 각 품목에 대한 연간 지출 출처: http...
이번 시간에는 기존의 머신러닝과 다르게 '스스로 학습할 수 있도록 만드는 신경망'인 딥러닝을 학습했고, 이를 이해하기 위해 OR게이트와 XOR게이트를 구현해봤다. 1.OR게이트 구현하기 1-1) 문제정의 OR 게이트 구현 [0,0] -> 0, [1,0] -> 1, [0,1] -> 1, [1,1] -> 1 즉, 둘 다 0이면 0 출력, 하나면 0이면 1 출...
다층 퍼셉트론 이진 분류 1. 피마족 인디언 당뇨병 발병 유무 예측 1) 문제정의 피마족 인디언 당뇨병 발병 유무를 예측하는 이진 분류 문제(당뇨병:1 , 정상:0) 2) 데이터 준비하기 3) 데이터 분리하기 4) 모델 구성하기 5) 모델 설정하기 6) 모델 학습하기 'batch_size = 128'의 의미는 모든 학습회차 동안 128개의 데이터를...
1. MNIST 다중분류 단층 퍼셉트론으로 해결할 수 없는 문제를 다층 퍼셉트론으로 구현한다. 다층 퍼셉트론은 여러 층의 레이어를 적정하게 쌓아 정확도를 높이는 것이 목표이다. 또한 이 데이터는 다중분류해야 하는 데이터임을 염두에 두자. 1) 문제 정의 0부터 9까지 손글씨로 쓰인 숫자를 예측하는 다중 분류 문제 2) MNIST 데이터 준비하기 이 학...
1. 보스턴 지역 주택가격 예측하기 1) 문제 정의 1970년대 보스턴 지역의 주택 가격을 예측하는 회귀(연속적인 수치 값) 문제 2) 데이터 준비하기 3) 데이터 확인하기 결과값: array([2.5199e-01, 0.0000e+00, 1.0590e+01, 0.0000e+00, 4.8900e-01, 5.7830e+00, 7.2700e+...
1. 타이타닉 생존자 분석 및 주인공의 생존 확률 예측 결과값: 4/4 - 0s 3ms/step - loss: 0.2065 - acc: 0.7333 acc: 73.33% 디카프리오 생존 예측: 10.09694958% 윈슬렛 생존 예측: 100.00000000% 1-1. 데이터 분석 및 시각화하기 ![](https:
1. 컨볼루션 신경망 모델 이용하여 Fashion_MNIST 다중 분류하기 1) 문제 정의 10가지 의류(0-9)를 예측하는 다중분류 문제 2) Fashion_MNIST 데이터 준비하기 3) 데이터 그려보기 4) 전처리 및 검증 데이터셋 만들기 결과값: (60000, 28, 28, 1) 컨볼루션 신경망은 3차원으로 받길 원함(기존 2차원 이미지 +...