[AI Project] 손글씨, 와인 분류 / 유방암 여부 진단

yenaryu·2022년 1월 6일

project 머신러닝

DATA

목록 보기

2/14

사용한 데이터셋 : Scikit-learn toy datasets

load_digits : 손글씨 이미지 데이터
load_wine : 와인 데이터
load_breast_cancer : 유방암 데이터

프로젝트 진행 과정

1. 모듈 import

2. 데이터 준비 (메서드 지정)

3. 데이터 살펴보기

feature, label 데이터 지정
target names 출력
data describe

4. train, test 데이터 분리

X_train, X_test, y_train, y_test 생성

5. 모델 학습

Decision Tree
Random Forest
SVM
SGD Classifier
Logistic Regression

6. 모델 평가

구현한 프로젝트

PROJECT : load_digits/load_wine/load_breast_cancer

회고

Logistic Regression 실행 시 STOP: TOTAL NO. of ITERATIONS REACHED LIMIT. 오류 발생 (실행에 지장 x)

5가지 모델을 한번에 평가하는 코드를 구현하는 것에 실패 (각각 정확도 비교)

trian, test 데이터 분리시 random_state=7과, decision tree와 random forest 모델학습시 random_state=32의 랜덤 숫자 지정 의미가 궁금
랜덤의 값은 내가 임의적으로 적용해도 되는건지?(그렇게 된다면, 모든 사람들이 같은 데이터를 가지고 프로젝트를 진행해도 결괏값에 오차가 있을 것 같음)
random state이 "train데이터와 test데이터 분리시 적용되는 랜덤성"으로 알고있는데, 이론에 대한 명확한 정의 필요

📆 2022-01-06

yenaryu

이전 포스트

[AI Project] 손글씨, 와인 분류 / 유방암 여부 진단

DATA

프로젝트 진행 과정

구현한 프로젝트

회고

📆 2022-01-06

[AI Project] 가위바위보 분류기 만들기

0개의 댓글