[머신러닝] 사이킷런 data실습

PurinYun·2023년 11월 23일
0

AIffel

목록 보기
21/75

1. 피처 이름 확인

• dataset.feature_names

2. 타겟 확인

• dataset.target

3. 데이터 확인

• dataset.data[:2]* 2세트만 확인시

4. 데이터 프레임 만들기

변수명= pd.DataFrame(data=dataset.data , columns=dataset.feature_names)

5. 타겟 추가

• cancer_df['target'] = dataset.target

6. 데이터셋 확인

• load로 시작하는 함수를 이용해 데이터를 불러올 수 있다.
• import sklearn.datasets
• sklearn.datasets.all*
언더바가 연달아 2개

1. 유방암 데이터

# 사이킷런 데이터 불러오기
from sklearn.datasets import load_breast_cancer
dataset = load_breast_cancer()
dataset

# 피처 이름 확인
dataset.feature_names

# 타겟 확인
dataset.target

# 데이터 확인
dataset.data[:2]

# 데이터프레임으로 만들기
import pandas as pd
cancer_df = pd.DataFrame(data=dataset.data , columns=dataset.feature_names)
cancer_df

# 타겟 추가하기
cancer_df['target'] = dataset.target
cancer_df.head()

# 데이터셋 확인 (load_*)
import sklearn.datasets
sklearn.datasets.__all__

2. 당뇨병 데이터

# 당뇨병 데이터 불러오기
from sklearn.datasets import load_diabetes
dataset = load_diabetes()


# 데이터프레임으로 만들기
import pandas as pd
diabetes_df = pd.DataFrame(data=dataset.data ,columns=dataset.feature_names )
diaabetes_df.head()

# 타겟 추가하기
diabetes_df['target'] = dataset.target
profile
Fantivation

0개의 댓글