• dataset.feature_names
• dataset.target
• dataset.data[:2]* 2세트만 확인시
변수명= pd.DataFrame(data=dataset.data , columns=dataset.feature_names)
• cancer_df['target'] = dataset.target
• load로 시작하는 함수를 이용해 데이터를 불러올 수 있다.
• import sklearn.datasets
• sklearn.datasets.all* 언더바가 연달아 2개
# 사이킷런 데이터 불러오기
from sklearn.datasets import load_breast_cancer
dataset = load_breast_cancer()
dataset
# 피처 이름 확인
dataset.feature_names
# 타겟 확인
dataset.target
# 데이터 확인
dataset.data[:2]
# 데이터프레임으로 만들기
import pandas as pd
cancer_df = pd.DataFrame(data=dataset.data , columns=dataset.feature_names)
cancer_df
# 타겟 추가하기
cancer_df['target'] = dataset.target
cancer_df.head()
# 데이터셋 확인 (load_*)
import sklearn.datasets
sklearn.datasets.__all__
# 당뇨병 데이터 불러오기
from sklearn.datasets import load_diabetes
dataset = load_diabetes()
# 데이터프레임으로 만들기
import pandas as pd
diabetes_df = pd.DataFrame(data=dataset.data ,columns=dataset.feature_names )
diaabetes_df.head()
# 타겟 추가하기
diabetes_df['target'] = dataset.target