구글 colab을 이용해서 아이리스(Iris)라는 꽃에 대한 분류를 해보겠다
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
!git clone https://github.com/taehojo/data.git
df = pd.read_csv('./data.iris3.csv')
sns.pairplot(df, hue='species');
plt.show()
위 코드는 Iris3.csv 라는 간단하게 파일을 시각화 해본 것이다.
원-핫 인코딩 (one-hot encoding)이란 "여러 개의 값으로 된 문자열을 0과 1로만 이루어진 형태로 만들어 주는 과정" 이라는 정의를 가지고 있다.
그럼 이제 한번 아이리스 데이터를 원-핫 인코딩 시켜보자
x = df.iloc[:,0:4]
y = df.iloc[:,4]
y = pd.get_dummies(y)
print(y[0:5])
위 코드는 아이리스 데이터를 원-핫 인코딩 시켜본 것이다
이제 모델을 한번 만들어 보자
model = Sequential()
model.add(Dense(12, input_dim = 4, activation = 'relu'))
model.add(Dense(8, activation = 'relu'))
model.add(Dense(3, activation = 'softmax'))
model.summary()
model.compile(loss='categorical_crossentropy', optimizer='adam',metrics=['accuracy'])
케라스 모듈을 가져오는 것을 잊지 말자
이와 같은 과정을 모두 해결하면 모델을 실행해서 해보자 화이팅