
안녕하세요
오늘은 프로젝트 마무리해야되는 날이에용 !!
저희는 마감시간까지 부리나케 수정하고 제출했습니다 !!
간략하게 제가 오늘 진행했던 것들 보여드릴게요

Objective (목표)

Necessary data (데이터)

Analytics (분석)
분석 방법 : Isolation Forest 이상치 제거
→ StandardScaler 표준화 진행
→ PCA(n_components = 4)
→ KMEANS_optimal_k = 4
데이터 처리 :
# 이상치 제거 (Isolation Forest)
clf = IsolationForest(random_state = 42).fit(sp_df_2)
pred = clf.predict(sp_df_2)
sp_df_2['anomaly'] = pred
outliers = sp_df_2.loc[sp_df_2['anomaly']==-1]
outlier_index=list(outliers.index)
df_if = sp_df_2[sp_df_2['anomaly']==1].copy()
df_if.drop(labels='anomaly',axis=1)
# 데이터 스케일링 (스탠다드)
from sklearn.preprocessing import StandardScaler
sd = StandardScaler()
df_if[cols] = sd.fit_transform(df_if[cols])
df_scaled = df_if[cols]

Interpretation (해석)

이렇게 대망의 프로젝트 수정이 끝났습니다
화요일에 발표하고 피드백 받고 진짜 찐막일텐데요
다들 프로젝트 하느라 고생 많으셨습니다 🍀🍀🍀🍀