2024-06-24

강대·2024년 6월 25일
post-thumbnail

안녕하세요
오늘은 프로젝트 마무리해야되는 날이에용 !!

저희는 마감시간까지 부리나케 수정하고 제출했습니다 !!
간략하게 제가 오늘 진행했던 것들 보여드릴게요







♾️ 프로젝트 마무리


Objective (목표)

  • 프로젝트 목표 : 스포티파이 데이터를 통해 클러스터링을 분류하고
    기준을 분석하여 음원 추천 시스템 구축
  • 예상 결과물: 플랫폼에 사용되는 추천 시스템 운영 방식을 학습하고,
    특징을 선발한 음원 간의 유사성을 파악

Necessary data (데이터)

Analytics (분석)

  • 분석 방법 : Isolation Forest 이상치 제거
    → StandardScaler 표준화 진행
    → PCA(n_components = 4)
    → KMEANS_optimal_k = 4

  • 데이터 처리 :

# 이상치 제거 (Isolation Forest)
clf = IsolationForest(random_state = 42).fit(sp_df_2)
pred = clf.predict(sp_df_2)
sp_df_2['anomaly'] = pred
outliers = sp_df_2.loc[sp_df_2['anomaly']==-1]
outlier_index=list(outliers.index)

df_if = sp_df_2[sp_df_2['anomaly']==1].copy()
df_if.drop(labels='anomaly',axis=1)

# 데이터 스케일링 (스탠다드)
from sklearn.preprocessing import StandardScaler
sd = StandardScaler()
df_if[cols] = sd.fit_transform(df_if[cols])
df_scaled = df_if[cols]
  • 시각화 계획 : 군집화 2차원 시각화, 실루엣 플롯 증명

Interpretation (해석)

  • 분석 결과 해석 : 클러스터 4개에 할당되는 음악적 특징 분석

  • 인사이트 도출 : 해당곡을 기준으로 할당되는 클러스터의 유사곡을 추천









이렇게 대망의 프로젝트 수정이 끝났습니다
화요일에 발표하고 피드백 받고 진짜 찐막일텐데요
다들 프로젝트 하느라 고생 많으셨습니다 🍀🍀🍀🍀

profile
걍 달려

0개의 댓글