어딜가! 아무데도 목가!!!!!! 의 목요일..

은4·2025년 4월 17일

T I L

목록 보기
33/42

제목 보고 피식 했쥬?

ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ

오늘은 우당탕탕데이.. 셀프파마하다가 아티클스터디할뻔.. 배려해주신 여러분들 감사합니다 완전히 잊고있었잖아~!!!!!!!!!!!!!

원래계획 : 파마를 말고 열처리하는데 30분걸리니까 그사이에 코드카타를 풀고 중화하면서 강의를 듣자 (아티클스터디 아예 생각도 못함)

근데 갑자기 보이스들려서 식겁 와

이러고 아티클스터디할뻔 아오

근데 펌잘됌ㅋㅋ

우당탕탕 스터디고*

오늘 아티클스터디 너무 유익그자체
5기선배들의 심화 프로젝트를 하나 선정해서 좋은 점과 아쉬운 점 도출해보자악
나는 10조의 스포티파이 음원 데이터를 활용한 재즈 플레이리스트 추천 프로세스 탐구 주제를 선정했당

1시간동안 발표들으면서 생각한 내요약..

  • 요약 : 스포티파이 음원 데이터를 활용한 재즈 플레이리스트 추천 프로세스 탐구

  • 주요 포인트 : 스포티파이 데이터의 다양한 음악 "특성"을 클러스팅하여 음악의 스타일, 인기, 트렌드 등의 패턴을 파악하고, 이를 통해 재즈 추천 플레이리스트를 제안

  • 인사이트: 재즈라는 분야는 종사자들도 특성으로 쉽게 구분할 수 없어 보통 시대로 구분하곤 한다. 10조는 특성으로 이상치제거를 시도하는 등 조금 아쉬운 시도를 한것이 가장 도드라졌다. 화이트노이즈와 오디오북을 거르는 것에서 그치지않고, 기준이 확실하지 않은 상태에서 이상치를 함부로 제거하면 좋지 않은 결과를 낼 수 있다고 느꼈다. 도메인 지식 매우매우 중요한듯………
    - 컬럼별 상관관계를 분석한 결과가 에너지틱하고 풀사운드에 가까울 수록 하드비밥 빅밴드 스윙인것. 캄하고 에너지 지수가 낮을수록 쿨재즈에 가깝다라고 분석한 것도 인상적이였다. 전처리를 통해 수치적으로 데이터를 정렬할 수 있다는게 직관적으로 와닿았다.

    • 10조의 발표를 보며 데이터를 전처리하는 과정이 매우 쉽지않을것이라 생각이들고 쉽게 구분지을 수 없는 뮤직 관련 도메인은 아이러니하게도 전혀 선택하고 싶지 않다고 생각했다..ㅋ

그후 갑자기 U진님의 본격 수학시간 갑자기 하게되서 나 기초수학 강의들음.......아놔 왤케 멍청해졌지

오늘참 다사다난하다


DRAGON우님의 4단케이크..가아닌 4단분수도 봄

머신러닝 세션 전부 정리하고 기출풀고 오늘 하루 끝함

  • 클러스터링 = 군집분석 클러스터링은 데이터분석에서 피쳐(컬럼) 유사성의 개념을 기반으로 전체데이터셋을 그룹으로 나누는 그룹핑 기법입니다. 각 그룹을 클러스터라고 합니다. 현업에서는 우리가 주로 보게 되는 kaggle dataset 과는 다르게, 방대한 DB가 구축되어 있습니다. 이러한 데이터 속에서 데이터분석가는 의미있는 특징(컬럼)을 찾고, 최적의 그룹 갯수를 찾아 그룹별 인사이트를 도출해내는 역할을 수행
    프로세스(Experiment)

실험시 고려되야 하는 사랑
• 한명의 고객에게 하나의 클러스터 매핑이 되었는지? (클러스터링시, UNIQUE ID 는 빼고 진행)
• 데이터 자체에 결측이 많지는 않은지?
• 데이터가 결측은 아니나, value가 0인 경우가 많은지?
• 데이터의 전반적인 분포는 어떠한지? 컬럼 간 상관계수는 어떠한지?
• 데이터가 불규칙한지?
• 컬럼이 가지는 개념적인 의미는 무엇인지?
• 컬럼값이 이진형인지?
• cluster 비중이 지나치게 편향되어 있는지?

profile
Piano에서 IT로

2개의 댓글

comment-user-thumbnail
2025년 4월 17일

아니 펌 직접하시는 거였어요? 개쩐다 그리고 덕분에 스포티파이 있는 거 알았어요!!!!! 잼겟당 ㅋ

1개의 답글