플레이데이터 데이터 엔지니어링 28기 스터디 요약

유정·2023년 10월 31일

oujunginplaydata

목록 보기
5/7

2023 / 10 / 23 ~ 2023 / 10 / 30
일주일 준비한 EDA 및 머신러닝 프로젝트_1 완료!

아래는 내 발표 자료(3시간 만에 만듦):


































킹받게 지우지 않은 'MIRIWORKS COMPANY' ^^

목표와 찾고 싶은 자료가 정해져 있었기에 빨리 수월히 마무리할 수 있던 프로젝트였다.
다만, 중간에 불필요한 자료를 DROP하거나 합치는 과정에서
여러 데이터프레임을 사용하며, 중복되어 비효율적인 업무를 많이 한다거나
나중에 필요할 자료를 DROP시켜 또 다시 프레임을 카피해야 하는 일이 생겼었다.
보다 계획적이게 설계를 해야 할 것 같았다.

또, 이번엔 'KIOSK-GAS'라는 자료가 QUANTITY 세리는 데 있어서 단위가 달랐다.
1EA가 아니라 1L 단위라 다른 것보다 QUANTITY가 훨씬 컸다.
그럼 이걸 SCALING을 미리 해 두고 생각하는 건 어땠을까? 싶은 ...
혹은 아예 DROP 하는 것도 괜찮았을 것 같다.

이런 면에서 민철님처럼 엑셀을 훑어보면서 이상한 값들을 미리 찾아내면
이렇게 다 끝내고 나서 나처럼 무너지는 일이 없을 것 같다.

민환님의 발표를 듣고 나서는, 데이터만을 사용하기보다 해당 시대, 나라, 문화의 맥락을 발표와 함께 이용하면 좋을 것 같다고 생각했다.

어제 셋 다 느꼈지만 같은 자료에서도 주안점이 달랐다.
1달 넘게 봐 오면서도 각자 잘 하는 점이 다르다는 걸 느껴왔어서
좋은 영향을 줄 수 있을 것 같다!
(내가 아직 부족해서 많이 노력해야겠지만)
앞으로 1달에 두번씩 이런 발표 과제를 우리끼리 하기로 했다.
1번은 각자 데이터, 다른 1번은 공통 데이터를 갖고 분석해서 PT 형식으로 발표 예정이다.
(꼭 마지막까지 ^^)
추후 다른 분들도 함께 할 수 있길 ~~

내가 생각하던 데이터 애널리스트의 역할이 여기서 다 끝나버린 것 같아
지금 수업 듣는 딥러닝이 들어오지가 않는다....
아직 딥러닝을 배우지 않고도 머신러닝이 더 맞는다고 생각하는 나의 안일함.
제대로 해보지도 않았는데 어떻게 안 맞다는 걸 아느냐고
일단 꾸역꾸역 해 봐야겠당.
꿑.

profile
밋밋한 인생에 prettier 포맷팅

2개의 댓글

comment-user-thumbnail
2023년 11월 1일

항상 재밌게 보고 있어요~ 담에 또 열심히 준비해봅시다

답글 달기
comment-user-thumbnail
2023년 11월 3일

멋진 발표였습니다! 많이 배우고가요

답글 달기