프로젝트 D-day2 도움이 되고 싶다..
✅ SQL 코드카타 1문제풀기 & 오답⭕
✅ 기초 프로젝트 데이터 전처리 마무리하기 ⭕
✅ 파이썬 300제 130까지 풀기 ⭕
✔1661. Average Time of Process per Machine
✅ 오답노트 쿼리문
✔따로 없음.
✔따로 없음.
✔ 주말에 각자 맡은 컬럼들을 전처리해서 오기로 했음.
✔ 내가 맡은 컬럼은 ”Occupation”, “Monthly_Inhand_Salary” 였음
✔ 이렇듯. 둘다 group by를 해서 최빈값과 평균값을 추출하여 본문 안에 넣는 생각을 했었다. 하지만. Occupation 같은 경우, 문자열이며 범주형 데이터 이기때문에, 최빈값이 의미가 없다는 튜터님의 말이 있었다.
✔ 최빈값 같은 경우 숫자값만 이용이 가능하다고 하셨음.
✔ 팀원분께서 nan값을 최빈값으로 변환 할 수 있는 코드를 짜주심. Occupation같은 경우 nan값 보다는 언더바가 있어서. 그것을 먼저 변환 후 최빈값을 채워 넣었다.
✔ 그리고 Monthly_Inhand_Salary은 일단 먼저 nan값에 평균값을 변환을 시켰다. 그렇데 28개의 데이터가 nan값으로 나왔는데. 확인해보니, 4개월치 데이터에 아예 금액이 한번도 들어오지 않은 데이터가 7명이 있었다.
✔ 그 사람들의 값을 nan값이 아닌 0으로 변경하기로 하여 0으로 변경을 완료했다.
✔ 그리고 노션에 다른 팀원이 올려놓은 코드를 긁어서 실행하여 오늘 이쁜 데이터파일을 만들수 있었다.
✔ 더 오래 걸릴수 있었던 것들이 오늘 끝나서 좀 다들 기뻐했다.
✔ 조금 더 도움이 되고 싶다.
✔ 데이터 전처리는.. 끝났지만 이제는 이것을 시각화하고 인사이트를 도출하는 것이 남았다.
✔ 이것저것 잘 생각해보자! 화이팅!