TIL(2024-05-20)

JayJay Choi·2024년 5월 20일
0

TIL

목록 보기
29/61

프로젝트 D-day2 도움이 되고 싶다..

Today Goal

✅ SQL 코드카타 1문제풀기 & 오답⭕

✅ 기초 프로젝트 데이터 전처리 마무리하기 ⭕

✅ 파이썬 300제 130까지 풀기 ⭕

Today I Learn

💡SQL

✔1661. Average Time of Process per Machine
✅ 오답노트 쿼리문

💡Python 300제

✔따로 없음.

💡Python 코드카타

✔따로 없음.

💡기초 프로젝트

✔ 주말에 각자 맡은 컬럼들을 전처리해서 오기로 했음.
✔ 내가 맡은 컬럼은 ”Occupation”, “Monthly_Inhand_Salary” 였음



✔ 이렇듯. 둘다 group by를 해서 최빈값과 평균값을 추출하여 본문 안에 넣는 생각을 했었다. 하지만. Occupation 같은 경우, 문자열이며 범주형 데이터 이기때문에, 최빈값이 의미가 없다는 튜터님의 말이 있었다.

✔ 최빈값 같은 경우 숫자값만 이용이 가능하다고 하셨음.

✔ 팀원분께서 nan값을 최빈값으로 변환 할 수 있는 코드를 짜주심. Occupation같은 경우 nan값 보다는 언더바가 있어서. 그것을 먼저 변환 후 최빈값을 채워 넣었다.


✔ 그리고 Monthly_Inhand_Salary은 일단 먼저 nan값에 평균값을 변환을 시켰다. 그렇데 28개의 데이터가 nan값으로 나왔는데. 확인해보니, 4개월치 데이터에 아예 금액이 한번도 들어오지 않은 데이터가 7명이 있었다.

✔ 그 사람들의 값을 nan값이 아닌 0으로 변경하기로 하여 0으로 변경을 완료했다.

✔ 그리고 노션에 다른 팀원이 올려놓은 코드를 긁어서 실행하여 오늘 이쁜 데이터파일을 만들수 있었다.

✔ 더 오래 걸릴수 있었던 것들이 오늘 끝나서 좀 다들 기뻐했다.

How was it?

✔ 조금 더 도움이 되고 싶다.

✔ 데이터 전처리는.. 끝났지만 이제는 이것을 시각화하고 인사이트를 도출하는 것이 남았다.

✔ 이것저것 잘 생각해보자! 화이팅!

profile
차근차근 열심히 따라가보는 왕초보의 기록들!

0개의 댓글