오늘은 ,,, 하루죙일 약간 프로젝트를 시작해보았다. 오늘에서야 데이터셋을 좀 살펴봤다. 코랩 사용은 아직도 손에 익지 않아서 계속 해봐야 한다. 심지어 구글 드라이브가 용량이 다 차서 다른 계정으로 아예 크롬 로그인할 수 있게 만들어 놓았다.
코랩은 처음 시작할때마다 마운트를 해줘야 하고, 쓸 파일들이 그 드라이브에 있어야 한다. 그래서 파일들을 다 드라이브에 옮겨주고 그 파일 경로 설정해서 판다스 csv 해서 저장해준다음에야 파일을 쓸 수 있다.
농구 데이터는 생각보다 보기가 힘들었다. 결측치도 많았고, 노션에 명시되어 있는 테이블이랑 실제 테이블이랑도 달라서 좀 살펴보는데만 시간이 오래 걸린 것 같다. 그리고 판다스 라이브 세션 복습하면서 직접 코랩에다가 해본 것 같다. 라이브 세션 들은 것처럼 아나콘다로 옮겨야 하나 고민이다.
오늘 팀 프로젝트는 어떤 팀을 정해서 분석할지 정했다. 상위팀, 중간팀, 하위팀 여러가지 이야기가 나왔지만 결국 우리는 청춘드라마를 선택하기로 했다. 선택하고 나서 조 대신에 우리가 맡아서 분석할 팀 이름으로 바꿨는데 어느순간 우리조 모두가 이름을 바꿔놓아서 귀여워서 캡처해놓았다.
데이터 시각화.
절댓값, 절대치를 설명해줘야 하고 상대치도 같이 해줘야 함.
유관부서에게 떠먹여주는 연습을 해야한다. 실제로 현업에서 질문이 되게 많이 들어온다고 함.
Altair는 움직인다-문법적인 요소가 강함.
Seaborn은 통계차트 추가 지원.
pip install--- 로 설치 해야 함.
pygwalker-빠르게 EDA 가능.
팔레트는 구글링하면 엄청 많이 나옴. 거기서 보고 색상 지정하면 됨.
group by등으로 계산한 것은 무조건 인덱스 재정렬을 해줘야 함.(.reset_index())
파이썬은 다 영어로함. 한글쓰지 않기.
unstack. 인덱스 풀어주는 것. (.unstack(숫자))
피라미드 차트- 구간나누는거 뭔지 모르겠음.. ->복습하시오
입사하면 대부분 콘다 사용한다고 함.
지금은 코랩사용하지만 아나콘다로 갈아타야겠다.