- 이번에는 올림픽 메달 기록을 통해 데이터 전처리 및 분석 작업을 수행했다.
- 먼저 분석을 위한 데이터를 불러왔다
- 데이터의 정보로는 주최도시, 연도, 종목, 성별, 국가, 메달의 종류 등이 있다.
- 데이터의 info를 확인해보니 대체로 데이터의 타입이 오브젝트 형태로 존재하며, Null값은 존재하지 않았다.
- 먼저 데이터의 Nan값을 제거하고
- 분석을 위해 연도의 데이터를 int형태로 바꿔줬다.
- 그리고 연도별로 메달을 획드한 도시의 카운터를 구분했다.
- Medal_index에서 gold, Silver, Bronze로 구분하기 위해 sort_index를 두 번 사용했다.
- 특정 연도의 올림픽인 애틀란티 올림픽에서 국가별 메달집계를 만들고, 상위 10개 국가 데이터를 분류했다.
- 그리고 상위 10개 국가에서 집계한 메달을 금메달 은메달, 동메달 순으로 데이터프레임을 만들었다.