✔️ 공부하며 배운 것
✔️ 앞으로 To do List
✔️ 오늘 활용한 자료
데이터 과학자의 최소 70%에 포함되는 일은 데이터 준비하고 정리하고 노이즈 제거, 사용하기 좋게 다듬는 작업에 해당합니다.
자동차 판매가 어떤지 자가용이 늘었는지 확인 할 수 있는 데이터, 하지만 사람이 알아보기는 쉽지만 프로그램이 알아보기에는 어려울 수도 있다.
태블로에 가져오게 되면,
데이터를 온전히 가져오지 못해 추가 작업이 필요해보인다.
를 클릭하여 보면 태블로가 인식한 내용을 볼 수 있다.
원 데이터에서 합계 수식들을 지우면 좋다. 또한 비어있는 셀의 내용을 확인해주고 조정해준다. 그 후에 다시 Review the result를 선택하여 태블로가 인식한 결과를 확인해준다.
포맷을 우리가 원하는 연도별 행과 값에 대한 행이 있는 포맷으로 바꾸고 싶다.
사람인식 -> 기계인식
(엑셀에서 데이터 처리를 하지는 못하였다🥲 )
바꾸고자 하는 열들을 드래그하여 선택하고 피벗을 누르면 간단하게 작업이 완료된다.
(여기서 원래는 REGIONS 와COUNTRIES를 잘 처리하여 나뉘어 있어야한다.)
이름과 성을 분리하고 싶은 경우가 있을 수도 있고...!
위의 공간에서 데이터 열의 이름 변경 등 원하는 추가작업을 진행해 줄 수 있다.
다음주까지 진행하면 드디어 마무리된다! 그 이후에는 사용하고 싶었던 데이터로 직접 진행을 해보려고 한다. 데이터 피벗과 열 나누기 등 기능을 사용하기 위해서 무엇보다 원 데이터의 이해도가 높아야 한다는 생각이 들었다.
또한, Spotfire 와 비교하여(?) 아직까지는 대시보드가 조금 더 사용하기 불편하다는 생각이 들었다. 원 시트에 가서 크기를 조절해야해서 아쉽다.