좋은 알고리즘 + 나쁜 데이터 > 나쁜 결과
데이터의 깔끔한 정도도 코딩의 질을 결정하기도 한다.
좋은 데이터의 기준?
데이터 클리닝 과정도 알아야 함
완결성 : 필수적인 데이터는 모두 기록되어 있어야 함.
필수항목 + 선택항목에서 필수 항목이 빠지지 말아야 한다는 것.
결측값
: 채워져야 하는데 비어있는 값.
결국 결측값이 없어야 완결성 을 지닌다고 할 수 있음.
유일성 : 동일한 데이터가 불필요하게 중복되어 있으면 안됨
통일성: 데이터가 동일한 형식으로 저장되어 있어야 함. (uniformity)
통일성 예시
정확성: 데이터가 정확해야 함. Accuracy
정확성 예시