적은 데이터 수는 곧바로 분석 결과의 신뢰성 하락으로 연결많은 데이터를 통해 충분히 검증한 결과와 그렇지 않은 결과의 차이예외는 있다. 적은 데이터로도 문제 해결을 충분히 해낼 수 있기도 함 (양질의 데이터)표본이 모집단을 대표하지 못할 때표본: 어떤 사건이나 현상을
데이터 수가 뒷받침된다고 해서 모든 데이터를 활용할 수 있는 것은 아니다!분석 결과를 누구나 인정할 수 있도록 데이터 자체에 대한 신뢰성이 뒷받침되어야함확실한 값이 아닌 추정 값을 데이터로 적재하거나, 틀린 정보가 담겨있는 경우가 있을 수 있음1) 데이터 오류데이터가
Velocity(속도)Volume(양)Variety(다양성)활용하기 좋은 데이터들은 지키고 있는 공통의 형식이 분명 있다1) 관계형 데이터베이스의 정의데이터를 행과 열의 테이블 형태로 저장하여 서로 관계있는 데이터를 관리하는 방식2) 형식이 중요한 이유 하나의 데이터만
반정형 데이터: 구조 정보를 포함한 내용을 담고 있어 데이터라고 충분히 분류할 수 있는 데이터정형 데이터: 미리 정해놓은 형식과 구조가 있어 그에 따라 고정된 자리에 저장된 데이터행과 열의 형태로 담겨 엑셀로 저장할 수 있는 데이터가 정형 데이터숫자 형식으로 지정된 데
상황에 따라, 분석 목적에 따라 양질의 데이터는 변화함. 따라서 근본적이면서 좋은 방법은 상황에 맞는 데이터를 선택하는 것데이터 (Data), 정보(Information), 지식(Knowledge), 지혜(Wisdom)데이터가 정보로, 정보는 지식으로, 지식은 지혜로