(1) 데이터(Data)의 정의
-> 연구나 조사 등의 바탕이 되는 재료 혹은 자료
- 데이터 : 있는 그대로의 사실, 가공되지 않은 자료, 객관적인 사실
- 정보 : 데이터로부터 얻은 것, 가공된 자료
(2) 데이터의 특성
- 존재적 특성 - 데이터는 있는 그대로의 객관적 사실
- 당위적 특성 - 데이터는 추론. 예측. 전망 . 추정을 위한 근거
(3) 데이터의 유형
-
정성적 데이터 : 언어와 문자 / 기준이 명확하지 않음.
-
정량적 데이터 : 수치, 도형, 기호 / 집합으로 표현할 수 있는 기준이 명확한 데이터
-
정형 데이터
- 고정된 틀, 연산 가능, 관계형 데이터베이스에 저장, 데이터 수집 관리 용이
- CSV, 엑셀 스프레드 시트 등
-
반정형 데이터
- 고정된 형태는 있으나 연산이 불가 , 테이블보다는 파일 형태 로 저장, 가공을 거쳐 정형 데이터 형태로 바꿀 수 있음.
- XML, JSON, 센서 데이터 등
-
비정형 데이터
- 고정된 틀 존재 x, 연산 불가, NO SQL에 저장
- 소셜 데이터, 댓글, 영상, 음성 등
(4) 암묵지와 형식지
- 암묵지
- 겉으로 드러나지 않는 상태의 지식, 머릿속에 존재하는 지식
- 개인에게 축적된 내면화 된 지식 => 조직의 지식으로 공통화
- 형식지
- 암묵지가 문서나 매뉴얼처럼 외부로 표출돼 여러 사람이 공유할 수 있는 지식
- 언어, 숫자, 기호로 표출화된 지식 => 개인의 지식으로 연결화
- 암묵지가 형식지로 변화하는 단계
내면화 -> 표출화 -> 연결화 -> 공통화
(5) DIKW 피라미드 - 데이터에서 지혜를 얻는 과정
(6) 데이터 단위
byte -> KB -> MB -> GB -> TB -> PB -> EB -> ZB -> YB
(7) 변수의 종류
- 범주형 : 몇 개의 범주로 나누어진 자료를 의미
- 명목형 : 단순히 분류된 자료
- 성별, 성공여부, 혈액형 등
- 값이 달라짐에 따라 좋거나 나쁘다고 할 수 없는 경우
- 순서형 : 개개의 값들이 이산적이며 그들 사이에 순서 관계가 존재하는 자료
- 카테고리들이 순서가 있는 경우
- 값이 커짐에 따라 만족도가 좋아지고 있다고 할 수 있는 경우
- 만족도 조사, 병의 단계, 성적표
- 수치형 : 이산형과 연속형으로 이루어진 자료를 의미
- 이산형 : 이산적인 값을 갖는 데이터
- 수치적인 의미를 갖고 있으나 소수점의 형태로 표현되지 못하는 데이터
- 불량품 수, 사고 건수, 차량대수
- 연속형 : 연속적인 값을 갖는 데이터
- 수치적인 의미를 가지고 소수점으로 표현 가능
- 측정할 수 있는 데이터
- 몸무게, 시간, 길이