[ADsp] 1-1. 데이터의 정의

Mini·2022년 8월 8일
0

ADsP

목록 보기
1/17
post-thumbnail

(1) 데이터(Data)의 정의

-> 연구나 조사 등의 바탕이 되는 재료 혹은 자료

  • 데이터 : 있는 그대로의 사실, 가공되지 않은 자료, 객관적인 사실
  • 정보 : 데이터로부터 얻은 것, 가공된 자료

(2) 데이터의 특성

  • 존재적 특성 - 데이터는 있는 그대로의 객관적 사실
  • 당위적 특성 - 데이터는 추론. 예측. 전망 . 추정을 위한 근거

(3) 데이터의 유형

  • 정성적 데이터 : 언어와 문자 / 기준이 명확하지 않음.

  • 정량적 데이터 : 수치, 도형, 기호 / 집합으로 표현할 수 있는 기준이 명확한 데이터

  • 정형 데이터

    • 고정된 틀, 연산 가능, 관계형 데이터베이스에 저장, 데이터 수집 관리 용이
    • CSV, 엑셀 스프레드 시트 등
  • 반정형 데이터

    • 고정된 형태는 있으나 연산이 불가 , 테이블보다는 파일 형태 로 저장, 가공을 거쳐 정형 데이터 형태로 바꿀 수 있음.
    • XML, JSON, 센서 데이터 등
  • 비정형 데이터

    • 고정된 틀 존재 x, 연산 불가, NO SQL에 저장
    • 소셜 데이터, 댓글, 영상, 음성 등

(4) 암묵지와 형식지

  • 암묵지
    • 겉으로 드러나지 않는 상태의 지식, 머릿속에 존재하는 지식
    • 개인에게 축적된 내면화 된 지식 => 조직의 지식으로 공통화
  • 형식지
    • 암묵지가 문서나 매뉴얼처럼 외부로 표출돼 여러 사람이 공유할 수 있는 지식
    • 언어, 숫자, 기호로 표출화된 지식 => 개인의 지식으로 연결화
  • 암묵지가 형식지로 변화하는 단계
    내면화 -> 표출화 -> 연결화 -> 공통화

(5) DIKW 피라미드 - 데이터에서 지혜를 얻는 과정

  • Data(데이터) : 사실

  • Information (정보) : 의미 부여

  • Knowoledge (지식) : 정보를 통해서 예측

  • Wisdom (지혜) : 아이디어

(6) 데이터 단위

byte -> KB -> MB -> GB -> TB -> PB -> EB -> ZB -> YB

(7) 변수의 종류

  • 범주형 : 몇 개의 범주로 나누어진 자료를 의미
    • 명목형 : 단순히 분류된 자료
      • 성별, 성공여부, 혈액형 등
      • 값이 달라짐에 따라 좋거나 나쁘다고 할 수 없는 경우
    • 순서형 : 개개의 값들이 이산적이며 그들 사이에 순서 관계가 존재하는 자료
      • 카테고리들이 순서가 있는 경우
      • 값이 커짐에 따라 만족도가 좋아지고 있다고 할 수 있는 경우
      • 만족도 조사, 병의 단계, 성적표
  • 수치형 : 이산형과 연속형으로 이루어진 자료를 의미
    • 이산형 : 이산적인 값을 갖는 데이터
      • 수치적인 의미를 갖고 있으나 소수점의 형태로 표현되지 못하는 데이터
      • 불량품 수, 사고 건수, 차량대수
    • 연속형 : 연속적인 값을 갖는 데이터
      • 수치적인 의미를 가지고 소수점으로 표현 가능
      • 측정할 수 있는 데이터
      • 몸무게, 시간, 길이

0개의 댓글