데이터의 기본 개념

수현·2024년 1월 8일
0

Data Literacy

목록 보기
1/4
post-thumbnail

데이터란?

  • 데이터는 라틴어 'datum'에서 유래한 것으로 '사실'을 의미한다. 데이터는 디지털 시대에 매우 중요한 가치를 가진다. 데이터에는 구조화된 데이터와 비구조화된 데이터의 두 가지 주요 형식이 있다.

구조화된 데이터 vs 비구조화된 데이터

  • 구조화된 데이터:

    • 표 형식으로 관리가 쉽고, 각 열에 동일한 유형의 데이터가 채워진다.
    • 엑셀이나 구글 시트에서 사용되는 형식
    • 예: 고객 정보, 재무 거래 등
  • 비구조화된 데이터:

    • 조직되지 않은 형태로, 특정 형식이나 사전 정의된 구조가 없다.
    • 텍스트, 이미지, 오디오, 비디오 등의 형식
    • 예: 보고서나 이메일, CCTV 영상 등

정량적 데이터 vs 정성적 데이터

  • 정량적 데이터:

    • 수치로 표현할 수 있는 숫자데이터
    • 예: 사람의 키, 방의 온도
  • 정성적 데이터:

    • 카테고리로 그룹화할 수 있는 범주형 데이터
    • 예: 사용하는 언어, 좋아하는 휴가지

데이터 컨텍스트

데이터 분석에서 '데이터 컨텍스트'는 데이터가 어떤 상황에서 수집되었는지, 어떤 조건이나 변수가 관련되어 있는지, 그리고 데이터가 어떻게 해석되어야 하는지를 설명한다. 이는 데이터의 정확한 이해와 분석을 위해 중요하다.

  • 출처: 데이터의 출처와 수집 방법
  • 품질: 데이터의 정확성, 신뢰성, 일관성
  • 관계: 데이터 간의 상호작용과 연관성
  • 시간적 맥락: 데이터 수집 시점과 시간에 따른 변화
  • 사용 방법: 데이터 처리 및 분석 방법에 대한 지침
profile
데이터 분석 공부중:)

0개의 댓글