[DevCourse] Day 6 - Excel을 활용한 데이터 분석 실습(1)

한상우·2023년 11월 27일
0

Data Science Devcourse

목록 보기
6/25
post-thumbnail

DIKW 피라미드

  • 데이터의 사전적 정의 : 이론을 세우는데 기초가 되는 사실, 또는 바탕이 되는 자료

    • 휴대폰 번호, 영화의 목록, 게임 아이템 등 여러가지의 데이터가 있다
  • 데이터 자체로는 큰 의미를 가지기 어렵다. 아래 DIKW 모형을 살펴보자

  • 데이터(Data) : 관찰, 측정을 통해서 수집된 사실이나 값, 수치, 문자 등 가공되지 않은 원본 데이터

    • 관련 시스템 : 데이터베이스, OLTP, CDC, ETL, 데이터 레이크
    • 예시 : 철수는 두 마트의 전단지를 받았다. A마트 전단지에는 달걀 3000원, 라면 700원, 우유 1350원이라고 적혀 있고, B마트 전단지에는 달걀 2700원, 라면 650원, 우유 1200원이라고 적혀 있다.
  • 정보(Information) : 사용자의 필요에 의해 정제 및 가공된 데이터, 사용자에게 필요한 데이터

    • 관련 시스템 : 데이터 웨어하우스, OLAP
    • 예시 : 철수는 라면을 사야한다. 이때, A 마트에서 산다면 700원, B마트에서 산다면 650원이 필요하다. 전단지(데이터)를 바탕으로 철수는 "B마트의 라면 가격이 더 저렴하다"는 정보를 얻을 수 있다.
  • 지식(Knowledge) : 정보를 일반화하고 체계화하여 바로 적용/활용할 수 있도록 만든 것. 서로 연결된 정보들의 패턴을 바탕으로 예측한 결과물.

    • 관련 시스템 : KMS, EKP
    • 예시 : 철수는 B마트의 라면 가격이 더 저렴하다는 정보를 바탕으로 "B마트에서 라면을 사는 것이 더 유리"할 것이라는 지혜를 얻는다.
  • 지혜(Wisdom) : 지식에 유연성을 더하고, 상황이나 맥락에 맞게 규칙을 적용하는 것. 즉, 근본원리에 대한 깊은 이해를 바탕으로 도출되는 창의적 아이디어.

    • 관련 시스템 : BI
    • 예시 : B마트의 달걀, 우유, 라면 가격이 더 저렴하므로 철수는 "B마트의 과자도 A마트보다 저렴할 것"이라고 예측할 수 있다.

실습 : 공공데이터포털에서 데이터 받아보기

  • 어떤 목적성을 가지고 데이터를 바라볼지가 가장 중요하다. 목적성을 기반으로 어떤 정보(Information)를 도출해 낼 수 있는지 살펴보자.

      1. 충전소의 분포 : 연도별 설치된 충전소의 개수(설치년도), 다른 지역에 걸쳐 있는 충전소의 분포(시/도, 군/구), 가장 일반적인 시설 유형에 대한 분포(시설구분)
      1. 공간 분석 : 충전소를 지도에 매핑하여 지도상 분포를 시각화하고, 어떤 지역에 집중되어있는지 확인(위도, 경도)
      1. 운영 기관 : 서로다른 운영기관들의 충전소 분포를 이해, 각 운영 기관과 관련된 충전소 유형을 분석 (운영기관, 시설구분)
      1. 충전기 유형 : 서로다른 충전기 유형의 개수를 계산하여 다양성을 이해, 특정 충전기 유형의 점유율을 계산(충전기타입)
      1. 시설 유형 분석 : 시설 유형에 기반한 충전소의 분포를 이해, 특정 지역에서 특정 시설 유형이 더 흔한지를 분석 (시설구분, 시/도, 군/구)
  • 위에서 제시한 것 이외에도, 다양한 목적성에 맞게 다양한 정보를 도출해 낼 수 있을것이다.

profile
개인 공부용 블로그입니다

0개의 댓글

관련 채용 정보