[데이터분석 데브코스] TIL Day 6 - Excel을 이용한 다양한 데이터 분석 실습 (1)

콩이·2024년 2월 26일

📍 데이터란 무엇인가

  • 데이터의 사전적 정의는 "이론을 세우는 데 기초가 되는 사실, 또는 바탕이 되는 자료"

  • 데이터 자체만으로는 큰 의미를 가지지 못함. 데이터를 통해 정보, 지식, 지혜를 얻어 새로운 아이디어를 얻을 수 있음.

  • 데이터는 정보를 도출해내기 위한 사실을 수집해놓은 자료라고 생각하면 됨.

    예시 1) 수능 성적표

    • 수험번호, 이름, 주민번호 ➡️ 데이터

    • 영어 표준 점수 141점은 단순 데이터. 하지만 이러한 데이터만으로는 의사결정을 하기가 어려움. 영어 표준 점수 141점은 영어 1등급 이러한 정보를 확인하게 되면 수준이 높은지 낮은지 지식을 쌓을 수도 있고, 다른 과목을 공부해야겠다와 같은 지혜도 얻을 수 있음.

    예시 2) 휴게소 주차장 현황

    • 대부분의 휴게소가 소형주차장을 위한 주차공간이 많음.

    • 매송 지역을 보면 대형 주차 공간이 많아지는 걸 볼 수 있음
      ➡️ 해당 지역에 택배/화물 관련 업무가 많을 것이다 유추 가능

    • 하남드림 휴게소를 보면 주차대수가 가장 높음.
      ➡️ 하남드림 휴게소가 가장 클 것이다 / 방문객이 제일 많을 것이다 등 유츄 가능

    우리가 얻은 정보가 맞는지 확인을 해보자.

    • 왼쪽 이미지는 뉴스포미에서 발표한 방문객 수인데, 하남드림 휴게소에 차량 수가 가장 많다는 것을 확인할 수 있음

    • 오른쪽은 화물차를 위한 쉼터 보유현황. 매송 휴게소에 이러한 시설이 잘 되어있는 걸 알 수 있음.

    • 결론 : 데이터를 통해 정보를 얻어냈고, 그 정보가 알맞음을 깨달을 수 있었음.

📍 실습

  • 공공 데이터 포털에 가서 원하는 데이터를 다운받고 그 데이터를 통해 얻을 수 있는 정보 나열하기

  • 공공 데이터 포털에 접속 및 로그인
    ➡️ 상단메뉴 데이터찾기 - 이슈 및 추천 데이터 접속 후 원하는 데이터 다운로드

  • 나는 공공 데이터 포털에 접속해서 "경찰청_범죄 발생 지역별 통계" 데이터 다운받아 실습 진행하였음.

0개의 댓글