250210 TIL

수이·2025년 2월 10일
0

🟡 TIL

목록 보기
7/41

개인스터디

ADsP 자격증 챌린지 1주차

중요부분 ✅표시!

데이터의 이해

1) 데이터의 정의

데이터 = '정보(information)'
저장이나 처리에 효율적인 형태로 변환된 정보

  • 특성
    • 존재적 특성 : 있는 그대로의 객관적 사실
      ex) 국어 100점, 수학 90점
      • 정성적 데이터
        언어 · 문자
        ex) 설문조사, sns데이터
      • 정량적 데이터
        수치로 명확하게 표현 → 데이터의 양이 증가하더라도 관리가 용이
        수치 · 기호 · 도형
        ex) 41kg, 31세, 29cm
    • 당위적 특성 : 추론 · 예측 · 전망 · 추정을 위한 근거
      ex) 평균 95점

2) 데이터의 유형

  • 정형 데이터 · 비정형 데이터 · 반정형 데이터

    • 정형 데이터
      고정된 틀O / 연산O
      ex) CSV, 엑셀, 스프레드시트, 관계형 데이터베이스

    • 비정형 데이터
      고정된 틀X / 연산X
      ex) NoSQL, 영상, 음성

    • 반정형 데이터
      고정된 틀O / 연산X
      ex)HTML, JSON, XML

  • 암묵지와 형식지

    • 암묵지
      학습과 체험을 통해 개인에게 습득되어 있지만 겉으로 드러나지 않는 지식

    • 형식지
      형상화된 지식
      공유할 수 있는 지식

3) 데이터와 정보

  • DIKW 피라미드
    데이터에서 지혜를 얻어내는 과정을 계층구조로 설명

    • 데이터(Data) : 객관적인 사실
      ex) A 카페는 소금빵이 2,500원, B 카페는 4.000원에 판매

    • 정보(Information) : 데이터의 가공 및 처리와 데이터간 연관 관계 속에서 의미가 도출된 것 (단, 정보가 내포하는 의미는 유용하지 않을 수 있음)
      ex) A 카페의 소금빵이 더 저렴하다

    • 지식(Knowledge) : 데이터를 통해 도출된 다양한 정보를 구조화하여 유의미한 정보를 분류하고 개인적인 경험을 결합시켜 고유의 지식으로 내재화된 것
      ex) 상대적으로 저렴한 A 카페에서 소금빵을 사야겠다

    • 지혜(Wisdom) : 지식의 축적과 아이디어가 결합된 창의적 산물 (예측)
      ex) A 카페의 다른 상품들도 B 카페보다 저렴할 것이라고 판단

데이터베이스

1) 데이터베이스의 정의

  • 필요로 하는 정보를 체계적으로 수집/축적하여 제공하는 정보의 집합체
    +) DBMS
    이용자가 쉽게 데이터베이스를 구축하고 유지할 수 있도록 하는 소프트웨어

  • EU 「데이터베이스의 법적 보호에 관한 지침」
    체계적/조직적으로 정리되고 전자식 또는 기타 수단으로 개별적으로 접근할 수 있는 독립된 저작물, 데이터 또는 기타 소재의 수집물

  • 국내 「저작권법」
    소재를 체계적으로 배열 또는 구성한 편집물로서 개별적으로 그 소재에 접근하거나 그 소재를 검색할 수 있도록 한 것 (=법률적으로 데이터베이스를 기술 기반 저작물로 인정)

  • 종류

    • 관계형 데이터베이스(Relational Database)
      행과 열로 표현된 표형식으로 저장
      SQL(Structured Query Language)

    • 비관계형 데이터베이스(NoSQL)
      관계형 데이터베이스(Relational Database)가 아닌 다른 형태의 데이터베이스 관리 시스템
      비정형 데이터와 대용량의 데이터 분석 및 분산 처리에 용이

2) 데이터베이스의 특징

  • 일반적인 특징

    • 통합된 데이터 : 동일한 내용의 데이터가 중복되어 있지 않다는 것을 의미
    • 저장된 데이터 : 컴퓨터 기술을 바탕으로 컴퓨터가 접근할 수 있는 저장 매체에 저장되는 것을 의미
    • 공용 데이터 : 다수의 사용자가 다양한 목적으로 데이터를 이용한다는 것을 의미
    • 변화되는 데이터 : 데이터의 삽입, 삭제, 갱신으로 변화하면서도 항상 정확한 데이터 상태를 유지
  • 다양한 측면에서의 특징

    • 정보의 축적 및 전달 측면(기계)

      • 기계가독성 : 대량의 정보를 일정한 형식에 따라 컴퓨터 등의 정보처리기기가 읽고 쓸 수 있음
      • 검색가능성 : 다양한 방법으로 필요한 정보를 검색 가능
      • 원격조작성 : 정보통신망을 통해 원거리에서도 온라인 이용 가능
    • 정보 이용 측면(사용)
      다양한 정보를 신속하게 획득
      원하는 정보를 정확하고 경제적으로 찾아낼 수 있다

    • 정보 관리 측면(데이터 관리)
      일정한 질서와 구조에 따라 정리•저장•검색•관리할 수 있도록 하여 대량의 정보를 체계적으로 축적하고 새로운 내용 추가나 갱신이 용이

    • 정보기술 발전의 측면
      정보처리, 검색• 관리 소프트웨어, 관련 하드웨어, 정보 전송을 위한 네트워크 기술 등의 발전을 견인할 수 있다

    • 경제•산업적 측면
      다양한 정보를 필요에 따라 신속하게 제공하고 이용할 수 있는 인프라의 특성을 가지고 있어 경제, 산업, 사회 활동의 효율성을 제고하고 국민의 편의를 증진하는 수단으로서 의미를 가진다

3) 데이터베이스 활용

  • 기업내부 데이터베이스

    • OLTP(Online Transaction Processing) : 정보시스템 ✅
      데이터베이스의 데이터를 수시로 갱신하는 프로세싱
      데이터 갱신 위주
      ex) 주문이 들어올 경우 이를 처리하고(주문입력시스템), 재고를 업데이트(재고관리시스템)하는 데 사용

    • OLAP(Online Analytical Processing) : 분석 중심의 시스템✅
      데이터 조회 위주 → 모아둔 데이터에 초점
      ex) 복잡한 데이터를 분석하여 제품의 판매 추이, 구매 성향 파악 등을 프로세싱

  • 사회기반구조로서의 데이터베이스(어떤 부문이 있는지 ✅)

    • 물류부문
      '실시간 차량 추적’을 위한 종합물류정보망 구축
      CVO, EDI, VAN

    • 지리부문
      GIS 응용에 활용하는 4S 통합기술
      GIS, RS, GPS, LBS, SIM

    • 교통부문
      지능형교통시스템 ITS

    • 의료부문
      의료정보시스템

    • 교육부문
      NEIS (National Education Information System) 교육행정정보시스템

데일리퀘스트

SQL 문법을 연습해요 9 - 아프면 안됩니다! 항상 건강 챙기세요!


일기

  • ADSP 6-7주차✅ 1주차 복습✅
    R 부분에서 시간을 너무 많이 잡아먹을 것 같아 결국 스킵.
    통계 부분이 나오면서 조금 어려운 부분이 많지만 강사님이 외워야 할 부분만 집어주셔서 그 위주로 공부하려고 한다. 다 알면 좋겠지만 우선은 시험을 위한 공부니까 모르는 부분은 체크해두고 나중에 추가로 더 파보기!

    추가로, ADSP 시험이 얼마 안 남았으니 슬슬 기출문제집을 골라봐야겠다

  • 데이터 문해력 CHAPTER 1-2✅
    이번 주가 사전캠프 마지막 주라, 조원들이랑 하루에 2장씩 읽고 내일부터 팀스터디 하기로 했다. 종이책을 읽는 건 오랜만인데, 그냥 편하게 쭉쭉 읽고 있는 중🙄

  • SQL 걷기반 퀘스트 9✅
    걷기반 문제가 이젠 두 개밖에 안 남아서, 끝나는 대로 달리기반 문제를 풀어볼 예정!

오늘도 고생 많았다 나 자신🍀

0개의 댓글

관련 채용 정보