[데이터베이스] 기본 개념

상준·2023년 9월 6일
0

database

목록 보기
1/24

데이터의 필요성

데이터와 정보

데이터(data)

현실 세계에서 단순히 관찰하거나 측정하여 수집한 사실이나 값(value)
e.g.) 목장에서 방금 짠 원유

정보(information)

의사 결정에 유용하게 활용할 수 있도록 데이터를 처리한 결과물
e.g.) 가공 우유

정보 처리(information processing)
데이터에서 정보를 추출하는 과정 또는 방법

데이터의 분류

정형 데이터(structured data)

미리 정해진 구조에 따라 저장된 데이터
e.g.) excel의 스프레드 시트, 관계 데이터베이스의 테이블

반정형 데이터(semi-strucured data)

구조에 따라 저장된 데이터지만 데이터 내용 안에 구조에 대한 설명이 함께 존재
e.g.) HTML, XML, JSON 문서

비정형 데이터(unstrucutred data)

정해진 구조가 없이 저장된 데이터
e.g.) 영상, 이미지, PDF 와 같은 멀티미디어 데이터

특성에 따른 데이터 분류

  • 범주형 데이터(categorical data)
    범주로 구분할 수 있는 값, 즉 종류를 나타내는 값을 가진 데이터

    • 명목형 데이터(nominal data)
      순서, 즉 서열이 없는 값을 가지는 데이터
      e.g.) 성별, 혈액형, 학과명, 거주 지역, 음식메뉴
    • 순서형 데이터(ordinal data)
      순서, 즉 서열이 있는 값을 가지는 데이터
      e.g.) 학년, 학점, 회원 등급
  • 수치형 데이터(numerical data)

    • 이산형 데이터(discrete data)
      개수를 셀 수 있는 띄엄띄엄 단절된 숫자 값을 가지는 데이터
      e.g.) 고객수, 판매량, 합격자 수

    • 연속형 데이터(continuous data)
      측정을 통해 얻어지는 연속적으로 이어진 수자 값을 가지는 데이터
      e.g.) 키, 몸무게, 온도, 점수

정성적 데이터와 정량적 데이터

정성적 데이터(qualitative data)

  • 사람의 주관적인 생각과 평가를 기술한 비정형 데이터
  • 좁은 의미로는 범주형 데이터

정량적 데이터(quantitative data)

  • 객관적인 측정을 통해 수치나 도형, 기호 등으로 표현한 정형 데이터
  • 좁은 의미로는 수치형 데이터

정보 시스템과 데이터베이스

정보 시스템(information sysytem)

조직 운영에 필요한 데이터를 수집하여 저장해두었다가
필요할 때 유용한 정보를 만들어 주는 수단

데이터베이스(DB; DataBase)

  • 정보 시스템 안에서 데이터를 저장하고 있다가 필요할 때 제공하는 역할을 담당

  • 특정 조직의 여러 사용자가 '공유'하여 사용할 수 있도록 '통합'해서 '저장'한 '운영' 데이터의 집합

    데이터베이스의 정의

  • 공유 데이터(shared data)
    특정 조직의 여러 사용자가 함께 소유하고 이용할 수 있는 공용 데이터

  • 통합 데이터(integrated data)
    최소의 중복과 통제 가능한 중복만 허용하는 데이터

  • 저장 데이터(stored data)
    컴퓨터가 접근할 수 있는 매체에 저장된 데이터

  • 운영 데이터(operational data)
    조직의 주요 기능을 수행하기 위해 지속적으로 꼭 필요한 데이터

    데이터베이스의 특징

  • 실시간 접근성(real-time accessibility)
    사용자의 데이터 요구에 실시간으로 응답

  • 계속 변화(continuous evolution)
    데이터의 계속적인 삽입, 삭제, 수정을 통해 현재의 정확한 데이터를 유지

  • 내용 기반 참조(content reference)
    서로 다른 데이터의 동시 사용뿐만 아니라 같은 데이터의 동시 사용도 지원

  • 동시 공유(concurrent sharing)
    데이터가 저장된 주소나 위치가 아닌 내용으로 참조


    요약

    데이터와 정보

    • 데이터: 현실 세계에서 단순히 관찰하거나 측정하여 수집한 사실이나 값
    • 정보: 의사 결정에 융용하게 활용할 수 있도록 데이터를 처리한 결과물

    형태에 따른 데이터 분류

    • 정형 데이터: 미리 정해진 구조에 따라 저장된 데이터
    • 반정형 데이터: 내용 안에 구조에 대한 설명이 함께 존재하는 데이터
    • 비정형 데이터: 정해진 구조가 없이 저장된 데이터

    특성에 따른 데이터 분류

    • 범주형 데이터: 범주로 구분할 수 있는 값,
      종류를 나타내는 값을 가진 데이터
      • 명목형 데이터
        서열이 없는 값을 가지는 데이터, e.g.) 성별, 혈액형, 학과명, MBTI
      • 순서형 데이터
        서열이 있는 값을 가지는 데이터, e.g.) 학년, 학점, 회원 등급
    • 수치형 데이터: 크기 비교와 산술적인 연산이 가능한 숫자 값을 가진 데이터
      • 이산형 데이터
        단절된 숫자 값을 가지는 데이터, e.g.) 고객 수, 판매량, 합격자 수
      • 연속형 데이터
        연속적으로 이어진 숫자 값을 가지는 데이터, e.g.) 키, 몸무게, 온도

    정보 처리, 정보 시스템, 데이터베이스

    • 정보 처리: 데이터에서 정보를 추출하는 과정 또는 방법
    • 정보 시스템: 조직을 운영하기 위해 피룡한 데이터를 수집하여 저장해두었다가 필요할 때 유용한 정보를 만들어주는 수단
    • 데이터베이스: 정보 시스템 안에서 데이터를 저장하고 있다가 필요할 때 제공하는 역할을 함

    데이터베이스의 정의

    특정 조직의 여러 사용자가 공유해서 사용할 수 있도록 통합해서 저장한 운영 데이터의 집합
    • 여러 사용자가 함께 소유하고 사용할 수 있는 공유 데이터
    • 중복 최소화한 통합 데이터
    • 컴퓨터가 접근할 수 있는 매체에 들어 있는 저장 데이터
    • 조직의 주요기능을 수행하기 위해 반드시 필요한 운영 데이터

    데이터베이스의 특징

    • 실시간 접근이 가능
    • 동시 공유가 가능
    • 계속 변화
    • 내용으로 참조가 가능
profile
컴공생 공부

0개의 댓글