데이터의 분류
데이터는 구조화된 형태에 따라 정형데이터, 반정형 데이터, 비정형 데이터로 분류할 수 있다.
형태에 따른 분류
- 정형 데이터: 정형데이터는 구조화된 데이터, 즉 미리 정해진 구조에 따라 저장된 데이터이다. 엑셀의 스프레드시트, 관계 데이터베이스 테이블이 대표적인예
- 반정형 데이터: 구조에 따라 저장된 데이터이지만 데이터 내용안에 구조에 대한 설명이 함께 존재한다. 따라서 데이터 내용에 대한 설명, 즉 구조를 파악하는 파싱 과정이 필요하고 보통 파일 형태로 저장된다. HTML, XML, JSON이 이것에 속한다
- 비정형 데이터: 정해진 구조가 없이 저장된 데이터이다.
특성에 따른 분류
-
범주형 데이터: 범주형데이터는 범주로 구분할 수 있는 값, 즉 종류를 나타내는 값을 가진 데이터를 의미한다 (예시: 성별, 학년)
범주형 데이터는 명목형데이터와 순서형 데이터로 다시 세분화 할 수 있다.
- 명목형 데이터: 순서, 즉 서열이 없는데이터(성별, 혈액형, 학과명, 거주 지역, 음식 메뉴, MBTI 검사 결과)
- 순서형 데이터: 순서, 즉 서열이 있는 값을 가지는 데이터(학년, 학점, 회원 등급)
-
수치형 데이터: 수치형 데이터는 양적 측면에서 크기 비교와 산술적인 연산이 가능한 숫자 값을 가진 데이터이다(양적 데이터라고도 한다)
키, 몸무게, 고객 수 가 그 예이다. 이산형 데이터와 연속형 데이터로 세분화 할 수 있다
- 이산형 데이터: 개수를 셀 수 있는 띄엄띄엄 단절된 숫자 값을 가지는 데이터(고객 수, 판매량, 합격자 수)
- 연속형 데이터: 측정을 통해 얻어지는 연속적으로 이어진 숫자 값을 가지는 데이터(키, 몸무게, 온도, 점수)
데이터베이스 관리 시스템(DBMS: DataBase Management System)
- 데이터베이스 관리 시스템(DBMS)은 파일 시스템의 데이터 중복과 데이터 종속 문제를 해결하기 위해 제시된 소프트웨어다.
- 조직에 필요한 데이터를 데이터베이스에 통합하여 저장하고 관리한다.

DBMS 주요 기능
- 정의기능: 데이터 베이스 구조를 정의하거나 수정할 수 있다
- 조작기능: 데이터를 삽입, 삭제, 수정, 검색하는 연산을 할 수 있다
- 제어기능: 데이터를 항상 정확하고 안전하게 유지할 수 있다
RDBMS(관계형 데이터베이스 관리 시스템)
- 데이터 베이스를 테이블 형태로 구성한다
- 오라클, MS SQL서버, 액세스 등
데이터베이스 시스템(DBS: DataBase System)
- 데이터베이스에 데이터를저장하고, 저장된 데이터를 관리하여 조직에 필요한 정보를 생성해주는 시스템이다.
1. 스키마(schema)
- 스키마는 데이터베이스에 저장되는 데이터 구조와 제약조건을 정의한 것이다
2. 인스턴스(instance)
- 스키마에 따라 데이터베이스에 실제로 저장된 값이다
3. 3단계 데이터베이스 구조