현실 세계에서 단순한 관찰이나 측정을 통해서 수집된 사실 또는 값이 어떤 기준에 의해 정리되어 있는 것.
즉, 숫자, 영상, 단어 등의 형태로 된 날것에 가깝다.
이러한 자료에 의미를 부여하거나 정리하면 정보(Information)가 된다.
ex) 우리나라 지역별로 매 시간 기온을 측정한 수치 자료는 데이터이지만, 이를 처리하고 분석하여 평년 기온을 구하거나, 일자별, 지역별 데이터를 정리해서 어떤 의사 결정에 사용한다면 정보가 된다.
여러 사람들이 공유하고 사용할 목적으로 통합 관리되는 데이터의 집합체 (데이터 창고)
공용 데이터 (Shared Data)
여러 사용자(응용 프로그램)가 공동으로 사용하는 것
통합 데이터 (Integrated Data)
여러 곳에서 사용하는 데이터를 한 곳에 모아 관리하는 것 (메모리 절약)
일반적으로 중복을 허용하지는 않지만, 검색의 효율성을 위해 최소한의 중복(통제된 중복)을 허용하여 통합한다.
저장 데이터 (Stored Data)
컴퓨터가 접근할 수 있는 디스크와 같은 저장 매체에 저장된 것
운영 데이터 (Operational Data)
조직의 운영에 기본적으로 반드시 필요한 데이터를 저장하는 것 (임시 데이터 제외)
동시 공용 (Concurrent Sharing)
여러 사용자나 응용 프로그램이 동시에 같은 내용의 데이터를 공유할 수 있다.
지속적인 변화 (Continuous Evolution)
데이터베이스에 저장된 데이터는 고정된 것이 아니며, 삽입/삭제/갱신 등을 통해 지속적으로 변화함으로써 최신의 정확한 데이터를 유지한다.
실시간 접근성 (Real-Time Accessibility)
컴퓨터가 접근할 수 있는 기록 매체에 저장되어 관리되므로, 언제든지 필요한 시점에 접근이 가능해야 한다.
즉, 사용자 질의에 대하여 실시간 처리와 응답이 가능해야 한다.
내용에 의한 참조 (Content Reference)
데이터가 저장된 주소나 위치가 아닌 데이터의 내용(값)에 의해 참조된다.
DBMS에 의한 관리
응용 프로그램과 데이터베이스는 독립되어 있으므로, 데이터베이스의 구축 및 관리를 위해서는 DBMS가 필요하다.
DBMS가 존재하기 이전에는 파일 시스템을 이용하여 데이터를 관리했다.
파일 시스템은 응용 프로그램를 이용해 데이터를 파일로 관리하는 것을 의미한다.
ex) 쇼핑몰의 경우 고객관리 프로그램과 주문관리 프로그램이 존재하여 각각 데이터를 파일로 저장해 관리한다
하지만 파일을 기반으로 데이터를 관리하면 데이터 중복, 불일치 등 문제가 발생한다. 이러한 파일 시스템의 단점을 보완하기 위해 나온 것이 데이터베이스이다.
데이터베이스는 응용 프로그램과는 다른 별도의 소프트웨어(미들웨어)로 관리하며, 이것을 DBMS 라고 한다.
DBMS는 파일 시스템의 문제점을 해결하기 위해 만들어졌기 때문에 DBMS의 특징이 곧 파일 시스템의 단점을 의미한다.
물리적 독립성
데이터 표현 방법이나 저장 위치가 변하는 등 데이터베이스의 물리적 구조조의 변화가 응용 프로그램이나 데이터베이스의 논리적 구조에 영향을 미치지 않는 것을 의미한다.
내부 스키마가 변경되어도 외부/개념 스키마가 영향을 받지 않음
논리적 독립성
하나의 논리적 구조를 가지고 많은 응용 프로그램이 요구하는 다양한 형태의 논리적 요구를 만족시킬 수 있는 것을 의미한다.
개념 스키마가 변경되어도 외부 스키마가 영향을 받지 않음
데이터의 유효성 검사를 통해 데이터의 정확성, 일관성, 유효성을 유지한다.
입력 조건에 맞지 않는 입력값은 저장할 수 없도록 방지
허가된 사용자들만 데이터베이스나 데이터베이스 내의 자원에 접근할 수 있도록 계정 관리 또는 접근 권한을 설정함으로써 데이터에 보안을 구현한다.
연관된 정보를 논리적인 구조로 관리함으로써 한 가지를 나타내는 두 개의 데이터 중에서 하나의 데이터만 변경했을 경우 발생할 수 있는 데이터의 불일치성을 배제한다.
또한, 작업 중 일부 데이터만 변경되어 나머지 데이터와 일치하지 않는 경우도 배제한다.
데이터를 통합 관리함으로써 데이터 중복 문제를 해결한다.
[참고]