안녕하세요. 이번 DBA신입으로 입사하게 되어 OJT를 진행 중입니다.
스터디 교재로 사용하는 데이터베이스 개론을 공부하면서 데이터베이스에 관련된 내용을 정리하면서 포스팅을 해보려고 합니다.
데이터와 정보의 차이
- 데이터는 단순히 측정하여 수집한 사실이나 값 (자료라고도 함)
- 정보는 의사 결정에 유용하게 활용할 수 있도록 데이터들을 처리해서 만든 유의미한 결과물
ex) 원유 - 데이터, 팩우유 - 정보 둘의 차이점은 가공의 유무!
정보 처리
데이터를 상황에 맞게 분석하거나 해석하여 데이터 간의 의미 관계를 파악하는 것
데이터베이스의 정의
특정 조직의 여러 사용자들이 공유하여 사용할 수 있도록 통합해서 저장한 운영데이터의 집합
- 공유데이터(shared data)
특정 조직의 여러 사용자들이 함께 소유하고 이용할 수 있어야함
- 통합데이터(integrated data)
데이터의 중복을 최소화하고 통제가 가능한 중복만 허용
- 저장데이터(stored data)
데이터 처리는 컴퓨터가 하기에 데이터를 컴퓨터가 접근 할 수 있는 매체에 저장해야함
- 운영데이터(operational data)
조직을 운영하고 주요 기능을 수행하기 위해 꼭 필요하며, 지속적으로 유지해야 하는 데이터
데이터베이스의 특징
- 실시간 접근성(real-time accessibillity)
사용자가 요구하면 원하는 데이터를 빠른 시간(수초이내) 내에 제공
- 계속 변화(continuous evolution)
현실 세계의 상태를 정확히 반영(동적인 특징이 존재 - 삽입, 삭제, 수정하여 정확한 데이터 유지)
- 동시 공유(concurrent sharing)
여러 사용자가 서로 다른 데이터를 동시 사용 및 같은 데이터를 동시 사용하는 것을 지원
- 내용 기반 참조(content reference)
주소나 위치가 아닌 값으로 참조 가능 ex) 데이터 검색
데이터의 분류
일반적으로 데이터는 형태에 따라 정형, 반정형, 비정형으로 분류할 수 있다.
- 정형 데이터 - 미리 정해진 구조에 따라 저장된 데이터
ex) excel의 스프레드시트, RDBMS의 테이블
- 반정형 데이터 - 구조에 따라 저장된 데이터지만 데이터 내용 안에 구조에 대한 설명이 존재
ex) html, xml, json 문서들, 웹 로그
- 비정형 데이터 - 정해진 구조가 없이 저장된 데이터
ex) 텍스트, 영상, 이미지, pdf
최근 스마트 기기의 활성화로 실시간으로 많은 양의 비정형 데이터가 생산 중
출처 - 김연희저자의 데이터베이스 개론 2판 - 한빛 아카데미