다수의 인원, 시스템 또는 프로그램이 사용할 목적으로 통합하여 관리되는 데이터의 집합
파일에 이름을 부여하고 저장이나 검색을 위해 논리적으로 그것들을 어디에 위치시켜야 하는지 등을 정의한 뒤 관리하는 데이터베이스 전 단계의 데이터 관리 방식
ISAM (Index Sequential Access Method)
자료 내용은 주 저장부, 자료 색인은 자료가 기록된 위치와 함께 색인부에 기록되는 시스템
VSAM (Virtual Storage Access Method)
대형 운영체제에서 사용되는 파일 관리 시스템
데이터를 상하 종속적인 관계로 계층화하여 관리하는 DBMS
데이터에 대한 접근 속도 빠름
변화하는 데이터 구조에 유연한 대응이 어려움
데이터의 구조를 네트워크 상의 망상 형태로 논리적으로 표현한 데이터 모델
설계가 복잡함
HDBMS보다 유연함
데이터를 저장하는 테이블의 일부를 다른 테이블과 상하 관계로 표시하며 상관관계를 정리하는 가장 보편화된 DBMS
유연성이 좋음
유지 관리가 용이함
DB 관리자들이 데이터베이스를 편리하고 쉽게 다룰 수 있도록 도와주는 도구
데이터 관리의 복잡성을 해결하는 동시에 데이터 추가, 변경, 검색, 삭제 및 백업, 복구, 보안 등의 기능을 지원하는 소프트웨어
특정 회사에서 유로로 판매하는 시스템으로 유지 보수와 지원이 원활함
오픈 소스 라이선스 정책을 준용하는 범위 내에서 사용이 자유로움
키 기반 Get/Put/Delete 제공, 메모리 기반에서 성능 우선 시스템 및 빅데이터 처리 가능
ex. Redis, DynamoDB
키 안에 (Column, Value) 조합으로 된 여러 개의 필드를 갖는 DBMS
ex. HBase, Cassandra
값의 데이터 타입이 문서인 DBMS
ex. MongoDB, Couchbase
시맨틱 웹과 온톨로지 분야에서 활용되는 그래프로 데이터를 표현하는 DBMS
ex. Neo4j, AllegroGraph
부적절한 자료가 입력되어 동일한 내용에 대하여 서로 다른 데이터가 저장되는 것을 허용하지 않는 성질
삽입, 삭제, 갱신, 생성 후에도 저장된 데이터가 변함없이 일정해야 하는 성질
장애가 발생한 경우 특정 상태로 복구되어야 하는 성질
불법적인 노출, 변경, 손실로부터 보호되어야 하는 성질
응답 시간, 저장 공간 활용 등이 최적화되어 사용자, 소프트웨어, 시스템 등의 요구 조건을 만족시켜야 하는 성질
업무 분석 결과로 도출된 엔티티와 엔티티 간의 관계를 도식화한 다이어그램
ERD로 도식화하기 전 각 개체를 사각형, 화살표, 마름모로 표기한 형태
사물 또는 사건
개체가 갖고 있는 요소 또는 성질
두 개체 간의 관계
─────
, ────<
, >───<
으로 표시데이터베이스 시스템에서 하나의 논리적 기능을 정상적으로 수행하기 위한 작업의 기본 단위
하나라도 실패할 경우 전체가 취소되어야 함
트랜잭션 실행 성공 후 항상 일관된 데이터베이스 상태를 보존해야 함
트랜잭션 실행 중 생성하는 연산의 중간 결과를 다른 트랜잭션이 접근 불가
성공적으로 완료된 트랜잭션의 결과는 영속적으로 데이터베이스에 저장
초기 상태, 트랜잭션이 실행 중일 때의 상태
마지막 명령문이 실행된 후의 상태
트랜잭션이 성공적으로 완료된 후의 상태
정상적인 실행이 더 이상 진행될 수 없는 상태
트랜잭션이 취소되고 데이터베이스가 트랜잭션 시작 전의 상태로 환원된 상태
트랜잭션 확정, 트랜잭션을 메모리에 영구적으로 저장
트랜잭션 취소, 트랜잭션 내역을 저장 무효화시킴
저장 시기 설정, Rollback을 위한 시점을 지정
시스템, 서비스, 조직 등에서 주어진 비용과 시간 내에 처리 가능한 데이터 범위를 넘어서는 수십 페타바이트 크기의 비정형 데이터
비정형/반정형 데이터 수집
내부 및 외부의 정제되지 않은 데이터를 확보하고 이를 통해 필요 정보를 추출하여 활용하기 위해 효과적으로 수집 및 전송하는 기술
ex. 척와, 플럼, 스크라이브
정형 데이터 수집
내부 및 외부의 정제된 대용량 데이터를 수집 및 전송하는 기술
ex. ETL, FTP, 스쿱, 하이호
분산 데이터 저장 및 처리
대용량 파일의 효과적인 분산 저장 및 분산 처리 기술
ex. HDFS, 맵 리듀스
분산 데이터베이스
HDFS의 컬럼 기반 데이터베이스로 실시간 랜덤 조회 및 업데이트가 가능
ex. HBase
데이터 저장에 고정된 테이블 스키마가 필요하지 않고 조인 연산을 사용할 수 없으며, 수평적으로 확장이 가능한 DBMS
대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내어 의사결정에 활용하는 기법
분류 규칙
과거 데이터로부터 특성을 찾아내어 분류 모형을 만들어 이를 토대로 새로운 레코드의 결과값을 예측하는 기법
연관 규칙
데이터 안에 존재하는 항목들 간의 종속관계를 찾아내는 기법
연속 규칙
연관 규칙에 시간 관련 정보가 포함된 형태의 기법
데이터 군집화
정보가 없는 상태에서 데이터를 분류하는 기법