정보처리기사(데이터 입·출력 구현)

조영문·2023년 4월 5일

정보처리기사 정처기

정보처리기사

목록 보기

2/17

1) 데이터 전환

운영 중인 기본 정보 시스템에서 데이터를 추출하여 새로 개발할 정보 시스템에서 운영할 수 있도록 변환한 후, 적재하는 일련의 과정(= 데이터 이행 / 데이터 이관)

2) 데이터베이스 개요

데이터저장소

논리 데이터저장소

데이터 및 데이터 간의 연관성, 제약 조건을 식별하여 논리적인 구조로 조직화한 것

물리 데이터저장소

논리 데이터저장소를 소프트웨어가 운용될 환경의 물리적 특성을 고려하여 실제 저장장치에 저장하는 것

데이터베이스(Database)

여러 사람에 의해 공동으로 사용될 데이터를 중복을 배제하여 통합하고, 쉽게 접근하여 처리할 수 있도록 저장장치에 저장하여 항상 사용할 수 있도록 운영하는 운영 데이터
- 통합된 데이터(Integrated Data) : 자료의 중복을 배제한 데이터의 모임
- 저장된 데이터(Stored Data) : 컴퓨터가 접근할 수 있는 저장 매체에 저장된 자료
- 운영 데이터(Operational Data) : 조직의 고유한 업무를 수행하는 데 반드시 필요한 자료
- 공용 데이터(Shared Data) : 여러 응용 시스템들이 공동으로 소유하고 유지하는 자료

DBMS(DataBase Management System; 데이터베이스 관리 시스템)

사용자의 요구에 따라 정보를 생성해주고, 데이터베이스를 관리해주는 소프트웨어
필수 기능 3가지
- 정의(Definition) 기능 : 데이터의 형(Type)과 구조에 대한 정의, 이용 방식, 제약 조건 등을 명시하는 기능
- 조작(Manipulation) 기능 : 데이터 검색, 갱신, 삽입, 삭제 등을 위해 인터페이스 수단을 제공하는 기능
- 제어(Control) 기능 : 데이터의 무결성, 보안, 권한 건사, 병행 제어를 제공하는 기능

데이터의 독립성

논리적 독립성 : 응용 프로그램과 데이터베이스를 독립시킴으로써, 데이터의 논리적 구조를 변경시키더라도 응용 프로그램은 영향을 받지 않음
물리적 독립성 : 응용 프로그램과 보조기억장치 같은 물리적 장치를 독립시킴으로써, 디스크를 추가/변경하더라도 응용 프로그램은 영향을 받지 않음

스키마

데이터베이스의 구조와 제약 조건에 관한 전반적인 명세를 기술한 것
- 외부스키마 : 사용자나 응용 프로그래머가 각 개인의 입장에서 필요로 하는 데이터베이스의 논리적 구조를 정의한 것
- 게념스키마 : 데이터베이스의 전체적인 논리적 구조 / 모든 응용 프로그램이나 사용자들이 필요로 하는 데이터를 종합한 조직 전체의 데이터베이스로, 하나만 존재
- 내부스키마 : 물리적 저장장치의 입장에서 본 데이터베이스 구조 / 실제로 저장될 레코드의 형식, 저장 데이터 항목의 표현 방법, 내부 레코드의 물리적 순서 등을 나타냄

3) 데이터베이스 설계

데이터베이스 설계 시 고려사항

무결성 : 삽입, 삭제, 갱신 등의 현상 후에도 데이터베이스에 저장된 데이터가 정해진 제약 조건을 항상 만족해야 함.
일관성 : 데이터베이스에 저장된 데이터들 사이나, 특정 질의에 대한 응답이 처음부터 끝까지 변함없이 일정해야함.
회복 : 시스템에 장애가 발생했을 때 장애 발생 직전의 상태로 복구할 수 있어야 함
보안 : 불법적인 데이터의 노출 또는 변경이나 손실로부터 보호할 수 있어야 함
효율성 : 응답시간의 단출, 시스템의 생산성, 저장 공간의 최적화 등이 가능해야 함.
데이터베이스 확장 : 데이터베이스 운영에 영향을 주지 않으면서 지속적으로 데이터를 추가할 수 있어야 함

1. 요구 조건 분석 :

데이터베이스를 사용할 사람들로부터 필요한 용도를 파악하는 것 => 요구 조건 명세 작성

2. 개념적 설계(정보 모델링, 개념화) :

현실 세계에 대한 인식을 추상적 개념으로 표현하는 과정 => 개념 스티마(E-R 다이어그램)

E-R 모델

3. 논리적 설계(데이터 모델링) :

현실 세계에서 발생하는 자료를 컴퓨터가 이해하고 처리할 수 있는 물리적 저장장치에 저장할 수 있도록 변환하기 위해 특정 DBMS가 지원하는 논리적 자료 구조로 변환하는 과정 => 논리적 스키마 설계

4. 물리적 설계(데이터 구조화) :

논리적 구조로 표현된 데이터를 물리적 구조의 데이터로 변환하는 과정 => 데이터베이스 파일의 저장 구조 및 액세스 경로 결정

5. 데이터베이스 구현 :

논리적 설계와 물리적 설계에서 도출된 데이터베이스 스키마를 파일로 생성하는 과정 => DDL(데이터정의어)를 이용

데이터 모델에 표시할 요소

구조(Structure) : 논리적으로 표현된 개체 타입들 간의 관계로서 데이터 구조 및 정적 성질 표현
연산(Operation) : 데이터베이스에 저장된 실제 데이터를 처리하는 작업에 대한 명세로서 데이터베이스를 조작하는 기본 도구
제약 조건(Constraint) : 데이터베이스에 저장될 수 있는 실제 데이터의 논리적인 제약 조건

데이터 모델의 구성요소

개체(Entity) : 데이터베이스에 표현하려는 것을, 사람이 생각하는 개념이나 정보 단위 같은 현실 세계의 대상체

다른 개체와 하나 이상의 관계(Relationship)가 있다.

속성(Attribute) : 데이터베이스를 구성하는 가장 작은 논리적 단위

속석의 수는 차수(Degree)
기본속성 / 설계속성 / 파생속성
기본키 속성 / 외래키 속성 / 일반 속성

관계(Relationship) : 개체와 개체 사이의 논리적인 연결 / 속성간의 관계도 있다.

1 대 1(1:1) / 1 대 다(1:N) / 다 대 다(N:M)
종속 관계 : 두 개체 사이의 주종관계를 표현
중복 관계 : 두 개체 사이에 2번 이상의 종속 관게가 발생
재귀 관계 : 개체가 자기 자신과 관계를 갖는 것, 순환 관계라고도 함.
배타 관계 : 개체의 속성이나 구분자를 기준으로 개체의 특성을 분할하는 관계

4) 식별자

주 식별자의 특징

유일성 : 개체 내의 모든 인스턴스들은 주 식별자에 의해 유일하게 구분되어야 함.
최소성 : 유일성을 만족시키기 위해 필요한 최소한의 속성으로만 구성되어야 함.
불변성 : 주 식별자가 특정 개체에 한 번 지정되면, 그 식별자는 변하지 않아야 함.
존재성 : 주 식별자가 지정되면 식별자 속성에 반드시 데이터 값이 존재해야 함.

5) 관계형 데이터베이스 구조 / 관계형 데이터 모델

2차원적인 표(table)을 이용해서 데이터 상호 관계를 정의하는 데이터베이스

개체(Entity)와 관계(Relationship)를 모두 릴레이션(Relation)이라는 표(table)로 표현하기 때문에 개체에는 개체 릴레이션과 관계 릴레이션이 존재한다.

튜플(Tuple) : 릴레이션을 구성하는 각각의 행(속성의 모임 = 레코드) / 튜플의 수를 카디널리티(Cardinality)라고 한다.
속성(Attribute) : 데이터베이스를 구성하는 가장 작은 논리적 단위 / 속성의 수는 디그리(Degree) 또는 차수라고 한다.
도메인(Domain) : 하나의 속성이 취할 수 있는 같은 타입의 원자값들의 집합

관계형 데이터베이스의 제약 조건

키(Key) :

데이터베이스에서 조건에 만족하는 튜플을 찾거나 순서대로 정렬할 때 기준이 되는 속성
1. 후보키 : 릴레이션을 구성하는 속성들 중에서 튜플을 유일하게 식별하기 위해 사용되는 속성들의 부분집합
2. 기본키 : 후보키 중에서 특별히 선정된 주키(Main Key) / 중복된 값을 가질 수 없다. / NULL값을 가질 수 없다.
3. 대체키 : 후보키가 둘 이상일 때 기본키를 제외한 나머지 후보키
4. 슈퍼키 : 한 릴레이션 내에 있는 속성들의 집합으로 구성된 키
5. 외래키 : 다른 릴레이션의 기본키를 참조하는 속성 또는 속성들의 집합

관계형 데이터베이스의 제약 조건

무결성(Integrity) :

데이터베이스에 저장된 데이터 값과 그것이 표현하는 현실 세계의 실제값이 일치하는 정확성

무결성 종류

관계대수 및 관계해석

관계대수 :

관계형 데이터베이스에서 원하는 정보와 그 정보를 검색하기 위해서 어떻게 유도하는가를 기술하는 절차적인 언어

순수 관계 연산자

일반 집합 연산자

수학적 집합 이론에서 사용하는 연산자

합병조건 : 두 릴레이션 간에 속성의 수가 같고, 대응되는 속성별로 도메인이 같아야 한다.

관계해석 :

관계 데이터의 연산을 표현하는 방법

6) 이상 / 함수적 종속

이상(Anomaly)

테이블에서 일부 속성들의 종속으로 인해 데이터의 중복이 발생하고, 이 준복으로 인해 테이블 조작 시 문제가 발생하는 현상
- 삽입 이상 : 테이블에서 삽입할 때 의도와는 상관없이 원하지 않는 값들로 인해 삽입할 수 없게 되는 현상
- 삭제 이상 : 테이블에서 한 튜플을 삭제할 때 의도와는 상관없는 값들도 함께 삭제되는, 즉 연쇄 삭제가 발생하는 현상
- 갱신 이상 : 테이블에서 튜플에 있는 속성 값을 갱신할 때 일부 튜플의 정보만 갱신되어 정보에 불일치성이 생기는 현상

함수적 종속

어떤 테이블 R에서 X와 Y를 각각 R의 속성 집합의 부분집합이라 하자.
=> 속성 X의 값 각각에 대해 시간에 관계없이 항상 속성 Y의 값이 오직 하나만 연관되어 있을 때 Y는 X에 함수적 종속 또는 X가 Y를 함수적으로 결정한다고 하고, X->Y로 표기한다.
- 완전 함수적 종속
- 부분 함수적 종속

7) 정규화(Normalization)

테이블의 속성들이 상호 종속적인 관계를 갖는 특성을 이용하여 테이블을 무손실 분해하는 과정
(목적 : 가능한 한 중복을 제거하여 삽입, 삭제, 갱신 이상의 발생 가능성을 줄이는 것)
- 제 1정규화(1NF) : 테이블 R에 속한 모든 속성의 도메인이 원자 값만으로 되어 있는 정규형
- 제 2정규화(1NF) : 테이블 R이 제 1정규형이고, 기본키가 아닌 모든 속성이 기본키에 대하여 완전 함수적 종속을 만족하는 정규형
- 제 3정규화(1NF) : 테이블 R이 제 2정규화이고 기본키가 아닌 모든 속성이 기본키에 대해 이행적 함수적 종속을 만족하지 않는 정규형
- 보이스-코드 정규화(BCNF) : 테이블 R에서 모든 결정자가 후보키인 정규형
- 제 4정규화(4NF) : 테이블 R에 다중 값 종속가 존재할 경우, R의 모든 속성이 A에 함수적 종속 관께를 만족시키는 정규형
- 제 5정규화(5NF) : 테이블 R의 모든 조인 종속이 R의 후보키를 통해서만 성립되는 정규형

반정규화(Denormalization)

시스템으 ㅣ성능을 향상하고 개발 및 운영의 편의성 등을 높이기 위해 정규화된 데이터 모델을 의도적으로 통합, 중복, 분리하여 정규화 원칙을 위배하는 행위
- 테이블 통합 : 조인(Join)
- 테이블 분할
- 중복 테이블 추가 : 트리거
- 중복 속성 추가

8)시스템 카탈로그

시스템 그 자체에 관련이 있는 다양한 객체에 관한 정보를 포함하는 시스템 데이터베이스(=데이터 사전)

메타 데이터

시스템 카탈로그에 저장되는 정보
유형 : 데이터베이스 객체 정보 / 사용자 정보 / 테이블 무결성 제약 조건 정보

데이터 디렉토리

데이터 사전에 수록된 데이터에 접근하는 데 필요한 정를 관리 유지하는 시스템

9) 트랜잭션

데이터베이스의 상태를 변환시키는 하나의 논리적 기능을 수행하기 위한 작업 단위 또는 한꺼번에 모두 수행되어야 할 일련의 연산들
- 원자성 : 트랜잭션의 연산은 데이터베이스에 모두 반영되도록 완료(Commit)되든지 아니면 전혀 반영되지 않도록 복구(Rollback) 되어야 함
- 일관성 : 트랜잭션이 그 실행을 성공적으로 완료하면 언제나 일관성 있는 데이터베이스 상태로 변환됨
- 독립성 : 둘 이상의 트랜잭션이 동시에 병행 실행되는 경우 어느 하나의 트랜잭션 실행 중에 다른 트랜잭션의 연산이 끼어들 수 있음
- 지속성 : 성공적으로 완료된 트랜잭션의 결과는 시스템이 고장나더라도 영구적으로 반영되어야 함

CRUD분석

프로세스와 테이블 간에 XRUD 매트릭스를 만들어서 트랜잭션을 분석하는 것

10) 인덱스

데이터 레코드를 빠르게 접근하기 위해 <키 값, 포인터> 쌍으로 구성되는 데이터 구조

11) 뷰

사용자에게 접근이 허용된 자료만을 제한적으로 보여주기 위해 하나 이상의 기본 테이블로부터 유도된, 이름을 가지는 가상 테이블

클러스터(Cluster)

테이터 저장 시 데이터 액세스 효율을 향상시키기 위해 동일한 성격의 데이터를 동일한 데이터 블록에 저장하는 물리적 저장 방법

클러스터는 데이터의 분포도가 넓을수록 유리하다. 처리 범위가 넓은 경우에는 단일 데이터 클러스터링, 조인이 많이 발생하는 경우에는 다중 테이블 클러스터링을 사용한다.

12) 파티션(Partition)

데이터베이스에서 파티션은 대용량의 테이블이나 인덱스를 작은 논리적 단위인 파티션으로 나누는 것

파티션의 종류

범위 분할(Range Partitioning) : 지정한 열의 값을 기준으로 분할

해시 분할(Hash Partitioning) : 해시 함수를 적용한 결과값에 따라 데이터를 분할함

조합 분할(Composite Partitioning) : 범위 분할로 분할한 다음 해시 함수를 적용해 다시 분할하는 방식

13) 분산 데이터베이스

논리적으로는 하나의 시스템에 속하지만, 물리적으로는 네트워크를 통해 여러 개의 사이트에 분산된 데이터베이스

분산 데이터베이스의 목표

위치 투명성

중복 투명성

병행 투명성

장애 투명성

14) 데이터베이스 이중화 / 서버 클러스터링

데이터베이스 이중화

시스템 오류로 인한 데이터베이스 서비스 중단이나 물리적 손상 발생 시 이를 복구하기 위해 동일한 데이터베이스를 복제하여 관리하는 것

이중화의 분류

Eager 기법 : 트랜잭션 수행 중 데이터 변경이 발생하면 이중화된 모든 데이터베이스에 즉시 전달하여 변경 내용 즉시 적용
Lazy 기법 : 트랜잭션 수행이 종료되면 변경 사실을 새로운 트랜잭션에 작성하여 각 데이터베이스에 전달되는 기법

클러스터링(Clustering)

두 대 이상의 서버를 하나의 서버처럼 운영하는 기술
서버 이중화 및 공유 스토리지를 사용하여 서버의 고가용성을 제공한다.
- 공유 스토리지(NAS; Network Attached Storage) : 데이터 저장소를 네트워크로 연결하여 파일 및 데이터를 공유하는 것으로 다수의 사용자 또는 서버가 데이터를 안정하고 편리하게 공유할 수 있다.
- DAS(Direct Attached Storage) : 서버와 저장장치를 전용 케이블로 직접 연결하는 방식
- 고가용성(HA;High Availability) : 시스템을 오랜 시간동안 계속해서 정상적으로 운영이 가능한 성징

클러스터링 종류

고가용성 클러스터링 : 하나의 서버에 장애가 발생하면 다른 서버가 받아 처리하여 서비스 중단을 방지하는 방식
병렬 처리 클러스터링 : 전체 처리율을 높이기 위해 하나의 작업을 여러 개의 서버에서 분산하여 처리하는 방식

RTO/RPO

RTO(Recovery Time Objective) : 비상사태 또는 업무 중단 시점으로부터 복구되어 가동될 때까지의 소요시간
RPO(Recovery Point Objective) : 비상사태 또는 업무 중단 시점으로부터 데이터를 복구할 수 있는 기준점

15) 데이터베이스 보안

데이터베이스의 일부 또는 전체에 대해서 권한이 없는 사용자가 액세스하는 것을 금지하기 위해 사용하는 기술

암호화

접근통제

데이터가 저장된 객체와 이를 사용하는 주체 사이의 정보 흐름을 제한하는 것

접근통제 기술

임의 접근통제(DAC) : 데이터를 접근하는 사용자의 신원에 따라 접근 권한 부여

강제 접근통제(MAC) : 주체와 객체의 등급을 비교하여 접근 권한 부여

역할기반 접근통제(RBAC) : 사용자의 역할에 따라 접근 권한 부여

접근통제 정책

신분 기반 정책 : 주체나 그룹의 신분에 근거하여 객체의 접근을 제한하는 방법

규칙 기반 정책 : 주체가 갖는 권한에 근거하여 객체의 접근을 제한하는 방법

역할 기반 정책 : 규칙 기반 정책을 변경한 정책으로, 주체의 신분이 아니라 주체가 맡은 역할에 근거하여 객체의 접근을 제한하는 방법

16) 데이터베이스 백업

전산 장비의 장에 대비하여 데이터베이스에 저장된 데이터를 보호하고 복구하기 위한 작업

로그 파일

데이터베이스의 처리 내용이나 이용 상황 등 상태 변화를 시간의 흐름에 따라 모두 기록한 파일
17) 자료구조
자료를 기억장치의 공간 내에 저장하는 방법과 자료 간의 관계, 처리 방법 등을 연구 분석하는 것

선형구조

배열 : 크기와 형(Type)이 동일한 자료들이 순서대로 나열된 자료의 집합
선형 리스트
2-1. 연속 리스트 : 배열과 같이 연속되는 기억장소에 저장되는 자료구조
2-2. 연결 리스트 : 자료들을 임의의 기억공간에 기억시키되, 자료 항목의 순서에 따라 노드의 포인터 부분을 이용하여 서로 연결시킨 자료구조
스택 : 리스트의 한쪽 끝으로만 자료의 삽입, 삭제 작업이 이루어지는 자료구조
큐 : 리스트의 한쪽에는 삽입 작업, 다른 쪽은 삭제 작업
데크 : 리스트의 양쪽에서 모두 삽입, 삭제 작업 가능

비선형구조

트리 : 정점(노드)와 선분을 이용하여 사이클을 이루지 않도록 구성한 그래프의 특수한 형태
그래프 : 정점과 간선의 두 집합으로 이루어지는 자료구조

이진트리

18) 정렬

삽입정렬(Insertion Sort) : 가장 간단한 정렬 방식으로, 이미 순서화된 파일에 새로운 하나의 레코드를 순서에 맞게 삽입시켜 정렬하는 방식
선택정렬(Selection Sort) : n개의 레코드 중에서 최소값을 찾아 첫번째 레코드 위치에 놓고, 나머지(n-1)개 중에서 다시 최소값을 찾아 두 번째 레코드 위치에 놓는 방식을 반복하여 정렬
버블정렬(Bubble Sort) : 주어진 파일에서 인접한 2개의 레코드 키 값을 비교하여 그 크기에 따라 레코드 위치를 서로 교환하는 정렬방식
쉘정렬(Shell Sort) : 입력 파일을 어떤 매개변수의 값으로 서브 파일을 구성하고, 각 서브 파일을 삽입(Insertion) 정렬방식으로 순서 배열하는 과정 반복
퀵정렬(Quick Sort) : 키를 기준으로 작은 값은 왼쪽, 큰 값은 오른쪽 서브 파일로 분해시키는 과정을 반복하는 정렬방식
힙 정렬(Heap Sort) : 전이진트리를 이용한 정렬
기수 정렬(Radix Sort = 버킷정렬) : 큐를 이용해 자릿수별로 정렬하는 방식

참고

https://starrykss.tistory.com/1624

조영문

이전 포스트

정보처리기사(애플리케이션 테스트 관리)

다음 포스트

정보처리기사(데이터 입·출력 구현)