정보처리기사 실기 문제 정리 - 3. 데이터 입출력 구현
3. 데이터 입출력 구현
01. 논리 데이터 저장소 확인
기출 문제
- 요구사항 분석 -> 개념적 데이터 모델링 -> 논리적 데이터 모델링 -> 물리적 데이터 모델링
- 1) 물리적 설계
- 특정 DBMS의 특성 및 성능을 고려하여 데이터베이스 저장 구조로 변환하는 과정으로 결과로 나오는 명세서는 테이블 정의서 등이 있다.
2) 개념적 설계
- 현실 세계에 대한 인식을 추상적, 개념적으로 표현하여 개념적 구조를 도출하는 과정으로 주요 산출물에는 E-R 다이어그램이 있다.
3) 논리적 설계
- 목표 DBMS에 맞는 스키마 설계, 트랜잭션 인터페이스를 설계하는 정규화 과정을 수행한다.
- 1) 연산
2) 구조
- 1) Cardinality : 5
2) Degree : 4
- 제 2정규형
- 반 정규화(De-Normalization)
- 디비전 (÷)
- 삽입, 삭제,
중복 갱신
- 삭제 이상은 정보 삭제 시 원치 않은 다른 정보가 같이 삭제되는 이상 현상이다
- 관계 해석
- 관계 해석은 관계 데이터베이스에 대한 비절차적 언어이며, 수학의 Predicate Calculus에 기반을 두고 있다.
- Codd 박사에 의하여 제안 되었으며, 튜플 관계 해석, 도메인 관계 해석이 있다.
- 1) TTL 2) 부장 3) 대리 4) 과장 5) 차장
- ⋃, -, ⨉, 𝞹, ⋈
- 1) ㄴ 2) ㅅ 3) ㅁ 4) ㅂ 5) ㄹ
- 1) Full 2) Partial 3) Transitive
- _비 정규화란 정규화된 엔터티, 속성, 관계에 대해 성능 향상과 개발 운영의 단순화를 위해 중복, 통합, 분리 등을 수행하는 데이터 모델링 기법이다.
예상 문제
- 1) 개체 2) 관계
개념적 데이터 모델 개체-관계(E-R) 모델
- 1) 관계 2) 속성
- 정규화
- 제 2정규형
- _데이터베이스 이상 현상이란 데이터의 중복성으로 인해 릴레이션을 조작할 때 발생하는 비합리적 현상이다.
- 제 1정규화
02. 물리 데이터 저장소 설계
기출 문제
- 1) 유일성
2) 최소성
예상 문제
물리적 모델링 물리 데이터 모델링
- 논리모델을 적용하고자 하는 기술에 맞도록 상세화해 가는 과정이다.
- ㅁ (Foreign Key)
- 관계형 데이터베이스의 인덱스 개념은 검색 연산의 최적화를 위해 데이터베이스 내 열에 대한 정보를 구성한 데이터 구조이다. / 전체 데이터의 검색 없이 필요한 정보를 신속히 조회가 가능하게 하는 데이터 구조이다.
- 레인지 파티셔닝
03. 데이터베이스 기초 활용
기출 문제
- 데이터 마이닝의 개념은 대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내는 기술이다.
예상 문제
- 데이터베이스란 다수의 인원, 시스템 또는 프로그램이 사용할 목적으로 통합하여 관리되는 데이터의 집합이다.
- 계층형 데이터베이스
- 계층형 데이터베이스 관리시스템(HDBMS)은 데이터를 상하 종속적인 관계로 계층화하여 관리하는 데이터베이스이다.
- 1) Key-Value DBMS
2) Document DBMS 문서 저장(Document Store) DBMS
3) 그래프(Graph) DBMS
- 1) 데이터 무결성
- 부적절한 자료가 입력되어 동일한 내용에 대하여 서로 다른 데이터가 저장되는 것을 허용하지 않는 성질
2) 데이터 일관성
- 삽입, 삭제, 갱신, 생성 후에도 저장된 데이터가 변함없이 일정
- ERD란 업무 분석 결과로 도출된 실체(개체)와 개체 간의 관계를 도식화한 다이어그램이다.
- 1) 개체 2) 속성
- 1) _HDFS (Hadoop Distributed File System)
2) 맵 리듀스 (Map Reduce)
- 다양성
- NoSQL은 전통적인 RDBMS와 다른 DBMS를 지칭하기 위한 용어로 데이터 저장에 고정된 테이블 스키마가 필요하지 않고 조인 연산을 사용할 수 없으며, 수평적으로 확장이 가능한 DBMS이다.
- Soft-State
- Column Family Date Store
- Column Family Date Store는 Key 안에 (Column, Value)조합으로 된 여러 개의 필드를 갖는 DB이다.
- 제품으로 HBase, Cassandra가 있다.
- 온톨리지는 실세계에 존재하는 모든 개념들의 속성, 그리고 개념 간의 관계 정보를 컴퓨터가 이해할 수 있도록 서술해 놓은 지식베이스이다.
- 1) 연관 규칙 2) 연속 규칙
- 텍스트 마이닝은 대량의 텍스트 데이터로부터 패턴 또는 관계를 추출하여 의미 있는 정보를 찾아내는 기법이다.
- DBMS는 데이터 관리의 복잡성을 해결하는 동시에 데이터 추가, 변경, 검색, 삭제 및 백업, 복구, 보안 등의 기능을 지원하는 소프트웨어이다.
단원 종합 문제
- 1) 개체
2) 속성
- 보이스-코드 정규형(BCNF)
- 1정규형
- 해시 파티셔닝
- 파티션 키의 해시값에 의한 균등한 데이터 분할 가능한 파티셔닝 기법이다.
- 개체-관계(E-R) 모델은 현실 세계에 존재하는 데이터와 그들 간의 관계를 사람이 이해할 수 있는 형태로 명확하게 표현하기 위한 모델로 요구사항으로부터 얻어낸 정보들을 개체, 속성, 관계로 기술한 모델이다.
- 레인지 파티셔닝은 연속적인 숫자나 날짜를 기준으로 하는 파티셔닝 기법이다.
- 1) 통합된 데이터 2) 운영 데이터
- 데이터 베이스는 통합된 데이터, 저장된 데이터, 운영 데이터, 공용 데이터이다.
- 1) 계속적인 변화 2) 내용 참조
- 데이터베이스 특성에는 실시간 접근성, 계속적인 변화, 동시공용, 내용 참조가 있다.
- 빅데이터란 시스템, 서비스, 조직(회사) 등에서 주어진 비용, 시간 내에 처리 가능한 데이터 범위를 넘어서는 수십 페타바이트(PB) 크기의 비정형 데이터이다.
- 1) 양 2) 다양성
- NoSQL은 전통적인 RDBMS와 다른 DBMS를 지칭하기 위한 용어로 데이터 저장에 고정된 테이블 스키마가 필요하지 않고 조인 연산을 사용할 수 없으며, 수평적으로 확장이 가능한 DBMS이다.
- 1) Basically Available 2) Eventually Consistency
- Column Family Data Store
- Column Family Data Store는 Key 안에 (Column, Value) 조합으로 된 여러 개의 필드를 갖는 DB를 의미한다.
- 텍스트 마이닝
- 온톨리지는 실세계에 존재하는 모든 개념들의 속성, 그리고 개념들 간의 관계 정보를 컴퓨터가 이해할 수 있도록 서술해 놓은 지식베이스이다.
- 테이블 통합(병합)
- 1:1 관계, 1:M 관계를 통합하여 조인 횟수를 줄여 성능을 향상
- 슈퍼타입/서브타입 테이블 통합 통해 성능 향상
- 구글에서 대용량 데이터 처리를 분산 병렬 컴퓨팅에서 처리하기 위한 목적으로 제작하여 2004년에 발표한 소프트웨어 프레임워크이다.
- 카티션 프로덕트
글이 많은 도움이 되었습니다, 감사합니다.