[정보처리기사 실기] 2-1. 데이터 입출력 구현 1

희진·2024년 4월 2일
post-thumbnail

62. DBMS

  • DBMS(DataBase Management System, 데이터베이스 관리 시스템)는 사용자의 요구에 따라 정보를 생성해주고, 데이터베이스를 관리해 주는 소프트웨어이다.

DBMS의 필수 기능 3가지

  • 정의(Definition) : 데이터의 형(Type)과 구조에 대한 정의, 이용 방식, 제약 조건 등을 명시하는 기능
  • 조작(Manipulation) : 데이터 검색, 갱신, 삽입, 삭제 등을 위해 인터페이스 수단을 제공하는 기능
  • 제어(Control) 기능 : 데이터의 무결성, 보안, 권한 검사, 병행 제어를 제공하는 기능

63. 스키마

스키마(Schema)는 데이터베이스의 구조와 제약조건에 관한 전반적인 명세를 기술한 것이다.

외부 스키마

사용자나 응용 프로그래머가 각 개인의 입장에서 필요로 하는 데이터베이스의 논리적 구조를 정의한 것

개념 스키마

  • 데이터베이스의 전체적인 논리적 구조
  • 모든 응용 프로그램이나 사용자들이 필요로 하는 데이터를 종합한 조직 전체의 데이터베이스로, 하나만 존재함

내부 스키마

  • 물리적 저장장치의 입장에서 본 데이터베이스 구조
  • 실제로 저장될 레코드의 형식, 저장 데이터 항목의 표현 방법, 내부 레코드의 물리적 순서 등을 나타냄

64. 데이터베이스 설계 순서

  1. 요구 조건 분석 : 요구 조건 명세서 작성
  2. 개념적 설계 : 개념 스키마, 트랜잭션 모델링, E-R 모델
  3. 논리적 설계 : 목표 DBMS에 맞는 논리 스키마 설계, 트랜잭션 인터페이스 설계
  4. 물리적 설계 : 목표 DBMS에 맞는 물리적 구조의 데이터로 변환
  5. 구현 : 목표 DBMS의 DDL(데이터 정의어)로 데이터베이스 생성, 트랜잭션 작성

65. 개념적 설계

  • 개념적 설계(정보 모델링, 개념화)는 정보의 구조를 얻기 위하여 현실 세계의 무한성과 계속성을 이해하고, 다른 사람과 통신하기 위하여 현실 세계에 대한 인식을 추상적 개념으로 표현하는 과정이다.
  • 개념적 설계에서는 개념 스키마 모델링과 트랜잭션 모델링을 병행 수행한다.
  • 개념적 설계에서는 요구 분석에서 나온 결과인 요구 조건 명세를 DBMS에 독립적인 E-R 다이어그램으로 작성한다.

66. 논리적 설계

  • 논리적 설계(데이터 모델링)는 현실 세계에서 발생하는 자료를 컴퓨터가 이해하고 처리할 수 있는 물리적 저장 장치에 저장할 수 있도록 변환하기 위해 특정 DBMS가 지원하는 논리적 자료 구조로 변환(mapping)시키는 과정이다.
  • 개념 세계의 데이터를 필드로 기술된 데이터 타입과 이 데이터 타입들 간의 관계로 표현되는 논리적 구조의 데이터로 모델화한다.
  • 개념적 설계가 개념 스키마를 설계하는 단계라면, 논리적 설계에서는 개념 스키마를 평가 및 정제하고 DBMS에 따라 서로 다른 논리적 스키마를 설계하는 단계이다.

67. 물리적 설계

  • 물리적 설계(데이터 구조화)는 논리적 설계에서 논리적 구조로 표현된 데이터를 디스크 등의 물리적 저장장치에 저장할 수 있는 물리적 구조의 데이터로 변환하는 과정이다.
  • 물리적 설계에서는 다양한 데이터베이스 응용에 대해 처리 성능을 얻기 위해 데이터베이스 파일의 저장 구조 및 액세스 경로를 결정한다.
  • 저장 레코드의 형식, 순서, 접근 경로, 조회 집중 레코드 등의 정보를 사용하여 데이터가 컴퓨터에 저장되는 방법을 묘사한다

68. 데이터 모델

  • 데이터 모델은 현실 세계의 정보들을 컴퓨터에 표현하기 위해서 단순화, 추상화하여 체계적으로 표현한 개념적 모형이다.

데이터 모델에 표시할 요소

  1. 구조(Structure)
    논리적으로 표현된 개체 타입들 간의 관계로서 데이터 구조 및 정적 성질 표현
  2. 연산(Operation)
    데이터베이스에 저장된 실제 데이터를 처리하는 작업에 대한 명세로서 데이터베이스를 조작하는 기본 도구
  3. 제약 조건(Constraint)
    데이터베이스에 저장될 수 있는 실제 데이터의 논리적인 제약 조건

69. E-R 다이어그램

E-R 다이어그램

70. 관계형 데이터베이스의 릴레이션 구조

릴레이션(Relation)은 데이터들을 표(Table)의 형태로 표현한 것으로, 구조를 나타내는 릴레이션 스키마와 실제 값들인 릴레이션 인스턴스로 구성된다.

  • 릴레이션 인스턴스 : 데이터 개체를 구성하고 있는 속성들에 데이터 타입이 정의되어 구체적인 데이터 값을 가진 것을 의미함
    릴레이션

71. 튜플

  • 튜플(Tuple)은 릴레이션을 구성하는 각각의 행을 말한다.
  • 튜플은 속성의 모임으로 구성된다.
  • 파일 구조에서 레코드와 같은 의미이다.
  • 튜플의 수를 카디널리티(Cardinality) 또는 기수, 대응수라고 한다.

72. 속성

  • 속성(Attribute)은 데이터베이스를 구성하는 가장 작은 논리적 단위이다.
  • 파일 구조상의 데이터 항목 또는 데이터 필드에 해당된다.
  • 속성은 개체의 특성을 기술한다.
  • 속성의 수를 디그리(Degree) 또는 차수라고 한다.

73. 도메인

  • 도메인(Domain)은 하나의 애트리뷰트가 취할 수 있는 같은 타입의 원자(Atomic)값들의 집합이다.
  • 도메인은 실제 애트리뷰트 값이 나타날 때 그 값의 합법 여부를 시스템이 검사하는 데에도 이용된다.
  • 예. '성별' 애트리뷰트의 도메인은 '남'과 '여'로, 그 외의 값은 입력될 수 없다.

74. 후보키

  • 후보키(Candidate Key)는 릴레이션을 구성하는 속성들 중에서 튜플을 유일하게 식별하기 위해 사용되는 속성들의 부분집합니다.
  • 기본키로 사용할 수 있는 속성들을 말한다.
  • 후보키는 유일성(Unique)과 최소성(Minimality)을 모두 만족시켜야 한다.
  1. 유일성 : 하나의 키 값으로 하나의 튜플만을 유일하게 식별할 수 있어야 함
  2. 최소성 : 키를 구성하는 속성 하나를 제거하면 유일하게 식별할 수 없도록 꼭 필요한 최소의 속성으로 구성되어야 함

75. 기본키

  • 기본키(Primary Key)는 후보키 중에서 특별히 선정된 주키(Main Key)이다.
  • 기본키는 중복된 값을 가질 수 없다.
  • 기본키는 한 릴레이션에서 특정 튜플을 유일하게 구별할 수 있는 속성이다.
  • 기본키는 NULL 값을 가질 수 없다. 즉 튜플에서 기본키로 설정된 속성에는 NULL 값이 있어서는 안 된다.

76. 대체키

  • 대체키(Alternate Key)는 후보키가 둘 이상일 때 기본키를 제외한 나머지 후보키를 의미한다.
  • 대체키를 보조키라고도 한다.

77. 슈퍼키

  • 슈퍼키(Super Key)는 한 릴레이션 내에 있는 속성들의 집합으로 구성된 키를 말한다.
  • 릴레이션을 구성하는 모든 튜플 중 슈퍼키로 구성된 속성의 집합과 동일한 값은 나타나지 않는다.
  • 슈퍼키는 릴레이션을 구성하는 모든 튜플에 대해 유일성은 만족하지만, 최소성은 만족하지 못한다.

78. 외래키

  • 외래키(Foreign Key)는 다른 릴레이션의 기본키를 차모하는 속성 또는 속성들의 집합을 의미한다.
  • 한 릴레이션에 속한 속성 A와 참조 릴레이션의 기본키인 B가 동일한 도메인 상에서 정의되었을 때의 속성 A를 외래키라고 한다.
  • 외래키로 지정되면 참조 릴레이션의 기본키에 없는 값은 입력할 수 없다.

79. 무결성

  • 무결성(Integrity)은 데이터베이스에 저장된 데이터 값과 극서이 표현하는 현실 세계의 실제값이 일치하는 정확성을 의미한다.
  • 개체 무결성 : 기본 테이블의 기본키를 구성하는 어떤 속성도 Null 값이나 중복값을 가질 수 없다는 규정
  • 참조 무결성 : 외래키 값은 Null이거나 참조 릴레이션의 기본키 값과 동일해야 함. 즉 릴레이션은 참조할 수 없는 외래키 값을 가질 수 없다는 규정

80. 관계대수

  • 관계대수는 관계형 데이터베이스에서 원하는 정보와 그 정보를 검색하기 위해서 어떻게 유도하는가를 기술하는 절차적인 언어이다.
  • 관계대수는 릴레이션을 처리하기 위해 연산자와 연산 규칙을 제공하며, 피연산자와 연산 결과가 모두 릴레이션이다.
  • 관계대수는 질의에 대한 해를 구하기 위해 수행해야 할 연산의 순서를 명시한다.

81. 순수 관계 연산자

Select

  • 릴레이션에 존재하는 튜플 중에서 선택 조건을 만족하는 튜플의 부분집합을 구하여 새로운 릴레이션을 만드는 연산이다.
  • 릴레이션의 행에 해당하는 튜플(Tuple)을 구하는 것이므로 수평 연산이라고도 한다.
  • 기호 : σ(시그마)

Project

  • 주어진 릴레이션에서 속성 리스트(Attribute List)에 제시된 속성 값만을 추출하여 새로운 릴레이션을 만드는 연산이다.
  • 릴레이션의 열에 해당하는 속성을 추출하는 것이므로 수직 연산자라고도 한다.
  • 기호 : π(파이)

Join

  • 공통 속성을 중심으로 두 개의 릴레이션을 하나로 합쳐서 새로운 릴레이션을 만드는 연산이다.
  • Join의 결과는 Cartesian Product(교차곱)를 수행한 다음 Select를 수행한 것과 같다.
  • 기호 : ⋈

Division

  • X⊃Y인 두 개의 릴레이션 R(X)와 S(Y)가 있을 때, R의 속성이 S의 속성값을 모두 가진 튜플에서 S가 가진 속성을 제외한 속성만을 구하는 연산이다.
  • 기호 : ÷

82. 일반 집합 연산자

합집합(UNION)

  • 두 릴레이션에 존재하는 튜플의 합집합을 구하되, 결과로 생성된 릴레이션에서 중복되는 튜플은 제거되는 연산이다.
  • 합집합의 카디널리티는 두 릴레이션 카디널리티의 합보다 크지 않다.
  • 기호 : ∪

교집합(INTERSECTION)

  • 두 릴레이션에 존재하는 튜플의 교집합을 구하는 연산이다.
  • 교집합의 카디널리티는 두 릴레이션 중 카디널리티가 적은 릴레이션의 카디널리티보다 크지 않다.
  • 기호 : ∩

차집합(DIFFERENCE)

  • 두 릴레이션에 존재하는 튜플의 차집합을 구하는 연산이다.
  • 차집합의 카디널리티는 릴레이션 R의 카디널리티보다 크지 않다.
  • 기호 : ―

교차곱(CARTESIAN PRODUCT)

  • 두 릴레이션에 있는 튜플들의 순서쌍을 구하는 연산이다.
  • 교차곱의 디그리(Degree)는 두 릴레이션의 디그리를 더한 것과 같고, 카디널리티(Cardinality)는 두 릴레이션의 카디널리티를 곱한 것과 같다.
  • 기호 : ×

83. 관계해석

  • 관계해석(Relational Calculus)은 관계 데이터의 연산을 표현하는 방법이다.
  • 관계 데이터 모델의 제안자인 코드(E. F. Codd)가 수학의 Predicate Calculus(술어 해석)에 기반을 두고 관계 데이터베이스를 위해 제안했다.
  • 관계해석은 원하는 정보가 무엇이라는 것만 정의하는 비절차적 특성을 지닌다.
  • 원하는 정보를 정의할 때는 계산 수식을 사용한다.

84. 이상

  • 이상(Anomaly)이란 데이터베이스 내에 데이터들이 불필요하게 중복되어 릴레이션 조작 시 예기치 않게 발생하는 곤란한 현상을 의미한다.
  • 삽입 이상(Insertion Anomaly) : 테이블에 데이터를 삽입할 때 의도와는 상관없이 원하지 않는 값들로 인해 삽입할 수 없게 되는 현상
  • 삭제 이상(Deletion Anomaly) : 테이블에서 튜플을 삭제할 때 의도와는 상관없는 값들도 함께 삭제되는, 즉 연쇄 삭제가 발생하는 현상
  • 갱신 이상(Update Anomaly) : 테이블에서 튜플에 있는 속성 값을 갱신할 때 일부 튜플의 정보만 갱신되어 정보에 불일치성(Inconsistency)이 생기는 현상

85. 함수적 종속

함수적 종속(Functional Dependency)

어떤 테이블 R에서 X와 Y를 각각 R의 속성 집합의 부분집합이라 하자. 속성 X의 값 각각에 대해 시간에 관계없이 항상 속성 Y의 값이 오직 하나만 연관되어 있을 때 Y는 X에 함수적 종속 또는 X가 Y를 함수적으로 결정한다고 하고 X → Y로 표기한다.

완전 함수적 종속(Full Functional Dependency)

어떤 테이블 R에서 속성 Y가 다른 속성 집합 X 전체에 대해 함수적 종속이면서 속성 집합 X의 어떠한 진부분 집합 Z(즉, Z⊂X)에도 함수적 종속이 아닐 때 속성 Y는 속성 집합 X에 완전 함수적 종속이라고 한다.

부분 함수적 종속(Partial Functional Dependency)

어떤 테이블 R에서 속성 Y가 다른 속성 집합 X 전체에 대해 함수적 종속이면서 속성 집합 X의 임의의 진부분 집합에 대해 함수적 종속일 때, 속성 Y는 속성 집합 X에 부분 함수적 종속이라고 한다.

이행적 함수적 종속(Transitive Functional Dependency)

X → Y이고 Y → Z일 때 X → Z를 만족하는 관계를 의미한다.

86. 정규화

  • 정규화(Normalization)는 테이블의 속성들이 상호 종속적인 관계를 갖는 특성을 이용하여 테이블을 무손실 분해하는 과정이다.
  • 정규화의 목적은 가능한 한 중복을 제거하여 삽입, 삭제, 갱신 이상의 발생 가능성을 줄이는 것이다.
  • 정규형에은 제 1정규형(1NF), 제 2정규형(2NF), 제 3정규형(3NF), BCNF, 제 4정규형(4NF), 제 5정규형(5NF)이 있으며, 순서대로 정규화의 정도가 높아진다.
profile
열심히 살겠습니다

0개의 댓글