데이터베이스론 1장

Dev.choi·2021년 4월 9일

데이터베이스 전공공부 정보처리기사

정보처리 시스템: 조직체가 유용하게 의사 결정을 하게 하기 위해 정확한 정보를 제공하는 것

정보처리: 컴퓨터가 정보를 생성하기 위해 데이터를 처리하는 작업

◾데이터:관찰이나 측정을 통해 수집된 fact,value(숫자로 표현되는 수치, 문자들로 표현되는 스트링)
◾정보: 의사결정을 할 수 있게 하는 데이터의 유효한 해석이나 데이터 상호 간의 관계

[데이터와 정보의 관계]
-P는 처리기, D는 데이터, I는 정보라 할 때 공식적으로 P(D)=I로 표현(D➡P➡I)

[정보추출 방법]
정보시스템은 한 조직체의 활동에 필요한 데이터를 수집, 조직, 저장하고 정보를 생성, 분배하는 수단

[정보시스템의 사용]

군사 정보 시스템
행정 정보 시스템
경영 정보 시스템:기업 운영에 필요한 여러 데이터들을 수집해서 가공하고 전체적인 경영관리에 필욯나 정보를 제공해주는 시스템으로 기업의 전략, 계획, 조정, 관리, 운영 등의 결정을 보조해준다.
의사결정지원시스템:하나의 전문적인 목적보다는 여러 가지 복합적인 의사결정을 위해 통합적인 기능을 수행하는 정보시스템으로 구축된 것이다. 즉, 의사결정지원시스템은 경영을 위한 정보 결정을 하는 데에 필요한 것으로 경영정보시스템의 하위요소라고 할 수 있다.
응용 시스템: 정보 시스템에서 작업을 수행하기 위한 정보를 제공하는 서브시스템으로 정보시스템의 일부를 이루고 있고, 이 응용시스템의 기능을 수행하는 프로그램들을 응용프로그램이라 한다.

2. 데이터 처리 시스템: 정보처리를 위한 데이터를 처리하는 시스템으로 정보 처리 시스템의 핵심이다.

💫데이터 처리 시스템에서의 데이터베이스의 중요성💫
데이터 처리 시스템에서 각각의 데이터를 처리하지만 이것은 독립적인 자료가 아니라 전체적으로 통일성 있게 연관된 하나의 자료이다. 그렇기 때문에 데이터베이스를 통하여 자료가 중복되지 않고 형식을 통일 시켜주는 체계가 필요

[데이터 처리 시스템의 유형] ~데이터의 조직, 접근 방법에 따라~

일괄처리 시스템
온라인처리 시스템
분산처리 시스템

(1)일괄처리 시스템: 수집된 데이터를 같은 종류별로 분류해서 한꺼번에 처리하는 시스템이다.

장점: 여러 자료를 모아서 처리하기 때문에 작업에 필요한 처리 비용이 적게 들고 시스템의 성능 높아짐
단점: 이용자의 입장에서는 자료가 처리될 때까지 기다려야 하고, 데이터 수집 과정에서 여러 작업이 필요함

(2)온라인 처리 시스템:온라인을 통해 준비 작업없이 바로 데이터를 처리하기도 하고, 전송을 통해 모아진 데이터를 일정 시간에 일괄 처리하기도 하는 방식이다. 하지만 대체적으로는 전자를 온라인 처리 시스템이라고 한다.

특) 실시간으로 온라인 처리가 이루어진다는 의미로 실시간 온라인 처리라고도 함
ex)온라인 일괄처리 시스템은 일괄 처리 과정에서 데이터의 입력이 전송을 통해 직접 이루어지나 실시간 처리는 아니므로 온라인 처리 시스템과는 상이

*장점

💛데이터를 실시간으로 처리하는 온라인 처리 시스템은 대기시간이 없어서 이용자의 시간 절약
💛데이터가 직접 컴퓨터로 입력되기 때문에 데이터 입력에 따른 데이터의 분류 및 정리 작업 감소
💛데이터 오류 바로 발견 가능, 질의&검색을 활발하게 수행해서 데이터의 현재성 유지

*단점
💚많은 컴퓨터들이 연결되어 있고 계속적으로 통신을 유지해야 되기 때문에 구조가 복잡하고, 시스템을 계속 가동하여 처리 비용 높아짐
💚작업량이 많지 않은 때에는 효율성이 낮아지게 됨

(3)분산 처리 시스템: 각 시스템이 따로따로 처리하는 것이 아니고 중앙 컴퓨터에 연결되어 전체적으로 처리된다. 그렇기 때문에 데이터베이스를 통하여 각각 처리하는 자료를 하나로 통합하여 처리되는 데이터가 분산되지 않도록 하는 것이 중요하다.(분산 처리 시스템에서의 데이터베이스의 중요성)

*장점
💛업무 처리 중의 문제 발생에 대한 빠른 조치
💛업무에 대한 책임 구분 명확, 지속적 확장 가능, 지리적으로 떨어져 있는 곳에서도 하나의 시스템을 같이 사용할 수 있음
💛컴퓨터의 과부하 감소, 조직 전체의 융통성 및 유연성 향상

*단점
💚시스템의 설계가 쉽지 않음
💚보안문제 발생 가능성 있음

💯요약💯
✔ 데이터와 정보는 비슷한 의미로 혼용되기는 하지만 그 유용성 면에서 상당한 차이 존재
✔ 의사결정에 유용한 정보 데이터를 효과적으로 처리함으로써 얻을 수 있으며, 한 조직체의 활동에 필요한 데이터를 수집, 조직, 저장해 두었다가 처리해서 정보를 생성 분배하는 수단을 일반저긍로 정보 시스템이라고 함
✔ 정보 시스템은 실제로 데이터를 처리하는 서브 시스템을 기초로 구성되며, 이런 데이터 처리 시스템은 데이터의 처리 형태에 따라 일괄처리,온라인처리,분산처리 시스템으로 구분함

💥데이터를 가공하면 정보가 된다.
: 데이터는 현실세계로부터 단순한 관찰이나 측정을 통해 수집된 사실이나 값을 말하지만 정보는 데이터의 해석이나 데이터의 상호 간의 관계를 말하는 것으로 정보는 데이터를 처리해서 얻어진 결과라고 할 수 있다.

3.데이터베이스

1.데이터베이스의 정의:조직의 여러 시스템을 공용으로 사용할 수 있도록 상호 관련된 데이터들을 모아놓는 것이다. 이렇게 자료를 집중화시킴으로써 자료의 중복을 최소화 할 수 있다. 그리고 여러 분야의 업무를 효과적으로 지원한다는 특징이 있다.

1) 통합 데이터: 최소의 중복, 통제된 중복

▶최소의 중복은 시스템에서 데이터가 중복이 되어도 가급적 하나로 줄여야 한다.
▶통제된 중복은 필요에 의해 중복 데이터를 사용하는 중복된 값들의 위치를 정확히 알아야 한다.

✨얼마만큼 중복이 되었는지
✨한 곳이 변경이 되면 다른 한쪽도 변경이 되어야 함_

2)저장 데이터:컴퓨터가 접근가능한 저장매체(ex:디스크,테이프)에 저장을 한다.

3)운영 데이터: 어떤 조직이라도 고유의 기능을 가지고 있고 그 기능을 수행하기 위해 반드시 유지되어야 할 데이터(한 조직의 고유 기능을 수행하기 위해 필요한 데이터)

4)공용 데이터: 조직에 있는 여러 응용 시스템들이 공동으로 소유하고 유지하며 이용하는 데이터, 여러 사용자들이 서로 다른 목적으로 데이터베이스의 데이터를 공동 이용한다.

2.데이터베이스의 특징

1)실시간 접근성:질의(임의적이고 비정형적임,Query)에 대한 실시간 처리, 응답으로 다음 의사결정에 바로 반영할 수 있게 하는 처리방식

2)계속적인 변화: 데이터베이스의 상태는 갱신, 삭제, 삽입 등에 의해 동적인 특성을 가짐

3)동시 공용: 여러 사용자(Multi-user)가 동시에 사용할 수 있다.

🍇이점: 멀티 유저 접근을 통해 많은 자료 모이고 실시간 처리 되기 때문에 유연성과 확장성 증가

🍇단점: 데이터 보안이 문제되고 데이터에 문제 생겼을 때 그 피해가 더 커질 수 있음 따라서 이를 보완하기 위해 보완체계를 철저히 하고, 백업을 통해 문제 대비해야 함

4)내용에 의한 참조: 데이터의 위치나 주소가 아닌 내용(Contents,Values,Call By Value)에 의해 참조된다.

ex) 인터넷 검색 시 URL로 찾는게 아니라 '키워드'로 검색

😃주소에 의한 참조가 사용자가 주소를 통해 참조를 할 수 있는 데에 비해 내용에 의한 참조는 사용자가 참조하기를 원하는 데이터의 특성이나 조건을 명시하면 이 조건을 만족하는 모든 레코드들이 그 위치가 어디에 있던지간에 하나의 논리적 단위로 취급되고 접근되는 것이다.

3. 데이터베이스의 구성요소(사용자 입장의 논리적 구성요소)

'데이터베이스'={개체(entities), 관계(relationship)}

1.개체(Entity): 표현하려는 유, 무형 정보의 Object, 정보의 단위(Unit). 즉, 단독으로 존재 가능하며 정보로서의 역할을 한다. 그리고 이런 개체와 개체 사이의 연결 상태가 관계이다. 이 관계는 한 개체를 구성하는 속성 간을 나타내기도 하고(속성 관계), 개체 집합 사이를 나타내기도 한다.(개체 관계)

💙유형:학생, 건물/ 무형: 학과, 수업

💙하나 이상의 속성(Attribute,Field,테이블의 열)으로 구성

(🔅속성은 이름을 가진, 데이터의 가장 작은 논리적 단위다. 예를 들어, 학번 이름을 말한다. 그리고 개체는 그러한 속성들이 모여서 구성 된것으로 학번, 이름을 가지고 있는 학생을 말한다. 속성은 개별적으로는 어떤 정보를 주지는 못하지만 개체를 구성할 때는 큰 의미를 제공한다. 그리고 속성의 값은 시간에 따라 변할 수 있다.)

💙개체 집합(Entity Set):하나 이상의 Type과 Instance의 집합

 ex)Entity Type(학번 학과)vs Entity Instance<학번:123, 학과: 컴공>

💙일반 레코드(=튜플, 테이블의 행)와 대응

**Record Type(필드의 이름으로만 존재)vs Record Instance(필드 value로 표현된 레코드)

❓❔개체 타입과 개체 인스턴스에 대한 간단한 설명❔❓
개체 타입은 하나의 객체(예를 들면 학생)를 구성하는 속성들(학번,학과)로만 기술된 것이고, 개체 인스턴스는 하난의 개체를 나타내는 하나하나의 개체 값이다. 레코드 타입과 레코드 인스턴스 역시 같은 논리로 설명 가능. 즉, 필드 이름으로만 구성된 레코드 정의를 레코드 타입(Record Type)이라 하고, 실제 필드 값(Value)로 구성된 레코드를 레코드 어커런스(record occurance) 또는 레코드 인스턴스(recoed instance)라고 한다.

💙릴레이션:튜플들의 집합

2.관계(Relationship)

1)속성 관계(Attribute Relationship):어느 한 개체를 기술하는 속성들 간의 관계, 한 개체 내에서만 존재, 개체 내 관계

2)개체 관계(Entity Relationship): 개체 집합과 개체 집합 사이의 관계, 개체 외부에 존재, 개체 간(inter-entity)관계

   >>연관된 것들끼리의 관계를 맺어야 연관 검색 가능. 이에 따라 설계를 잘 해야 함

4. 데이터베이스의 구조

💫Instance들은 처리를 위해 물리적 저장 장치 위에 저장되어야 하는데, 이 저장 구조를 사용자 입장에서 보느냐, 시스템 입장에서 보느냐에 따라 나눠지는 데이터베이스의 구조이다.

1)논리적 구조: 사용자의 관점에서 본 데이터의 개념적, 가상적 구조

◼데이터의 논리적 배치
◼논리적 레코드
◼일반 응용 프로그램은 이 데이터베이스의 논리적 구조의 일부만 접근해서 사용하는게 보통

2)물리적 구조:저장(시스템) 관점에서 본 데이터의 물리적 배치, 실제 물리적 구조

◼저장 장치에 포함된 데이터의 실제 구조
◼추가 정보를 포함(인덱스,포인터 체인,오버플로 구역 등)
◼저장 레코드

3)논리적 구조와 물리적 구조의 관계: 데이터는 데이터베이스의 논리적 구조에 의해 배치되고 물리적 구조에 의해 디스크나 테이프에 저장된다. 이렇게 구현되면서 하나의 논리적 구조에 대해 이것을 구현하는 물리적 구조는 다를 수 있고, 여러 가지 경우가 될 수도 있다. 하지만 하나의 데이터베이스를 표현하는 논리적 구조와 물리적 구조는 서로 대응관계를 가지고 동등성을 유지한다.

Dev.choi

웹앱 공부 중입니다.

다음 포스트