레지스터
#일시적인, 임시적 보관
처리 중인 데이터나 처리 결과를 임시 보관하는 기능을 하며 산술 연산이나 정보 해석, 전송 등을 할 수 있는 일정 길이의 정보를 저장하는 cpu내부의 초고속 기억장치
레지스터의 종류
- PC (Program Counter) : 다음에 인출할 명령어의 주소를 가지고 있는 레지스터
- MAR (Memory Address Register) : 메모리 주소를 일시적으로 저장하는 레지스터
- MBR (Memory Buffer Register) : 기억장치에 쓰여질 데이터 혹은 기억장치로부터 읽혀진 데이터를 임시저장하는 레지스터
- IR (Instruction Register) : 가장 최근에 인출된 명령어 코드가 저장되어 있는 레지스터
, 메모리로부터 읽혀진 명령어의 오퍼레이션 코드
, 메모리로부터 읽은 명령어를 임시 저장
- AC (Accumulator) : 데이터나 연산결과를 일시적으로 저장하는 레지스터
인터럽트 (Interrupt)
프로그램 실행 중 cpu의 현재 처리 순서를 중단시키고 다른 동작을 수행하도록 요구하는 시스템 동작
인터럽트 발생원인
1) 기계적인 문제
2) 프로그램 상의 문제
3) 컴퓨터 조작자의 의도적인 조작에 의한 중단
4) 입출력 장치들의 동작에 cpu의 기능이 요청된 경우
5) 산술연산 overflow, underflow 발생
인터럽트 유형
인터럽트 우선순위 체제 구현
폴링 (Polling)
인터럽트 체제 구현방식 중 소프트웨어에 의한 우선순위 구현방식
- 장점
- 소프트웨어 수정을 통한 우선순위 변경이 쉽다.
- 회로가 간단하고 융통성있으며 별도의 하드웨어 불필요
- 단점
- 많은 인터럽트가 있을 때 처리시간이 오래걸린다.
하드웨어 방식
- 직렬 연결 - 하나의 회선 / 단점 : 우선순위가 낮은 장치들이 서비스를 받지 못하는 경우가 발생
- 병렬 연결
명령어 수행 과정
인출 (IF Instrcution) -> 해독 (DI Decoding) -> 실행(EI Excution) -> 저장 (WB Write Back)
지역성, 구역성, Locality
프로세스가 실행되면서 특정 메모리 페이지를 일정 시간동안 집중적으로 액세스 하는 현상
DMA (Direct Memory Access)
CPU에 의한 프로그램의 실행 없이 자료의 이동을 하는 방식
입출력 속도 향상 가능, CPU와 주변 장치간의 속도 차를 줄일 수 있다.
시스템 소프트웨어
- 운영체제
- 하드웨어와 소프트웨어 자원을 관리하고 컴퓨터 프로그램을 위한 공통 서비스를 제공하는 프로그램
- 어셈블러
- 컴파일러
- 고급 언어로 작성한 원시 프로그램을 기계어로 바꾸어 주는 프로그램
- 인터프리터
- 고급 언어나 코드화된 중간언어를 입력받아 목적 프로그램 생성 없이 직접 기계어를 생성하여 실행해주는 프로그램
- 전처리기
- 원시 프로그램을 번역하기 전에 미리 언어의 기능을 확장한 원시 프로그램을 생성하는 시스템 프로그램
- 링커
- 로더
- 실행 가능한 프로그램을 기억장치로 적재하는 역할
로더
로더의 단계별 동작
Allocation (할당) - 기억장소를 할당받는 기능
Linking (링킹) - 공유 가능하도록 링크하는 기능
Relocation (재배치) - 상대주소를 할당된 메모리의 절대주소로 변환하는 기능
Loading (적재) - 주기억장치에 적재
로더의 종류
- 컴파일 즉시 로더
- 가장 간단한 방법
- 번역기가 로더의 역할까지 담당
- 로더의 기능
- 절대 로더
- 출력결과는 보조 기억장치에 저장
- 기계어 코드 프로그램에서 미리 지정한 번지에 프로그램과 데이터를 직접 적재
- 프로그래머가 어셈블러에게 적재주소 지정
- 재배치 로더
- 적재 모듈을 주기억장치에 적재
- 상대주소를 절대 주소로 변경
- 링킹 로더
- 배치 링크 및 적재를 한꺼번에 수행
- 두 단계의 패스로 구성(패스1, 패스2)
- 동적 로더
- 재배치 로더와 링킹 로더의 단점 보완
- cpu가 현재 사용 중인 부분만 로드, 미사용 중인 프로그램은 보조기억장치에 저장해 두는 방식
- 서브루틴들의 상호 호출관계 파악
- load-on-call
운영체제
사용자가 하드웨어를 편리하게 사용하도록 인터페이스를 제공하는 소프트웨어
운영체제 유형별 특징
- 다중 프로그램 시스템 (멀티프로그래밍)
: CPU의 효율을 극대화하기 위해 여러 개의 프로그램이 마치 동시에 실행되는 것처럼 처리하는 방식
- 시분할 시스템 (Time Sharing System)
: 프로세서 스케줄링과 다중 프로그래밍을 사용해 각 사용자에게 컴퓨터를 시간적으로 분할 사용
- 분산처리 시스템
: 시스템마다 운영 체제와 메모리를 가지고 독립적으로 운영되며 필요할 때 통신하는 시스템
- 다중 처리 시스템
: 마이크로 프로세서 여러개를 연결해 다중 프로세서를 생성
: 동시에 프로그램을 수행할 수 있는 CPU를 두 개 이상 두고 각각 그 업무를 분담하여 처리할 수 있는 방식
- 일괄 처리 시스템
: 일정량의 데이터를 모아서 한꺼번에 일괄처리하는 방식
- 실시간 처리 시스템
: 데이터에 대한 처리요구 발생시 즉시 처리 응답
리눅스/유닉스 기본 명령어
- chmod : 파일이나 디렉토리의 접근권한을 변경하는 명령어, read, write, execute 권한을 추가 또는 제거한다.
- du : 현재 디렉토리 아래의 디스크 사용현황을 출력하는 명령어
- fork : 현재 프로세스에 대해 자식 프로세스를 생성하는 함수
- cat : 파일의 내용을 보는 명령어
- Is : 디렉토리와 파일 목록을 출력한다.
- cd : 지정한 디렉토리로 이동하는 명령어
- cp : 파일을 지정한 경로에 복사하는 명령어(copy)
쉘(shell)
unix에서 컴퓨터 내부를 관리하는 Kernel과 사용자 간의 인터페이스를 담당한다.
파이프라인 기법
단위시간 내에 하나 이상의 명령어를 병렬처리함으로써 Performance를 향상시키는 멀티프로세스 환경에서 명령어 처리 메커니즘
단위시간 내에 하나 이상의 명령어를 중첩 수행하여...
- 단일
- Super 파이프라인
- Super Scalar
- Super pipelined Scalar
- VLIW
Flynn의 컴퓨터 시스템 분류 제안
명령어와 데이터의 흐름 개수에 따라 단일명령어/단일데이터흐름, 다중명령어/다중데이터흐름, 단일명령어/다중데이터흐름, 다중명령어/단일데이터흐름으로 분류한다.
분산 컴퓨팅 구조 분류
- 성(星)형
- 버스형
- 트리형
- 환형
- 완전 연결 구조
- 부분 연결 구조
페이징 기법
- 기억장치 내의 프로그램과 데이터를 고정되게 분할한 용량(페이지)를 주기억장치에 사상시키는 기법
- 외부단편화 해결 가능, 내부단편화 발생
- 실제 페이지 주소랑 다르기 때문에 매핑 필요하다
세그먼테이션 기법
- 가상기억장치 내의 프로그램과 데이터를 각 세그먼트가 주기억장치에 적재될 때마다 필요한 서로 다른 크기의 세그먼트로 분할
- 메핑 테이블 유지
항목 | 페이징 | 세그먼테이션 |
---|
할당단위 | 고정 | 가변 |
적재단위 | 프로그램 일부적재 | 프로그램 전체 적재 |
장점 | ✔외부단편화 없음 ✔교체시간이 짧다 | ✔코드,데이터 공유가 용이 ✔내부단편화가 최소화 된다 |
단점 | ❌Thrashing문제가 심각하다 ❌내부단편화 코드나 데이터 공유 논란 | ❌외부단편화가 발생한다 ❌주기억장치가 커야한다 ❌교체시간이 길어진다 |
페이지 교체 알고리즘
- 무작위 페이지 교체
: 특별한 사용자에게 차이를 두지 않고 교체하는 기법
: 교체할 페이지를 무작위로 선정
: 오버헤드가 적은 기법
: 바로뒤에 참조될 페이지도 교체 가능
- FIFO 선입선출
: 메모리에 올라온지 가장 오래된 페이지를 교체
: FIFO 이상현상 발생 - 프로세스에 더 많은 페이지를 할당할 경우 더 많은 페이지 부재가 발생하는 현상
- OPR(Optimal Page Replacement) 최적 페이지 교체
: 앞으로 가장 오랫동안 사용되지 않을 페이지를 찾아서 교체
: FIFO의 모순 해결
: 최소 페이지 부재율을 가지나 구현이 비현실적이다
- LRU(Least Recently Used) 최저 사용 빈도 (최근에 적게 사용한...)
: 가장 오랫동안 사용되지 않을 페이지를 교체
: 호출시간을 기록해야 하는 오버헤드가 발생하나 효율적이다
- LFU (Least Frequently Uset) 최소 사용 빈도
: 사용빈도가 가장 적은 페이지를 교체하는 방법
: 구역성 문제가 발생한다
- NUR (Not Uset Recently) 최근 사용 전무
: 최근에 사용되지 않은 페이지를 교체하는 기법
: 참조비트, 변경비트 사용
: LRU 시간 오버헤드 해결
가상 메모리/ 가상 기억장치 (Virtual Memory)
물리적인 메모리 용량보다 더 큰 용량의 프로그램을 실행할 수 있도록 보조 기억장치용량에 해당하는 용량만큼 메모리 용량을 확장하여 사용할 수 있도록 하는 기법
가상 메모리 관리 정책
- 할당정책
- 호출정책
- 배치정책
- First Fit
- Best Fit
- Worst Fit
- 교체정책
스래싱(Thrashing) 방지 기법
프리페이징 (Prepaging)
모든 페이지를 한번에 페이지 프레임에 적재하는 방법
워킹세트 (Working Set)
하나의 프로세스에 자주 참조되는 페이지를 모아놓은 기법으로 그 집합에 속하지 않는 페이지를 교체
페이지 프레임 조정
현재 페이지 부재와 바로 전 페이지 부재 사이의 시간을 관찰하여 그 시간이 지금까지 최소시간보다 크면 그 사이에 호출되지 않았던 페이지를 모두 제거하는 방법
메모리 인터리빙
연속된 데이터 또는 명령어들을 기억장치 모듈에 순차적으로 번갈아 가면서 처리하는 방식
기억 장치 모듈에 순차적인 접근을 함으로서 접근시간을 최소화하고 성능을 향상
메모리를 복수 개의 모듈로 나누고 각 모듈에 연속적인 주소를 부여하여 동시에 접근이 가능하게 하는 기법
종류
1) 상위 인터리빙
2) 하위 인터리빙
3) 혼합 인터리빙
교착상태
다중 프로세스 환경 하에 서로 다른 프로세스가 각자 자신이 소유하고 있는 자원을 포기하지 않고, 상대 프로세스의 자원을 무한 대기하고 있는 상태
교착상태 발생 조건
상점비환
- 상호배제
: 프로세스가 자원을 배타적으로 점유하여 다른 프로세스가 그 자원을 사용할 수 없다
- 점유와 대기
: 한 프로세스가 자원을 점유하고 있으면서 또 다른 자원을 요청하여 대기하고 있는 상태
- 비 선점
: 한 프로세스가 점유한 자원에 대해 다른 프로세스가 선점할 수 없고, 오직 점유한 프로세스만이 해제 가능
- 환형대기(Circular wait)
: 원처럼 뺑뺑도는 것
위의 4가지 조건이 동시에 성립되어야 교착상태가 발생한다.
은행가 알고리즘 (Banker's Algorithm)
프로세스가 자원을 요구할 때 시스템은 자원을 할당한 후헤도 안정상태로 남아있게 되는 지를 사전에 검사하여 교착상태의 발생을 회피하는 기법
교착상태 해결 방안
- 예방(Prevention)
: 상호배제, 점유와 대기, 비선점 및 환형대기 조건의 부정
- 회피
: 은행가 알고리즘, wait-die, would-wait 알고리즘
- 발견
: 시스템의 상태를 감시 알고리즘을 통해 교착상태 검사
: 자원할당 그래프, wait for graph
- 회복(Recovery)
: Deadlock이 없어질 때까지 프로세스를 순차적으로 kill하여 제거
임계 영역
여러 개의 프로세스가 공유하는 데이터 및 자원에 대해 어느 한 시점에는 하나의 프로세스만 사용하도록 지정된 공유 영역
상호 배제 해결방안
소프트웨어적 해결방안
- 데커 알고리즘
- 피터슨 알고리즘
- 램포트 베이커리 알고리즘 : 분산처리 환경에서 유용한 상호배제 알고리즘
- 세마포어 : P(S) -> S-1 / V(S) -> S+1
하드웨어적 해결방안
- 인터럽트 사용금지
- Test and Set
- 소프트웨어 ap
i-node
UNIX의 파일시스템에서 각 파일에 대한 정보를 기억하는 약 120byte 고정된 크기의 자료구조의 이름
i-node 포함 정보
소유자정보
접근정보
파일정보
데이터가 저장된 블록의 시작주소를 포함한 파일이나 디렉토리의 모든 정보를 포함
디스크 스케줄링
운영체제가 디스크를 읽거나 쓰려는 요청을 받았을 때, 우선순위를 정해 관리하는 기법
- 이동식 디스크 스케줄링
- FCFS (First come First served)
: 요청 큐에 들어온 순서대로 처리
- SSTF (Shortest Seek time First)
: 현재 헤드 위치에서 가장 가까운 트랙의 요청 처리
- SCAN (엘리베이터 알고리즘)
: 진행방향 상의 가장 가까운 트랙의 요청을 먼저 처리
: C-SCAN은 바깥쪽에서 안쪽으로
- LOOK
: SCAN과 같이 처리하되 처리할 블록이 없으면 끝까지 가지않고 돌아온다.
- 에센바흐 기법
: 헤드는 C-SCAN처럼 움직이며, 예외적으로 모든 실린더는 그 실린더에 요청이 있든 없든 간에 전체 트랙이 한 바퀴 회전할 동안 서비스를 받는다.
- 고정디스크 스케줄링
- SLTF (Shortest Latency Time First) 지연시간이 짧은 거
- SPTF (Shortest Positioning Time First) 먼저 자리 잡은거
- SATF (Shortest Access Time First) 접근 먼저한 거
프로세스
실행 중인 프로그램
스레드
프로세스나 태스크보다 더 작은 단위,
실행 환경을 공유시켜 문맥교환의 부하를 줄이고,
기억장소의 낭비를 줄이는 프로그램 단위
다중 프로그래밍 시스템에서 cpu를 받아서 수행하는 프로그램 단위이다.
프로세스 상태
- 생성 상태
- 준비 상태
- 실행 상태
- 대기 상태
- 완료 상태
스케줄링 기법
cpu를 사용하려고 하는 프로세스들 사이의 우선순위를 관리하는 작업
선점형 스케줄링
: 현재 프로세스를 중단시키고 cpu를 점유
장점 - 비교적빠름, 대화식 시분할 시스템에 적합
- 라운드 로빈
- SRT
- 다단계 큐
- 다단계 피드백 큐
: FIFO와 PR 합친거, 상위에서 완료되지 못한 작업들은 하위로 전달되며 하위에서는 PR방식을 사용하는 알고리즘
비선점형 스케줄링
: 점유 불가능
장점 - 응답시간 예상이 용이, 모든 프로세스에 대한 요구를 공정하게 처리
- SJF
- FCFS
- Priority
- Deadline
- HRN
SJF (Shortest Job First)
실행시간이 가장 짧은 작업 순으로 CPU 수행하는 비선점 스케줄링 기법
제일먼저 큐에 올라와있으면 뒤에있는게 더 짧은 실행시간이어도 걔는 기다리고 먼저 올라와있는 애부터 시작한다.
반환시간 = 작업 수행시간
대기시간 = 기다린거에서 - 제출시간
HRN (Highest Response-Ratio Next)
SJF의 약점 보완 기법, 실행시간이 긴 프로세스를 차별하고 짧은 프로세스를 지나치게 선호하는 점을 보강한 알고리즘
우선순위 = (대기시간+서비스시간)/서비스시간
분산처리시스템
- 클라이언트/서버 모델
: 비대칭적 분산 시스템 구조
- 프로세서 풀 모델
: 하나이상의 프로세서 풀이 통합된 워크스테이션-서버 모델로 구성
- 혼합 모델
: 위에 두개 합친거, 병렬 수행
분산 운영 체제의 특징
- Reliablity 신뢰성
: 여러 시스템 중 일부 시스템이 고장이 발생하는 경우에도 전체시스템이 정상적으로 운영되는 것
- Resource Sharing 자원 공유
- Transparency
: 물리적인 위치를 알지 못해도 사용 가능
- Expandabilty 확장성
- Autonomy 자율성
NoSQL (Not only SQL)
- 키 값을 이용해 다양한 형태의 저장과 접근이 가능한 데이터베이스
- 수십 대에서 수천 대 규모로 구성된 시스템에서도 데이터의 특성에 맞게 효율적으로 데이터를 검색/처리할 수 있는 데이터베이스이다.
- 대량의 데이터 처리
- 중요하진 않으나 데이터 양이 많고 급격히 늘어나는 정보 저장
- 수평적 확장이 가능하며 다수의 서버들에게 데이터 복제 및 분산저장이 가능하다.
- 읽기보다 쓰기에 집중
- 단순한 모델로 구성이 가능
특징
Schema-less
탄력성
효율적 질의기능
캐싱
저장구조
Key/value Store
Ordered Key/Value store
Document Key/Value Store
RDBMS
- 핵심정보 저장
- 무결성, 정합성, 원자성, 독립성, 일관성
- 복잡한 관계형 모델을 기반으로 구성
- 고정된 스키마를 가지며 조인등을 통해 데이터 검색
데이터베이스 3단계 스키마 구조
외부단계 : 사용자와 가장 가까운 단계
개념단계 : 내부와 외부사이에 위치하는 간접, 중간연결 단계이며, 데이터베이스 전체에 대한 추상적 설명
내부단계 : 물리적인 기억장소와 가장 가까운 단계
ER 모델
개념적 설계 단계에서 사용하는 모델
피터첸
개체, 속성, 관계 등에 대하여 용이하게 표현할 수 있는 ER도형을 정의하고 있다.
후보키 : 유일하게 식별할 수 있는 키들의 집합
슈퍼키 : 유일성은 있고 최소성은 없는 속성
기본키 : 유일한 식별자, 후보키 중에서 선정된 것
외래키 : 한테이블의 키 중 다른 테이블의 튜플을 식별할 수 있다
대체키 : 후보키가 둘 이상 되는 경우에 기본키로 선택되지 못한 후보키들 ( 기본키+대체키 )
도메인
카디널리티 : 튜플(행)의 수
레코드
튜플 : 릴레이션 행을 구성하는 속성 값들의 집합
데이터베이스 키의 특성
1. 유일성 : 하나의 키 값으로 하나의 튜플을 유일하게 식별
2. 최소성
: 속성의 집합인 키가 릴레이션의 모든 튜플들을 유일하게 식별하기 위해 꼭 필요한 속성들로 구성된 것을 의미
데이터베이스 제약조건
- 무결성 제약 조건
: 정확성을 보장하기 위해
- 참조 무결성
: 외래키 값은 그 외래키가 기본키로 사용된 릴레이션과 참조 무결성 제약을 가진다.
: 외래키 속성은 반드시 참조 되어야 한다.
: 외래키가 참조하는 개체의 기본키는 기본키이거나 Null이어야 한다.
- 도메인 무결성
: 특정 속성 값이 미리 정의된 규칙내에서 데이터로 존재해야한다.
관계대수 & 관계해석
관계대수 : 절차적 언어, 그 정보를 검색하기위해 어떻게 유도하는가를 기술
- Select 시그마 (S니까 Sㅣ그마)
- Project 파이 (P니까 Pㅏ이)
- Join 리본 (조이는 리본)
- Division 나누기
관계해석 : 수학의 술어해석에 기반을 두고있으며 비절차적언어
그냥 원하는 정보가 무엇인가만 정의
트랜잭션
데이터베이스의 상태를 변화시키기 위해서 수행하는 최소 작업 단위
특징
- 원자성(Atomicity)
- 일관성(Consistency)
- 고립성(isolation)
- 영속성(Durability)
하나의 트랜잭션은 commit rollback 으로 완료됨
(원일이가 키우는 고영이 이름 트랜잭션)
무결성 제약조건의 종류와 개념
1.개체 무결성 : 기본키는 null 값이 될 수 없음
2.참조 무결성 : 외래키는 참조할 수 없는 값을 가질 수 없음
3. 도메인 무결성 : 특정 속성값은 그 속성이 정의된 도메인에 속한 값이어야 함
4. 키 무결성 : 릴레이션에는 최소한 하나의 키가 존재해야 함
5. null 무결성 : 특정 속성은 null 값을 가질 수 없음
6. 고유 무결성 : 특정 속성값은 서로 달라야 함
데이터베이스 장애 유형
- 트랜잭션 장애
: 내부에서 비정상적인 상황으로 인해 트랜잭션 실행이 중지되는 현상
- 시스템 장애
- 디스크 장애
- 사용자 장애
장애 발생시 회복
회복
: 데이터베이스 트랜잭션 실행중 장애가 발생하여 데이터베이스가 손상되었을 경우 손상되기 이전의 정상상태로 복구하는 작업
- 백업
- Archive 또는 Dump (다른 저장자치로 복사)
- Log 또는 journal (변경내용 기록)
- REDO (트랜잭션 복원)
: 완료된 데이터를 회복하는데 사용
- UNDO (트랜잭션 폐기)
: 수행중인 데이터를 회복하는데 사용
- DBMS 서브 시스템 (회복관리 기능)
데이터베이스 로그기반 회복기법
- 지연 갱신
- 즉시 갱신
- 그림자 페이지
- 검사점
- 미디어 회복
병행제어
다중 사용자 환경에서 여러 트랜잭션을 동시에 실행될 수 있도록 트랜잭션에 대한 직렬성을 보장하는 제어기법
병행제어를 하지 않을때 문제점
- 갱신내용 손실 (lost update)
- 오류 데이터 읽기 (dirty read)
- 모순성 : 데이터들의 값이 상호일치하지 않는 경우
- 연쇄 복귀 또는 회복 불능
병행제어의 기법
- 로킹
: 하나의 트랜잭션에서 사용하는 데이터를 다른 트랜잭션이 접근하지 못하도록 하는 것
- 검증기법
: 트랜잭션 처리 시 먼저 메모리상에서 복사본에 대한 연산을 수행하고 검증 완료시 DBMS에 반영하는 기법
: 직렬성 확인 단계
: 쓰기 단계는 검증 성공시 COMMIT, 실패시 ROLLBACK
- 타임스탬프 기법
: 트랜잭션이 시스템에 들어오는 순서대로 고유값 부여
: 직렬화 기법으로 트랜잭션간의 순서를 미리 정하는 방법
해싱 함수
- 계수분석
: 키 값을 구성하는 숫자의 분포를 파악하여 분포가 비교적 고른 자리부터 필요한 자리만큼 선택하여 레코드 주소를 결졍하는 방법
- 제산법
: 키를 임의의 양의 정수로 나눈 나머지를 그 키의 레코드로 저장하는
- 중간 제곱법
: 키 값을 제곱한 값의 중간 부분 값을 선택하여 레코드 주소로 결정하는 방법
- 폴딩(중첩법) 방법
: 키를 여러부분으로 나누고, 나누어진 각 부분의 값을 모두 더하거나 보수를 취해 더하여 레코드 주소를 결정하는 방법
: 길이를 동일하게 여러부분으로 나누고, 더하거나 XOR하여 주소 이동
- 기수 변환
: 주어진 키 값을 어떤 특정한 진법의 수로 간주하여 다른 진법으로 변환한 후 레코드 주소를 구하는 방법
- 숫자 분석
: 각 숫자의 분포를 이용해서 균등한 분포의 숫자를 선택해서 사용
- 무작위 방법
: 난수발생