[컴퓨터 공학] 기초

omegle·2022년 11월 30일
0
post-thumbnail

컴퓨터 구조


컴퓨터는 단순히 "하드웨어 + 소프트웨어"의 형태.

  • 하드웨어: 전자 회로 및 기계 장치로 되어 있어 입출력 장치, 중앙처리장치(CPU), 기억장치 등으로 구성됨.
  • 소프트웨어: 하드웨어 위에서 하드웨어를 제어하며 작업을 수행하는 프로그램.

컴퓨터의 기본 구조


1. 입력 장치

컴퓨터가 처리할 수 있는 형태로 데이터와 명령을 받아들이는 물리적인 장치

  • 키보드
  • 마우스
  • 스캐너와 타블렛
  • 조이콘 등등

2. 출력 장치

처리된 데이터를 사람이 이해할 수 있는 형태로 출력하는 물리적인 장치

  • 모니터
  • 프린터

3. 중앙처리장치(CPU)

1. 종류

  • 산술/논리 연산 장치(ALU): 산기, 보수기, 누산기, 기억 레지스터, 데이터 레지스터 등으로 구성
  • 제어 장치: 프로그램에 따라 명령과 제어 신호를 생성하여 각종 장치의 동작을 제어함.
  • 레지스터: CPU의 내부 메모리로서 CPU에서 사용하는 데이터를 일시적으로 저장하는 장소
    - 범용 레지스터: 산술 연산 논리장치에 의해 사용됨
    - 전용 레지스터: PC 등 특수 목적에 사용됨

2. 기능

CPU의 기능은 명령어와 데이터에 관련이 있다.
명령어 인출 및 해독은 모든 명령어들에 대하여 공통적으로 수행하며 기억 장치로부터 명령어를 읽어온다.
그리고 데이터 인출 및 처리, 쓰기와 같은 것들은 명령어에 따라 필요할 때만 수행한다.
이 명령어 및 명령어 수행 과정과 처리 방식은 CPU에서 중요한 부분을 차지한다.

2-1. 명령어

명령어는 시스템이 특정 동작을 수행시키는 작은 단위.
명령어는 코드로 되어 있는데, 동작코드오퍼랜드로 구성된다.
(1) 동작 코드(Op-code): 각 명령어의 실행 동작을 구분하여 표현한다.
(2) 오퍼랜드(Operand): 명령어의 실행에 필요한 자료나 실제 자료의 저장 위치를 의미한다.

2-2. 명령어 수행 과정

CPU 가 하나의 명령을 처리하는 과정은 다음과 같다.

  • 읽기(FI): 메모리에서 명령을 가져온다.
  • 해석(DI): 명령을 해석한다.
  • 실행(EI): 명령을 수행한다.
  • 기록(WB): 수행한 결과를 기록한다.

4. 저장 장치

- 주 기억 장치

데이터나 프로그램을 보관하기 위한 일차 기억 장치로 프로그램 수행을 위해 필요한 정보에 비해 중앙처리장치 내에 구비되어 있는 레지스터의 용량이 너무 작기 때문에, 주 기억 장치는 주로 정보를 저장해 두었다가 필요할 때 읽어들이는 저장소로 사용이 된다.

  • RAM
  • ROM

- 보조 기억 장치

주 기억 장치를 보조하기 위해 있고, 기억된 내용을 읽는 속도는 느리지만 대용량의 기억 가능

  • 자기 디스크: 플로피 디스크, 하드 디스크
  • 광 디스크: CD, DVD
  • 플래쉬 메모리: USB, SSD

2. Memory


컴퓨터에서 말하는 메모리는 기억소자 즉 반도체를 의미하는데, 반도체는 특성상 전류를 흐르게도 하고 흐르지 않게도 하는 특징이 있어 이를 이용해서 임시적인 내용들을 기억하게 만드는 것.

메모리 분류별 특성

기억장소라는 개념에서 확장하면 저장 장소라는 개념의 하드디스크, CD/DVD, USB 저장장치와 같은 보조 기억장치까지를 의미한다.
이런 보조 기억장치와 메모리의 차이는 “휘발성”인데, 메모리는 시스템이 활성화 된 상태에서 그 값을 기억하고 있지만 시스템이 꺼지게 되면(ShutDown) 지워지게 된다. 그에 비해 보조 기억장치는 시스템이 꺼져도 기억하고 있는 값이 휘발되지 않는다. 또한 저장/읽기 속도 면에서 메모리와 보조 기억장치는 현저하게 차이가 난다.

메모리 성능

메모리의 속도는 메모리가 CPU와 데이터를 주고받는 시간
이를 액세스라 부르며 단위는 ns(nano-second) – 10억분의 1초로써 메모리 속도의 기준이 된다.
메모리의 성능은 속도가 빠를 수록 성능이 좋다고 말할수 있다.

  • 리프레시 시간: 메모리에서 한번 읽고 나서 다시 읽을 수 있는 사이 시간
  • 메모리 액세스 시간: 데이터를 읽어오라는 명령을 받고 데이터를 읽기 시작하기까지의 시간
  • 사이클 시간(리프레시 시간 + 메모리 액세스 시간)
    : 메모리 작업이 완료와 동시에 대기 신호를 내놓은 후 다음 신호를 받을 준비가 되었다는 신호를 주기까지의 시간을 의미한다.

메모리 종류

주 기억 장치: RAM과 ROM
보조 기억 장치: 자기 디스크, 광디스크, 플래시 메모리

주 기억 장치

1. RAM(Random Access Memory)
  • 컴퓨터가 꺼지면 내용이 휘발됨. -> 보조 저장 장치가 반드시 필요함.
  • RAM의 크기는 프로그램의 수행 속도에 영향을 줌.
  • CPU에서 직접 접근이 가능한 유일한 저장 장치
  • 종류: SRAM과 DRAM, SRAM은 리프레쉬가 필요 없고 전력 소모가 적으나 비싸며, DRAM은 리프레쉬가 필요하고 SRAM보다 저가이며 많이 사용됨.
2. ROM(Read Only Memory)
  • 전원이 끊겨도 내용이 보존됨

보조기억장치

1. 자기 디스크

원판 표면의 철 입자의 방향(N/S극)으로 0과 1을 표현한다.
디스크 드라이브는 자기 디스크로부터 데이터를 읽는 주변 장치를 의미한다.
자기 디스크에는 플로피 디스크(FDD)와 하드 디스크(HDD)가 존재한다.

2. 광 디스크

광 디스크(optical disc, OD)는 빛의 반사를 이용하여 자료를 읽어내는 저장 매체.
1세대인 CD부터 시작해 2세대 DVD를 거쳐 3세대인 블루레이 디스크까지 존재함.
차세대 디스크로는 테라 디스크나 HVD등이 존재함.

3. 플래시 메모리

전자적으로 데이터를 지우고 쓸 수 있는 비휘발성 메모리로 충격에 강하여 휴대용 기기에 널리 쓰인다.
플래시 메모리에는 USB와 SSD가 존재하고 있으며, SSD는 HDD와 달리 디스크, 헤더와 같은 기계적 장치는 빠졌지만 저전력, 저소음, 저중량이라는 특징을 가지고 잇음.

캐시 메모리(Cache Memory)

CPU 내 또는 외에 존재하는 메모리로써, 메인 메모리와 CPU 간의 데이터 속도 향상을 위한 중간 버퍼 역할을 한다.
CPU와 메인 메모리 사이에 존재한다고 말할 수 있는데, CPU 내에 존재할 수도 있고 역할이나 성능에 따라서는 CPU 밖에 존재할 수도 있다.
특히 빠른 CPU의 처리속도와 상대적으로 느린 메인 메모리에서의 속도의 차이를 극복하는 완충 역할을 해준다.
쉽게 표현하면 CPU는 빠르게 일을 진행하고 있는데, 메인 메모리가 데이터를 가져오고 가져가는 게 느려서 캐시 메모리가 중간에 미리 CPU에 전달될 데이터를 들고 서 있는 형태라고 생각할 수 있다.


운영체제(OS)


운영체제 목적 및 기능

  • 프로세서, 기억장치, 입출력장치, 파일 및 정보 등의 자원을 관리함.
  • 자원을 효율적으로 관리하기 위해 자원의 스케줄링 기능을 제공함.
    (스케줄링: 어떤 자원을 누가, 언제, 어떤 - 방식으로 사용할지를 결정해주는 것)
  • 사용자와 시스템 간의 편리한 인터페이스를 제공함.
  • 시스템의 각종 하드웨어와 네트워크를 관리하고 제어함.

운영 체제의 시스템 자원 관리

  • 프로세스 관리(CPU)
  • 메모리 관리
  • I/O(입출력) 관리 (디스크, 네트워크 등)

응용 프로그램 관리

응용 프로그램: 운영체제를 통해 컴퓨터에게 일을 시키는 것

응용 프로그램이 운영체제를 통해 컴퓨터에게 일을 시키려면 권한을 받아야한다. 받고 난 후에는, 운영체제가 제공하는 기능을 이용할 수 있다.
응용 프로그램이 운영체제와 소통하기 위해서는, 운영체제가 응용 프로그램을 위해 인터페이스(API)를 제공해야 한다.다.
시스템 콜(System call): 응용 프로그램이 시스템 자원을 사용할 수 있도록, 운영체제 차원에서 다양한 함수를 제공하는 것

프로세스

프로그램이 실행 중인 상태로 특정 메모리 공간에 프로그램의 코드가 적재되고 CPU가 해당 명령어를 하나씩 수행하고 있는 상태.
운영 체제에서는 프로세스를 사용하여 프로그램을 수행하게 되는데 실행 중인 하나의 애플리케이션을 프로세스라고 부름.

프로세스 구성 요소

  • 유저 메모리 영역: 프로세스마다 독립적으로 가지게 되는 공간
  • 핸들 테이블: 프로세스에서 사용하는 모든 핸들에 대한 커널 객체 포인터 정보를 배열 형태로 가지고 있는 공간
  • 유저 메모리 영역(Virtual Address Descriptors) 관리
    프로세스 별로 독립적인 유저 메모리 영역을 관리하기 위해서 VAD(Virtual Address Descriptors)라는 관리 테이블이 존재한다.

  • 핸들 테이블(Handle Table) 관리
    프로세스가 종료하게 될 때 이 테이블의 정보를 참고하여 이 프로세서에서 사용하고 있는 모든 커널 객체를 자동으로 반환한다.

  • 독립적인 메모리 공간
    프로세스 단위로 관리되는 자원 중 가장 중요한 구별점은 가상 메모리.
    페이징 기법을 이용하여 프로세스마다 별도의 고유한 메모리를 사용할 수 있게 하고 있다(윈도우의 경우).

프로세스 특징

  • 자원 소유의 단위
    각각의 프로세스는 자신의 실행 이미지 로드와 실행에 필요한 추가적인 메모리 공간을 가지고 있어야 한다.
    이것은 각 프로세스마다 구별되어야 하며 해당 프로세스가 접근하고자 하는 파일, I/O 장치들에 대해서 또한 프로세서 단위로 할당 받아 관리되어야 한다.
  • 디스패칭의 단위
    프로세스는 하나의 프로그램이 운영체제로부터 CPU의 자원을 일정 기간 동안 할당 받아 명령어를 실행하는 것이며, 운영체제는 여러 개의 프로세스가 병렬적으로 실행되게 하기 위해서 CPU의 사용 시간을 각각의 프로세스에 골고루 나누어 주어야 한다. 하나의 프로세스에서 여러 개의 디스패칭 단위가 실행될 수 있도록 하고 있으며, 이러한 디스패칭 단위를 스레드라 부릅니다.

프로세스 상태

실행(Run) : 프로세스가 프로세서를 차지하여 서비스를 받고 있는 상태
준비(Ready) : 실행될 수 있도록 준비되는 상태
대기(Waiting) : CPU의 사용이 아니라 입출력의 사건을 기다리는 상태

프로세서 VS 프로세스

프로세서와 프로세스는 엄밀히 다른 존재.

프로세서(Processor)

프로세서는 하드웨어적인 측면과 소프트웨어적인 측면으로 나누어 볼 수 있다.

  • 하드웨어적인 측면 : 컴퓨터 내에서 프로그램을 수행하는 하드웨어 유닛으로, 중앙처리장치(CPU)를 의미하며 적어도 하나 이상의 ALU와 레지스터를 내장하고 있다.
  • 소프트웨어적인 측면 : 데이터 포맷을 변환하는 역할을 수행하는 데이터 처리 시스템을 의미한다. 워드프로세서나 컴파일러 등이 여기에 속한다.

프로세스(Process)

프로세스는 특정 목적을 수행하기 위해 나열된 작업의 목록을 의미한다. 메모리에 적재 되어 프로세서에 의해 실행 중인 프로그램을 프로세스라고 볼 수 있다.


스레드

정의 및 특징

  • 명령어가 CPU 를 통해서 수행되는 객체의 단위
  • 하나의 프로세스 내에는 반드시 1개 이상의 스레드가 존재하며, 이러한 스레드는 같은 프로세스에 있는 자원과 상태를 공유함
  • 같은 프로세스 내에 있는 스레드는 같은 주소 공간에 존재하게 되며 동일한 데이터에 접근할 수 있다.
  • 하나의 스레드가 수정한 메모리는 같은 메모리를 참조하는 스레드에 영향을 미친다.
  • 프로세스가 종료되면 그 프로세스에 속해있던 스레드도 함께 종료된다.

스레드는 왜 필요한가?

하나의 프로세스 안에서 여러 개의 루틴을 동시에 수행하여서 수행 능력을 향상하려고 할 때 스레드를 사용하게 되는데,
독립적으로 수행하여 처리하려고 할 때 사용하게 된다. 즉 여러 개의 작업 단위로 구성된 프로그램에서 요청을 동시에 처리하기 위함이다.
예를 들어, 워드 프로세서에서 사용자로부터 키보드를 입력 받거나, 그래픽이나 UI를 그리고 문법 오류를 체크하는 등 워드 프로세서 내에서 여러 요청들을 동시에 처리해야 하는데, 이때 스레드가 필요하게 된다.

스레드의 구성요소

  • 가상 CPU
  • 수행 코드
  • 처리 데이터

가상 CPU

: 인터프리터, 컴파일러에 의해 내부적으로 처리되는 가상 코드

수행 코드

: Thread Class에 구현되어 있는 run() Method 코드

처리 데이터

: Thread에서 처리하는 데이터

스레드의 특징

프로세스 내에서 실행되는 흐름의 단위이고, 하나의 스레드는 시작해서 종료할 때까지 한번에 하나씩 명령들을 수행한다.
각 스레드마다 call stack이 존재(call stack: 실행 중인 서브루틴을 저장하는 자료 구조)하며, 나머지 Code, Data, Heap 영역은 스레드끼리 공유한다.
반면에 프로세스는 다른 프로세스의 메모리에 직접 접근할 수 없다.
스레드는 다른 스레드와 독립적으로 동작한다. 따라서 두 개 이상의 스레드가 동작되는 경우, 두 개 이상의 스레드의 실행 및 종료순서는 예측할 수 없다.

싱글 스레드와 멀티 스레드

싱글 스레드(Single-Thread)

프로세스가 단일 스레드로 동작하는 방식으로 일련의 처리를 단일 스레드만으로 직렬 처리하는 프로그래밍 방법.
하나의 레지스터, 스택으로 표현. 자바스크립트가 가장 대표적인 싱글 스레드 언어임!

싱글 스레드의 장점

  • 자원 접근에 대한 동기화를 신경쓰지 않아도 된다.
    여러 개의 스레드가 프로세스의 자원을 공유할 경우,각 스레드가 원하는 결과를 얻게 하려면 공용 자원에 대한 접근을 제어해야 한다. 쉽게 말해서, 모든 스레드가 일정 자원에 동시에 접근하거나, 똑같은 작업을 실행하려는 경우,에러가 발생하거나 원하는 값이 나오지 않는다. 그래서, 스레드들이 동시에 같은 자원에 접근하지 못하도록 제어해줘야만 한다.
    자원 접근에 대한 동기화를 신경쓰지 않아도 되므로,
  • 문맥 교환(context switch) 작업 또한 요구하지 않는다.
    문맥 교환은 여러 개의 프로세스가 하나의 프로세서를 공유할 때 발생하는 작업으로 많은 비용을 필요로 한다.
    프로그래밍 난이도가 쉽고, CPU 메모리를 적게 사용한다.

싱글 스레드의 단점

  • 여러 개의 CPU를 활용하지 못한다.
    싱글 스레드는 하나의 물리적 코어밖에 사용하지 못해 멀티 코어 머신에서 CPU 사용을 최적화할 수 없다. 최적화를 위해선 Cluster 모듈을 이용하여 여러 프로세스를 사용할 수 있다. 하지만 앞서 프로세스끼리의 자원 공유는 어렵기 때문에 Redis와 같은 부가 인프라가 필요하다.
    연산량이 많은 작업을 하는 경우, 그 작업이 완료되어야 다른 작업을 수행할 수 있다.
    싱글 스레드 모델은 에러 처리를 못하는 경우 멈춰버리게 된다. 멀티 스레드 모델은 에러 발생 시 새로운 스레드를 생성하여 극복할 수 있다.

멀티 스레드

멀티 스레드: 하나의 프로세스 내에서 둘 이상의 스레드가 동시에 작업을 수행하는 것.
멀티 프로세스: 여러 개의 CPU를 사용하여 여러 프로세스를 동시에 수행하는 것.
시스템 자원의 활용 극대화 및 처리량 증대할 수 있어 단일 프로세스 시스템의 효율성을 높일 수 있습니다.

멀티 스레딩의 장점

  • 실시간으로 사용자에게 응답할 수 있다.
    싱글 스레드인 경우, 작업이 끝나기 전까지 사용자에게 응답하지 않지만 반면 멀티스레드인 경우 작업을 분리해서 수행하므로 실시간으로 사용자에게 응답할 수 있다.
  • 효율적이다.
    싱글 스레드인 경우 한 프로세스는 오직 한 프로세서에서만 수행 가능하지만 반면 멀티 스레드인 경우 한 프로세스를 여러 프로세서에서 수행할 수 있으므로 훨씬 효율적.

멀티 스레딩의 단점

  • 주의 깊은 설계가 필요하며, 디버깅이 까다롭다.
  • 단일 프로세스 시스템의 경우 효과를 기대하기 어려우며 다른 프로세스에서 스레드를 제어할 수 없다.(즉, 프로세스 밖에서 스레드 각각을 제어할 수 없다.)
  • 멀티 스레드의 경우 자원 공유의 문제가 발생, 하나의 스레드에 문제가 발생하면 전체 프로세스가 영향을 받게 된다.
  • 문맥 교환 작업을 요구한다.
    문맥 교환(Context Switching): 다른 태스크(프로세스, 스레드)가 시작할 수 있도록 이미 실행 중인 태스크(프로세스, 스레드)를 멈추는 것을 말함

동시성과 병렬성의 차이


동시에 돌릴 수 있는 스레드 수는 컴퓨터에 있는 코어 개수로 제한됨.
운영체제(또는 가상 머신)는 각 스레드를 시간에 따라 분할하여, 여러 스레드가 일정 시간마다 돌아가면서 실행되도록 하는데 이런 방식을 시분할이라고 한다.

  • Concurrency(동시성, 병행성): 여러 개의 스레드가 시분할 방식으로 동시에 수행되는 것처럼 착각을 불러일으킴
  • Parallelism(병렬성): 멀티 코어 환경에서 여러 개의 스레드가 실제로 동시에 수행됨
profile
JANG EUN JI | 장은지

0개의 댓글