TIL. 컴퓨터 공학 (기초)

김은서·2022년 10월 4일
0

TIL

목록 보기
41/49

컴퓨터 구조

컴퓨터의 기본 구조

컴퓨터 구조

컴퓨터는 단순하게 말하자면 하드웨어와 소프트웨어가 합쳐진 형태.
하드웨어: 전자 회로 및 기계 장치로 되어 있어 입출력 장치, 중앙처리장치(CPU), 기억장치 등으로 구성되어 있음.
소프트웨어: 그 하드웨어 위에서 하드웨어를 제어하며 작업을 수행하는 프로그램.

컴퓨터의 기본 구성 요소

컴퓨터는 입력장치(Input), 출력장치(Output)가 갖춰져 있고,
내부에는 연산을 하기 위한 중앙처리장치(CPU), 저장을 하기 위한 주 기억장치와 보조 기억장치를 가지고 있음.

입력 장치

입력장치는 컴퓨터가 처리할 수 있는 형태로 데이터와 명령을 받아들이는 물리적인 장치.
입력 장치에는 다양한 물리적인 장치가 존재하고 있음.
기본적으로는 키보드와 마우스에서부터, 스캐너와 타블렛, 혹은 조이콘 같이 컴퓨터에 연결하여 무언가를 입력할 수 있는 장치를 입력 장치라고 볼 수 있음.

출력 장치

출력장치는 처리된 데이터를 사람이 이해할 수 있는 형태로 출력하는 물리적인 장치.
가장 대표적인 출력장치는 모니터로, 컴퓨터에서 나오는 글자, 그림 등의 결과를 화면에 보여주는 장치.
모니터의 해상도는 화면에 나타나는 그림이나 글자의 선명도를 결정하는 요소인데 실제 화면의 해상도는 모니터와 그래픽 카드에 의해 결정됨.
그리고 프린터 또한 출력 장치에 들어가며 전자 장비에 저장되어 있는 문서를 종이 등에 인쇄하는 장치임.

중앙처리장치

CPU의 내부 구성은 크게 산술/논리 연산 장치(ALU)와 제어 장치, 레지스터로 구성되어 있음.
산술은 덧셈을 수행하는 것이고, 제어 장치는 프로그램에 따라 명령과 제어 신호를 생성하여 각종 장치의 동작을 제어하는 것임.
그리고 레지스터는 CPU의 내부 메모리로서 CPU에서 사용하는 데이터를 일시적으로 저장하는 장소임.

저장 장치

저장장치는 데이터나 프로그램을 보관하기 위한 일차 기억 장치인 주 기억 장치(Memory)와 주 기억 장치를 보조하기 위한 디스크와 씨디 같은 보조 기억 장치가 존재하고 있음.

프로그램 수행을 위해 필요한 정보에 비해 중앙처리장치 내에 구비되어 있는 레지스터의 용량이 너무 작기 때문에, 주 기억 장치는 주로 정보를 저장해 두었다가 필요할 때 읽어들이는 저장소로 사용이 됨.
주 기억 장치의 종류로는 RAMROM이 존재합니다.

그리고 보조 기억 장치는 그런 주 기억 장치를 보조하기 때문에 주 기억 장치에 비해 기억된 내용을 읽는 속도는 느리지만 대용량의 기억이 가능하며 현재 사용하지 않는 프로그램은 보조 기억 장치에 저장됨.
보조 기억 장치의 종류로는 플로피 디스크와 하드 디스크 같은 자기 디스크가 존재하고, CD와 DVD 같은 광 디스크, 그리고 USB와 SSD 같은 플래쉬 메모리가 존재함.

CPU와 Memory

CPU

컴퓨터 시스템을 이루는 구성요소로 CPU, 주기억장치인 메모리 그리고 보조 기억 장치인 디스크와 씨디 등이 있음.
여기에 I/O((입출력장치)까지 추가 된다면 그것을 컴퓨터를 이루는 기본 골격이라고 할 수 있는데, 이것을 제안한 사람이 폰 노이만임.

폰 노이만이 제안한 폰 노이만 구조는, 중앙 처리 장치(CPU)라는 것이 있고 이 중앙 처리 장치를 통해서 연산을 수행하게 되는 구조이며 이 CPU(중앙처리 장치)는 각종 연산을 수행하고 기억장치에 기억되어 있는 명령어들을 수행하는 컴퓨터 시스템을 이루는 핵심 부품임.

CPU의 구조

CPU 의 내부 구성은 크게 산술/논리 연산 장치(ALU), 제어 장치와 레지스터로 구성되어 있습니다. 산술은 덧셈을 수행하는 것이고, 제어 장치는 시그널을 통해서 데이터 흐름을 통제하는 것이며 레지스터는 CPU 내부의 메모리임이 가장 기본적인 설명입니다.

산술/논리 연산 장치 (Arithmetic Logic Unit, ALU)

산술논리연산장치(ALU: Arithmetic Logic Unit)는 산술적인 연산과 논리적인 연산을 담당하는 장치로 가산기, 보수기, 누산기, 기억 레지스터, 데이터 레지스터 등으로 구성 됨.
캐시나 메모리로부터 읽어 온 데이터는 레지스터(Register)라는 CPU 전용의 기억장소에 저장되며, ALU는 레지스터에 저장된 데이터를 이용하여 덧셈, 곰셈 등과 같은 산술 연산을 수행함.
부동소숫연산장치(FPU)와 정수연산장치, 논리연산(AND, OR 등)장치 등이 있음.

레지스터(Register)

레지스터(Register)는 중앙처리장치(CPU) 내부에 있는 기억장치.
주로 산술 연산 논리장치에 의해 사용되는 범용 레지스터(General-Purpose Register)와 PC 등 특수 목적에 사용되는 전용 레지스터(Dedicated-Purpose Register)로 구분할 수 있음.

레지스터의 종류는 IR(Instruction Register), PC(Program Counter), AC(Accumulator)가 있음.

  • IR (Instruction Register) : 현재 수행 중에 있는 명령어 부호를 저장하고 있는 레지스터
  • PC (Program Counter) : 명령이 저장된 메모리의 주소를 가리키는 레지스터
  • AC (Accumulator) : 산술 및 논리 연산의 결과를 임시로 기억하는 레지스터

제어장치(Control Unit, CU)

제어장치는 CPU가 자신 및 주변기기들을 컨트롤하는 장치로, 프로그램의 수행 순서를 제어하는 프로그램 계수기(program counter), 현재 수행중인 명령어의 내용을 임시 기억하는 명령 레지스터(instruction register), 명령 레지스터에 수록된 명령을 해독하여 수행될 장치에 제어신호를 보내는 명령해독기(instruction decoder)로 이루어져 있음.

제어 장치 구현의 방식은 고정 배선 제어(Hardwired) 방식과 Micro Program 방식이 있음.

CPU의 기능

CPU의 기능은 명령어와 데이터에 관련이 있음.
명령어 인출 및 해독은 모든 명령어들에 대하여 공통적으로 수행하며 기억 장치로부터 명령어를 읽어옴.
그리고 데이터 인출 및 처리, 쓰기와 같은 것들은 명령어에 따라 필요할 때만 수행함.
이 명령어 및 명령어 수행 과정과 처리 방식은 CPU에서 중요한 부분을 차지하고 있음.

명령어

명령어는 시스템이 특정 동작을 수행시키는 작은 단위.
명령어는 코드로 되어 있는데, 동작코드(Op-code : Operational Code)와 오퍼랜드(Operand)로 구성되어 있음.

  • 동작 코드(Op-code): 각 명령어의 실행 동작을 구분하여 표현합니다.
  • 오퍼랜드(Operand): 명령어의 실행에 필요한 자료나 실제 자료의 저장 위치를 의미합니다.

명령어 수행 과정

CPU 가 하나의 명령(Operation)을 처리하는 과정은 다음과 같음.

  • 읽기(Fetch Instruction, FI): 메모리에서 명령을 가져옵니다.
  • 해석(Decode Instruction, DI): 명령을 해석합니다.
  • 실행(Execute Instruction, EI): 명령을 수행합니다.
  • 기록(Write Back, WB): 수행한 결과를 기록합니다.

명령어 처리 방식

명령어 처리 방식에는 RISC와 CISC가 있음.
RISC(Reduced Instruction Set Computer)는 컴퓨터 내부적으로 사용하는 명령어 세트를 단순화 시켜서 처리하는 형태의 구조이며, 단순한 명령을 조합해서 하나의 기능을 수행하게 됨.
CISC(Complex Instruction Set Computer)는 하나의 기능에 해당하는 하나의 명령이 있는 개념이라고 생각하시면 됨.

CISC

  • 여러 사이클로 명령어를 처리합니다.
  • 많은 명령어가 메모리를 참조하는 처리 방식입니다.
  • 파이프라이닝의 사용이 어렵습니다.
  • 복잡한 마이크로 프로그램 구조를 갖고 있습니다.

RISC

  • 하나의 사이클로 명령어를 처리합니다.
  • 메모리 Load / Store 명령만 처리하는 방식입니다.
  • 파이프라이닝, 슈퍼스칼라의 사용이 가능합니다.
  • 복잡한 컴파일러 구조를 갖고 있습니다.

Memory

일반적으로 메모리라고 하면 기억이라는 개념임.
컴퓨터에서 말하는 메모리는 기억소자 즉 반도체를 의미하는데, 반도체는 특성상 전류를 흐르게도 하고 흐르지 않게도 하는 특징이 있어 이를 이용해서 임시적인 내용들을 기억하게 만드는 것임.

메모리 분류별 특성

기억장소라는 개념에서 확장하면 저장 장소라는 개념의 하드디스크, CD/DVD, USB 저장장치와 같은 보조 기억장치까지를 의미함.
이런 보조 기억장치와 메모리의 차이는 “휘발성”인데, 메모리는 시스템이 활성화 된 상태에서 그 값을 기억하고 있지만 시스템이 꺼지게 되면(ShutDown) 지워지게 됨.
그에 비해 보조 기억장치는 시스템이 꺼져도 기억하고 있는 값이 휘발되지 않음.
또한 저장/읽기 속도 면에서 메모리와 보조 기억장치는 현저하게 차이가 남.


CPU 와 가장 가까이 있는 레지스터 메모리, 캐시 메모리, 주기억 장치, 보조기억 장치는 각각 그 특성에 차이가 있음.

메모리 성능

메모리의 속도는 메모리가 CPU와 데이터를 주고받는 시간을 말함.
이를 액세스라 부르며 단위는 ns(nano-second) – 10억분의 1초로써 메모리 속도의 기준이 됨.
메모리의 성능은 속도가 빠를 수록 성능이 좋다고 말할수 있음.

  • 리프레시 시간
    메모리는 일정 시간마다 재충전을 해줘야 하는데, 그렇지 않으면 정보는 사라지게 됨. 이 일정기간을 리프레시 시간이라고 함. 이는 메모리에서 한번 읽고 나서 다시 읽을 수 있는 사이 시간을 말함.

  • 메모리 액세스 시간
    메모리 액세스 시간은 데이터를 읽어오라는 명령을 받고 데이터를 읽기 시작하기까지의 시간을 말함. CPU에서 명령어를 처리할 때 명령어가 갖는 주소를 보냄. 그러면 CPU에 그 주소에 해당하는 값을 가져 오게 되는데 걸리는 시간이 액세스 시간임.

  • 사이클 시간(리프레시 시간 + 메모리 액세스 시간)
    사이클 시간은 메모리 작업이 완료와 동시에 대기 신호를 내놓은 후 다음 신호를 받을 준비가 되었다는 신호를 주기까지의 시간을 의미함. 즉 사이클 시간은 메모리 액세스 시간과 리프레시 시간을 더한 것.

메모리 종류

메모리 중 주 기억 장치의 종류로는 RAM과 ROM가, 보조 기억 장치의 종류로는 자기 디스크, 광디스크, 플래시 메모리가 있음.

주기억장치

RAM(Random Access Memory)

  • 컴퓨터의 전원이 끊어지면 내용이 휘발되어 보조 저장 장치가 반드시 필요합니다. RAM의 크기는 프로그램의 수행 속도에 영향을 줍니다. (RAM의 크기가 작으면 게임이 잘 돌아가지 않는 경우를 생각해보세요.) 또한 CPU에서 직접 접근이 가능한 유일한 저장 장치입니다.
  • RAM의 종류에는 SRAM과 DRAM이 있는데, SRAM은 리프레쉬가 필요 없고 전력 소모가 적으나 비싸며, DRAM은 리프레쉬가 필요하고 SRAM보다 저가이며 많이 사용되는 편입니다.
    ROM(Read Only Memory)
  • 대부분 읽을 수만 있는 장치로 구성되어 있으며 전원이 끊겨도 내용이 보존이 됩니다.

보조기억장치

자기 디스크

  • 원판 표면의 철 입자의 방향(N/S극)으로 0과 1을 표현합니다. 디스크 드라이브는 자기 디스크로부터 데이터를 읽는 주변 장치를 의미합니다.
  • 자기 디스크에는 플로피 디스크(FDD)와 하드 디스크(HDD)가 존재합니다.

광 디스크

  • 광 디스크(optical disc, OD)는 빛의 반사를 이용하여 자료를 읽어내는 저장 매체입니다.
  • 1세대인 CD부터 시작해 2세대 DVD를 거쳐 3세대인 블루레이 디스크까지 존재하고 있습니다. 차세대 디스크로는 테라 디스크나 HVD등이 존재합니다.

플래시 메모리

  • 전자적으로 데이터를 지우고 쓸 수 있는 비휘발성 메모리로 충격에 강하여 휴대용 기기에 널리 쓰입니다.
  • 플래시 메모리에는 USB와 SSD가 존재하고 있으며, SSD는 HDD와 달리 디스크, 헤더와 같은 기계적 장치는 빠졌지만 저전력, 저소음, 저중량이라는 특징을 가지고 있습니다.

캐시 메모리(Cache Memory)

캐시 메모리는 CPU 내 또는 외에 존재하는 메모리로써, 메인 메모리와 CPU 간의 데이터 속도 향상을 위한 중간 버퍼 역할을 함.

여기서 ‘Cache’라는 의미는 보관이나 저장의 의미를 가지고 있음.
캐시 메모리는 이러한 역할을 하는 물리적 장치를 말함.
CPU와 메인 메모리 사이에 존재한다고 말할 수 있는데, CPU 내에 존재할 수도 있고 역할이나 성능에 따라서는 CPU 밖에 존재할 수도 있음.

특히 빠른 CPU 의 처리속도와 상대적으로 느린 메인 메모리에서의 속도의 차이를 극복하는 완충 역할을 해줌.
쉽게 표현하면 CPU 는 빠르게 일을 진행하고 있는데, 메인 메모리가 데이터를 가져오고 가져가는 게 느려서 캐시 메모리가 중간에 미리 CPU 에 전달될 데이터를 들고 서 있는 형태라고 생각하면 됨.

캐시 메모리의 성능 결정 요소

캐시 메모리는 메인 메모리의 일정 블록 사이즈의 데이터를 담아 두었다가 CPU에 워드 사이즈 만큼의 데이터를 전송하게 됨.
이때 이 사이즈들이 캐시의 성능에 영향을 미치게 되는데. 블록사이즈나 워드 사이즈가 상대적으로 크다면 그만큼 Cache의 Hit Ratio율이 높아지기 때문임.

CPU가 필요한 데이터가 Cache Memory 내에 들어와 있으면 ‘Cache Hit’라 하고 접근하고자 하는 데이터가 없을 경우를 ‘Cache Miss’라 함.
이러한 원하는 데이터가 있을 수도 있고 없을 수도 있는데, 이때 원하는 데이터가 Cache에 있을 확률을 ‘Hit Ratio’라 함.


표와 같이 캐시 메모리의 성능 결정 요소에는 캐시의 크기 뿐 아니라 다양한 요소들이 관여하고 있음.

운영체제(OS)

운영체제

폰 노이만이 제시한 컴퓨터 모델에 따르면 컴퓨터 시스템은 크게 CPU, 메모리, 디스크로 구성되어 있다고 볼 수 있음.
이 각각의 하드웨어를 연결했다고 해서 우리가 원하는 프로그램을 수행할 수 있는 것은 아님.
하드웨어는 단지 그 하드웨어의 특정 기능을 수행 할 뿐인데, 이 컴퓨터라는 하드웨어 상에 프로그램들이 동작되려면 이 하드웨어들과 적절하게 데이터틀 주고 받으며 논리적인 일들을 해야만 함.

그 하드웨어에게 일을 시키는 주체가 바로 운영체제임.

운영체제의 목적 및 기능

운영체제의 목적은 처리능력 향상, 사용 가능도 향상, 신뢰도 향상, 반환 시간 단축 등에 있으며, 이런 운영체제의 기능은 여러 가지가 있음.

  • 프로세서, 기억장치, 입출력장치, 파일 및 정보 등의 자원을 관리합니다.
  • 자원을 효율적으로 관리하기 위해 자원의 스케줄링 기능을 제공합니다. 스케줄링이란 어떤 자원을 누가, 언제, 어떤 방식으로 사용할지를 결정해주는 것을 뜻합니다.
  • 사용자와 시스템 간의 편리한 인터페이스를 제공합니다.
  • 시스템의 각종 하드웨어와 네트워크를 관리하고 제어합니다.

운영 체제의 시스템 자원 관리

운영체제가 없다면, 응용 프로그램이 실행될 수 없음.
응용 프로그램은 컴퓨터를 이용해 다양한 작업을 하는 것이 목적이고, 운영체제는 응용 프로그램이 하드웨어에게 일을 시킬 수 있도록 도와줌.
하드웨어를 구성하는 일을 하는 CPU, 자료를 저장하는 RAM, 디스크 등의 시스템 자원을 관리하는 주체가 바로 운영체제임.

  • 프로세스 관리(CPU)
  • 메모리 관리
  • I/O(입출력) 관리 (디스크, 네트워크 등)

응용 프로그램 관리

모든 응용 프로그램이 시스템의 자원을 마음대로 사용한다면, 해커에 의한 공격에 무방비한 상태가 됨.
악의적인 목적을 가진 프로그램이 디스크의 모든 민감한 정보에 접근하거나, 내 스마트폰의 특정 앱이 카메라를 아무 때나 실행해서 촬영한다고 생각하면 끔찍함.
따라서, 응용 프로그램은 권한에 대한 관리가 필요함.
또한 여러 사람이 하나의 기기를 사용하는 경우에는 사용자를 관리하는 일도 매우 중요함.

  • 응용 프로그램이 실행되고, 시스템 자원을 사용할 수 있도록 권한사용자를 관리함.

응용 프로그램: 운영체제를 통해 컴퓨터에게 일을 시키는 것

응용 프로그램이 운영체제를 통해 컴퓨터에게 일을 시키려면, 컴퓨터를 조작할 수 있는 권한을 운영체제로부터 부여받아야 함.
권한을 부여받고 난 후에는, 운영체제가 제공하는 기능을 이용할 수 있음.
응용 프로그램이 운영체제와 소통하기 위해서는, 운영체제가 응용 프로그램을 위해 인터페이스(API)를 제공해야 함.
응용 프로그램이 시스템 자원을 사용할 수 있도록, 운영체제 차원에서 다양한 함수를 제공하는 것을 시스템 콜(System call)이라고 부름.

스마트폰에서 사용자에게 어떤 디바이스(카메라 등)의 사용을 허락받는 화면을 본 적이 있을 것임.
이와 마찬가지로, 응용 프로그램 역시 운영체제가 프린터 사용을 허가해 주지 않는다면 사용할 수 없음.
워드프로세서 프로그램이 프린터를 사용해서 인쇄하기 위해서는, 워드프로세서 프로그램은 운영체제로부터 프린터 사용에 대한 권한을 부여받아야 함.

응용 프로그램이 프린터 사용에 대한 권한을 획득한 후에는, 프린터를 사용할 때 필요한 API를 호출해야 함.
이 API는 시스템 콜로 이루어져 있음.

프로세스

프로세스는 프로그램이 실행 중인 상태로 특정 메모리 공간에 프로그램의 코드가 적재되고 CPU 가 해당 명령어를 하나씩 수행하고 있는 상태를 의미함.
운영 체제에서는 프로세스를 사용하여 프로그램을 수행하게 되는데 실행 중인 하나의 애플리케이션을 프로세스라고 부름.
사용자가 애플리케이션을 실행하면, 운영체제로부터 실행에 필요한 메모리를 할당받아 애플리케이션의 코드를 실행함.

이때 실행되는 애플리케이션을 프로세스라고 부름.
예를 들어 Chrome 브라우저를 두 개 실행하면, 두 개의 프로세스가 생성됨.
이렇게 하나의 애플리케이션은 여러 프로세스(다중 프로세스)를 만들기도 함.

프로세스 구성 요소

프로세스의 구조체에는 프로세스마다 독립적으로 관리해야 하는 유저 메모리 영역이나 프로세스가 사용하는 각종 객체들의 포인터를 관리하는 핸들 테이블을 가지고 있음.

  1. 유저 메모리 영역 관리(Virtual Address Descriptors)
    프로세스 별로 독립된 영역을 가지게 되는 곳은 유저 메모리 공간입니다. 커널 메모리 공간의 경우 모든 프로세스가 공유하여 사용하고 있습니다. 프로세스 별로 독립적인 유저 메모리 영역을 관리하기 위해서 VAD(Virtual Address Descriptors)라는 관리 테이블이 존재합니다.

  2. 핸들 테이블(Handle Table)
    핸들 테이블은 프로세스에서 사용하는 모든 핸들에 대한 커널 객체 포인터 정보를 배열 형태로 가지고 있는 공간입니다. 프로세스가 종료하게 될 때 이 테이블의 정보를 참고하여 이 프로세서에서 사용하고 있는 모든 커널 객체를 자동으로 반환합니다.

  3. 독립적인 메모리 공간
    프로세스 단위로 관리되는 자원 중 가장 중요한 구별점은 가상 메모리입니다. 페이징 기법을 이용하여 프로세스마다 별도의 고유한 메모리를 사용할 수 있게 하고 있습니다(윈도우의 경우).

프로세스 특징

프로세스의 특징으로는 자원 소유의 단위와 디스패칭의 단위가 있음.

  • 자원 소유의 단위
    각각의 프로세스는 자신의 실행 이미지 로드와 실행에 필요한 추가적인 메모리 공간을 가지고 있어야 합니다. 이것은 각 프로세스마다 구별되어야 하며 해당 프로세스가 접근하고자 하는 파일, I/O 장치들에 대해서 또한 프로세서 단위로 할당 받아 관리되어야 합니다.

  • 디스패칭의 단위
    프로세스는 하나의 프로그램이 운영체제로부터 CPU 의 자원을 일정 기간 동안 할당 받아 명령어를 실행하는 것이며, 운영체제는 여러 개의 프로세스가 병렬적으로 실행되게 하기 위해서 CPU 의 사용 시간을 각각의 프로세스에 골고루 나누어 주어야 합니다. 하나의 프로세스에서 여러 개의 디스패칭 단위가 실행될 수 있도록 하고 있으며, 이러한 디스패칭 단위를 스레드라 부릅니다.

프로세스 상태

  • 실행(Run) : 프로세스가 프로세서를 차지하여 서비스를 받고 있는 상태를 말합니다.
  • 준비(Ready) : 실행될 수 있도록 준비되는 상태를 말합니다.
  • 대기(Waiting) : CPU 의 사용이 아니라 입출력의 사건을 기다리는 상태를 말합니다.

프로세서 VS 프로세스

프로세서와 프로세스는 엄밀히 다른 존재임.

프로세서(Processor)

프로세서는 하드웨어적인 측면과 소프트웨어적인 측면으로 나누어 볼 수 있음.

  • 하드웨어적인 측면 : 컴퓨터 내에서 프로그램을 수행하는 하드웨어 유닛으로, 중앙처리장치(CPU)를 의미하며 적어도 하나 이상의 ALU와 레지스터를 내장하고 있습니다.

  • 소프트웨어적인 측면 : 데이터 포맷을 변환하는 역할을 수행하는 데이터 처리 시스템을 의미합니다. 워드프로세서나 컴파일러 등이 여기에 속합니다.

프로세스(Process)

프로세스는 특정 목적을 수행하기 위해 나열된 작업의 목록을 의미함.
메모리에 적재 되어 프로세서에 의해 실행 중인 프로그램을 프로세스라고 볼 수 있음.

스레드

스레드란?

스레드는 명령어가 CPU 를 통해서 수행되는 객체의 단위.
하나의 프로세스 내에는 반드시 1개 이상의 스레드가 존재하며, 이러한 스레드는 같은 프로세스에 있는 자원과 상태를 공유함.

같은 프로세스 내에 있는 스레드는 같은 주소 공간에 존재하게 되며 동일한 데이터에 접근할 수 있음.
또한 하나의 스레드가 수정한 메모리는 같은 메모리를 참조하는 스레드에 영향을 미치게 됨.
예를 들어 하나의 스레드에서 오픈한 파일을 다른 스레드가 사용할 수 있음.
프로세스가 종료되면 그 프로세스에 속해있던 스레드도 함께 종료됨.

스레드는 왜 필요한가?

하나의 프로세스 안에서 여러 개의 루틴을 동시에 수행하여서 수행 능력을 향상하려고 할 때 스레드를 사용하게 되는데, 독립적으로 수행하여 처리하려고 할 때 사용하게 됨.
즉 여러 개의 작업 단위로 구성된 프로그램에서 요청을 동시에 처리하기 위해서임.

예를 들어, 워드 프로세서에서 사용자로부터 키보드 입력 받거나, 그래픽이나 UI를 그리고 문법 오류를 체크하는 등 워드 프로세서 내에서 여러 요청들을 동시에 처리해야 하는데, 이때 스레드가 필요하게 됨.

스레드의 구성요소

스레드는 가상 CPU, 수행 코드, 처리 데이터로 구성됨.

  • 가상 CPU : 인터프리터, 컴파일러에 의해 내부적으로 처리되는 가상 코드입니다.
  • 수행 코드 : Thread Class에 구현되어 있는 run() Method 코드입니다.
  • 처리 데이터 : Thread에서 처리하는 데이터입니다.

스레드의 특징

  • 프로세스 내에서 실행되는 흐름의 단위입니다. 하나의 스레드는 시작해서 종료할 때까지 한번에 하나씩 명령들을 수행합니다
  • 각 스레드마다 call stack이 존재(call stack: 실행 중인 서브루틴을 저장하는 자료 구조)하며, 나머지 Code, Data, Heap 영역은 스레드 끼리 공유합니다. 반면에 프로세스는 다른 프로세스의 메모리에 직접 접근할 수 없습니다.
  • 스레드는 다른 스레드와 독립적으로 동작합니다. 독립적으로 동작하기 때문에 두 개 이상의 스레드가 동작되는 경우, 두 개 이상의 스레드의 실행 및 종료순서는 예측할 수 없습니다.

싱글 스레드와 멀티 스레드

스레드는 싱글 스레드와 멀티 스레드가 존재하고 있음.

싱글 스레드(Single-Thread)

프로세스가 단일 스레드로 동작하는 방식으로 일련의 처리를 단일 스레드만으로 직렬 처리하는 프로그래밍 방법.
하나의 레지스터, 스택으로 표현함.
자바스크립트가 가장 대표적인 싱글 스레드 언어임.

싱글 스레드의 장점

  • 자원 접근에 대한 동기화를 신경쓰지 않아도 됨.여러 개의 스레드가 프로세스의 자원을 공유할 경우,각 스레드가 원하는 결과를 얻게 하려면 공용 자원에 대한 접근을 제어해야 함.쉽게 말해서, 모든 스레드가 일정 자원에 동시에 접근하거나, 똑같은 작업을 실행하려는 경우,에러가 발생하거나 원하는 값이 나오지 않음.그래서, 스레드들이 동시에 같은 자원에 접근하지 못하도록 제어해줘야만 함.

  • 자원 접근에 대한 동기화를 신경쓰지 않아도 되므로 문맥 교환(context switch) 작업 또한 요구하지 않음.문맥 교환은 여러 개의 프로세스가 하나의 프로세서를 공유할 때 발생하는 작업으로 많은 비용을 필요로 함.

  • 프로그래밍 난이도가 쉽고, CPU 메모리를 적게 사용함.

싱글 스레드의 단점

  • 여러 개의 CPU를 활용하지 못함. 싱글 스레드는 하나의 물리적 코어밖에 사용하지 못해 멀티 코어 머신에서 CPU 사용을 최적화할 수 없음. 최적화를 위해선 Cluster 모듈을 이용하여 여러 프로세스를 사용할 수 있음. 하지만 앞서 프로세스끼리의 자원 공유는 어렵기 때문에 Redis와 같은 부가 인프라가 필요함.

  • 연산량이 많은 작업을 하는 경우, 그 작업이 완료되어야 다른 작업을 수행할 수 있음.

  • 싱글 스레드 모델은 에러 처리를 못하는 경우 멈춰버리게 됨. 멀티 스레드 모델은 에러 발생 시 새로운 스레드를 생성하여 극복할 수 있음.

멀티 스레드 (Multi-Thread)

일반적으로 하나의 프로세스는 하나의 스레드를 가지고 작업을 수행하게 됨.

하지만 멀티 스레드(multi thread)란 하나의 프로세스 내에서 둘 이상의 스레드가 동시에 작업을 수행하는 것을 의미함. 또한, 멀티 프로세스(multi process)는 여러 개의 CPU를 사용하여 여러 프로세스를 동시에 수행하는 것을 의미함.

시스템 자원의 활용 극대화 및 처리량 증대할 수 있어 단일 프로세스 시스템의 효율성을 높일 수 있음.

멀티 스레딩의 장점

  • 싱글 스레드인 경우, 작업이 끝나기 전까지 사용자에게 응답하지 않지만 반면 멀티스레드인 경우 작업을 분리해서 수행하므로 실시간으로 사용자에게 응답할 수 있음.

  • 싱글 스레드인 경우 한 프로세스는 오직 한 프로세서에서만 수행 가능하지만 반면 멀티 스레드인 경우 한 프로세스를 여러 프로세서에서 수행할 수 있으므로 훨씬 효율적임.

멀티 스레딩의 문제점

  • 주의 깊은 설계가 필요하며, 디버깅이 까다로움.

  • 단일 프로세스 시스템의 경우 효과를 기대하기 어려우며 다른 프로세스에서 스레드를 제어할 수 없음.
    (즉, 프로세스 밖에서 스레드 각각을 제어할 수 없습니다.)

  • 멀티 스레드의 경우 자원 공유의 문제가 발생함. 하나의 스레드에 문제가 발생하면 전체 프로세스가 영향을 받게 됨.

  • 문맥 교환 작업을 요구함. CPU에서 여러 프로세스를 돌아가면서 작업을 처리하는 데 이 과정을 문맥 교환(Context Switching)이라 함. 문맥 교환이란 다른 태스크(프로세스, 스레드)가 시작할 수 있도록 이미 실행 중인 태스크(프로세스, 스레드)를 멈추는 것을 말함.

관련 키워드

  • 데드락(Deadlock, 교착 상태)
  • 뮤텍스(Mutex), 세마포어(Semaphore)

동시성과 병렬성의 차이

  • 동시에 돌릴 수 있는 스레드 수는 컴퓨터에 있는 코어 개수로 제한됨. 운영체제(또는 가상 머신)는 각 스레드를 시간에 따라 분할하여, 여러 스레드가 일정 시간마다 돌아가면서 실행되도록 함. 이런 방식을 시분할이라고 함.
    • Concurrency(동시성, 병행성): 여러 개의 스레드가 시분할 방식으로 동시에 수행되는 것처럼 착각을 불러일으킴
    • Parallelism(병렬성): 멀티 코어 환경에서 여러 개의 스레드가 실제로 동시에 수행됨

문자열과 그래픽

컴퓨터 과학은 이론적인 부분과 실용적인 부분으로 나뉘어져 있으나 컴퓨터가 받아들이는 기본적인 언어는 프로그래밍 언어이고, 프로그래밍 언어로 다룰 수 있는 가장 기본적인 소스인 문자열과 그래픽에 대해서 알아둘 필요가 있음.

문자열

2010년도 이후, 우리는 유니코드라고 불리는 인코딩 방식이 통일된 시대를 살아가고 있음.
문자열을 다루는 디테일한 방식에 대해 전부 알 필요는 없지만, 프로그래밍 언어마다 문자열을 다루는 자료형의 차이를 이해하기 위해 문자열을 다루는 기본적인 방식은 알고 있어야 함.

문자열 하나는 몇 바이트인가요?

영어의 경우 알파벳 하나가 1 바이트(byte)를 차지하는 시절이 있었음.
그러나 글로벌 시대에는 유니코드를 사용해야 텍스트를 정확하게 저장할 수 있음.
프로그래밍 언어마다 문자열을 저장하는 자료형이 다 다르므로, "문자열 하나가 몇 바이트인가?"에 대한 답변은 이 자료형이 차지하고 있는 바이트를 이해할 때 답변할 수 있음.

유니코드는 무엇인가요?

유니코드(Unicode)는 유니코드 협회(Unicode Consortium)가 제정하는 전 세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계된 산업 표준임.
이 표준에는 ISO 10646 문자 집합, 문자 인코딩, 문자 정보 데이터베이스, 문자를 다루기 위한 알고리즘 등을 포함하고 있음.

유니코드가 탄생하기 이전에는, 같은 한글이 적힌 텍스트 파일이라도 표현하는 방법이 제각각이었음.
어떤 파일이 지원하지 않는 다른 인코딩 형식으로 저장되어 있는 경우에는 파일을 제대로 불러올 수 없었음.
기본적으로 유니코드의 목적은 현존하는 문자 인코딩 방법을 모두 유니코드로 교체하는 것.

인코딩(부호화)이란?

인코딩이란 어떤 문자나 기호를 컴퓨터가 이용할 수 있는 신호로 만드는 것임.
이 신호를 입력하는 인코딩과 문자를 해독하는 디코딩을 하기 위해서는 미리 정해진 기준을 바탕으로 입력과 해독이 처리되어야 함.
이렇게 인코딩과 디코딩의 기준을 문자열 세트 또는 문자셋(charset)이라고 함.
이 문자셋의 국제 표준이 유니코드임.

ASCII 문자는 무엇인가요?

영문 알파벳을 사용하는 대표적인 문자 인코딩으로 7 비트로 모든 영어 알파벳을 표현할 수 있음.
52개의 영문 알파벳 대소문자와, 10개의 숫자, 32개의 특수 문자, 그리고 하나의 공백 문자를 포함함.

유니코드는 ASCII를 확장한 형태.

UTF-8과 UTF-16의 차이점은 무엇인가요?

UTF-8과 UTF-16은 인코딩 방식의 차이를 의미함.
UTF-8은 Universal Coded Character Set + Transformation Format – 8-bit의 약자로, UTF- 뒤에 등장하는 숫자는 비트(bit)임.

1. UTF-8 특징: 가변 길이 인코딩

UTF-8은 유니코드 한 문자를 나타내기 위해 1 byte(= 8 bits)에서 4 bytes까지 사용함.

  • 원리

예를 들어, 코 라는 문자의 유니코드는 U+CF54 (16진수, HEX)로 표현됨.
이 문자를 이진법(binary number)으로 표시하면, 1100-1111-0101-0100 이 됨. 이 문자를 UTF-8로 표현하면, 다음과 같이 3byte의 결과로 표현됨.

1110xxxx 10xxxxxx 10xxxxxx # x 안에 순서대로 값을 채워넣습니다.
11101100 10111101 10010100

//[데이터] UTF-8로 표현된 '코'
let encoder = new TextEncoder(); // 기본 인코딩은 'utf-8'
encoder.encode('코') // Uint8Array(3) [236, 189, 148]

(236).toString(2) // "11101100"
(189).toString(2) // "10111101"
(148).toString(2) // "10010100"

//[코드] '코'라는 문자를 UTF-8로 표현할 수 있습니다.

ASCII 코드는 7비트로 표현되고, UTF-8에서는 다음과 같이 1 byte의 결과로 만들 수 있음.
다음 예제는 b 라는 문자를 UTF-8로 인코딩한 결과임.

0xxxxxxx
01100010 
//[데이터] UTF-8로 표현된 'b'
encoder.encode('b') // Uint8Array [98]
(98).toString(2) // "1100010"

//[코드] 'b'라는 문자를 UTF-8로 표현할 수 있습니다.

이처럼, UTF-8은 1 byte에서 4 bytes까지의 가변 길이를 가지는 인코딩 방식임.
네트워크를 통해 전송되는 텍스트는 주로 UTF-8로 인코딩됨.
사용된 문자에 따라 더 작은 크기의 문자열을 표현할 수 있기 때문임.
ASCII 문자는 1 바이트만으로 표현 가능한 것처럼 말임.
UTF-8은 ASCII 코드의 경우 1 byte, 크게 영어 외 글자는 2byte, 3byte, 보조 글자는 4byte를 차지함.
이모지는 보조 글자에 해당하기 때문에 4byte가 필요함.

2. UTF-8 특징: 바이트 순서가 고정됨

UTF-16에 비해 바이트 순서를 따지지 않고, 순서가 정해져 있음.

3. UTF-16 특징: 코드 그대로 바이트로 표현 가능, 바이트 순서가 다양함

UTF-16은 유니코드 코드 대부분(U+0000부터 U+FFFF; BMP) 을 16 bits로 표현함.

  • 대부분에 속하지 않는 기타 문자는 32 bit(4 bytes)로 표현하므로 UTF-16도 가변 길이라고 할 수 있으나, 대부분은 2 바이트로 표현합니다

U+ABCD라는 16진수를 있는 그대로 이진법으로 변환하면 1010-1011-1100-1101 입니다. 이 이진법으로 표현된 문자를 16 bits(2 bytes)로 그대로 사용하며, 바이트 순서(엔디언)에 따라 UTF-16의 종류도 달라짐.

UTF-8에서는 한글은 3 바이트, UTF-16에서는 2 바이트를 차지함.

그래픽

비트맵(Bitmap)과 벡터(Vector)는 디지털 이미지의 종류임.
디지털 이미지, 또는 이미지라고 불리는 용어는 디지털 카메라를 이용하여 현실세계의 사물을 촬영하거나 스캐너를 이용하여 사진이나 그림을 디지털 형태로 받아들인 것을 가리킴.
서로 상반된 방식으로 이미지를 표현하기 때문에 비트맵(Bitmap)과 벡터(Vector)는 큰 차이점이 있음.

비트맵

비트맵(Bitmap)은 웹 상에서 디지털 이미지를 저장하는 데에 가장 많이 쓰이는 이미지 파일 포맷 형식임.
일반적으로는 래스터 그래픽(점 방식)이라고 함.
이미지의 각 점들을 격자형의 픽셀 단위로 구성되며, 한 지역을 차지하는 셀은 위치에 따라 다른 값을 갖음.


이런 비트맵은 사각의 픽셀 형태로 모여 있기 때문에 확대를 하면 ‘계단현상’ 또는 ‘깨짐 현상’이 발생하며, 경계가 뚜렷하지 않다는 특징이 있음.
이런 식으로 픽셀 단위로 이미지를 표현하는 방식은 컴퓨터에게 부담을 덜 주는 구조로 되어 있음.
또한 픽셀 하나 당 모두 색상 값을 가지고 있음.
따라서 이미지의 사이즈가 커질수록 용량 또한 무거워진다는 특징이 있음.

벡터

벡터(Vector)는 비트맵과는 완전히 다른 방식으로 이미지를 표현함.
비트맵이 격자형의 픽셀 단위로 이미지를 구성한다면 벡터는 이미지를 수학적인 공식으로 표현을 함.

점과 점을 연결해 선을 표현하고 선과 선을 연결해 면을 표현하는 식의 수학적 원리로 그림을 그리기 때문에 비트맵과는 달리 아무리 확대를 해도 ‘계단현상’ 또는 ‘깨짐 현상’이 발생하지 않음.
그러나 그렇기 때문에 벡터 방식으로 이미지를 표현하는 것은 비트맵에 비해 컴퓨터에게 부담을 가하는 방식이므로 주로 도형, 글자 등을 그리는 작업에 사용됨.
또한 수학적인 연산으로 만들어진 이미지이기 때문에 사이즈를 키워도 용량에는 변화가 없다는 특징 또한 있음.

비트맵(래스터)과 벡터 이미지의 차이점


[표] 비트맵(래스터) 이미지와 벡터 이미지의 차이점
[표] 비트맵(래스터) 이미지와 벡터 이미지의 차이점

가비지 컬렉션

가비지 컬렉션은 프로그램에서 더 이상 사용하지 않는 메모리를 자동으로 정리하는 것임.
이 기능을 가진 언어(혹은 엔진)는 자바, C#, 자바스크립트 등이 있음.
C 언어 같은 저수준 언어에서는 메모리 관리를 위해 malloc()과 free()를 사용해 개발자가 스스로 메모리를 할당하고 해제해야 함.
그러나 JavaScript는 C언어와는 반대로 고수준 언어로서, 객체가 생성되었을 때 자동으로 메모리를 할당하고 필요하지 않다면 자동으로 해제하는 가비지 컬렉션이 내장되어 있음.

고수준 언어와 저수준 언어는 무엇일까요?
C언어가 저수준 언어라고 해서 고수준 언어인 JavaScript에 비해 뒤떨어지는 게 아닙니다. 프로그래밍 언어가 인간에게 친화적인지, 기계에게 친화적인지에 따라 고수준 언어와 저수준 언어로 갈리는 것입니다.
저수준 언어는 보다 기계 친화적인 언어로 레지스터 및 메모리와 직접 상호 작용을 할 수 있기 때문에 전반적으로 빠르게 실행되는 응용 프로그램을 빌드하는 데에 사용됩니다. 또한 저수준 언어는 컴파일러나 인터프리터가 필요하지 않으므로 저수준 언어는 고수준 언어보다 빠른 편입니다.
반대로 고수준 언어는 인간 친화적인 언어로, 인간이 이해하기 쉽고 다양한 작업을 수행하는 프로그램을 개발할 수 있습니다. 영어와 유사한 구문이 있기 때문에 컴파일러 또는 인터프리터를 사용하여 컴퓨터가 읽을 수 있는 기계어 코드로 변환해야 하며, 하드웨어와 직접 상호 작용하지는 않습니다.

개발자가 직접 메모리를 할당하고 해제해야 하는 부분을 가비지 컬렉션이 도와주기 때문에, 개발자가 메모리 관리에 대해 고민할 필요가 없다는 잘못된 인상을 받을 수 있음.
실제로 지금까지 여러분은 작은 컴포넌트 및 앱을 개발하면서 메모리 할당 및 해제에 대해 깊은 고민을 하지 않았을 것임.
그러나 가비지 컬렉션이 어떻게 동작하는지, JavaScript가 어떻게 메모리를 관리하는지 알아야 훗날 여러분이 개발한 앱의 속도 저하, 예기치 못한 종료, 느린 응답 속도와 같은 문제들이 왜 일어나는지 알 수 있음.

메모리 생존주기

메모리 생존 주기는 그 어떤 프로그래밍 언어에 관계 없이 비슷함.

  1. 필요할 때 개발자가 할당합니다.
  2. 할당된 메모리를 사용합니다. (Read and Write)
  3. 메모리가 더이상 필요하지 않으면 해제합니다.

2번의 할당된 메모리를 사용하는 것은 모든 언어에서 명시적으로 사용되는 부분임. JavaScript로 예시를 들자면 개발자가 변수를 선언해 값을 할당하여 사용하는 부분이 됨.
그러나 1번과 3번은 C언어와 같은 기계친화적인 저수준 언어에서는 명시적이고, JavaScript와 같은 고수준 언어에서는 암묵적으로 작동함.
따라서 여러분들이 직접 이 부분을 제어하지는 않았을 것임.

메모리 할당

JavaScript는 프로그래머 대신, 값을 선언할 때 자동으로 메모리를 할당해줌.

let arr = [100, 200, 300, 400]

여러분들은 여태껏 변수를 선언하고 배열을 할당하여 안에 요소를 집어넣을 때, 그 배열을 담을 메모리의 크기를 고려하지 않았을 것임.
이 부분을 JavaScript가 배열과 배열에 담긴 값들을 위한 메모리 크기 할당을 알아서 진행했기 때문임.
이 부분은 정수, 문자열, 함수, 객체 모든 부분에서 자동적으로 일어남.

할당된 메모리 사용 (값 사용)

기본적으로 할당된 메모리를 읽고 쓰는 것을 의미함.
변수나 객체 속성의 값을 읽고 쓰거나, 함수 호출 시에 함수에 인수를 전달하여 수행하는 방식으로 일어남.

메모리 해제

할당된 메모리가 더이상 필요 없다면 해제를 해야 앱의 성능을 저하시키지 않음.

이 부분에서, 저수준 언어는 개발자가 직접 결정하고 해제하는 방식을 사용함.
개발자가 직접 관여하기 때문에 개발자의 제어 정도가 굉장히 높은 편임.

그러나 고수준 언어는 앞서 이야기 했듯 가비지 컬렉션이라는 자동 메모리 관리 방법을 내장한 상태임.
가비지 컬렉션의 목적은 메모리 할당을 추적하고, 할당된 메모리 블록이 더이상 필요하지 않게 되었는지를 “스스로” 판단하여 필요하지 않다고 판단이 된다면 해당 메모리를 해제함.
하지만 언어 스스로 메모리가 여전히 필요한지 필요하지 않은지 판단하는 것은 비결정적인 영역임.
그래서 고수준 언어에 내장된 가비지 컬렉터들은 제한적인 해결책을 구현함.

대표적인 가비지 컬렉션의 방법

가비지 컬렉션 알고리즘은 이하 2가지 알고리즘이 가장 유명함.
이 2가지 알고리즘이 의존하고 있는 개념은 참조(reference)임.

참조(reference)
명시적이든, 암묵적이든 관계없이 메모리 관리 관점에서 어떤 객체가 다른 객체에 접근할 수 있다면 다른 객체를 참조한다고 말합니다. 예를 들어서, JavaScript 객체는 자신의 프로토타입(prototype)에 대해 암묵적인 참조를 갖고 있고, 자신의 속성(property) 값에 대한 명시적 참조도 가지고 있습니다.

객체를 참조하는 것에 대해, 객체란 협의적 개념으로 일반적인 JavaScript 객체를 의미하지만 광의적 개념으로 함수 스코프(function scope)나 글로벌 렉시컬 스코프(global lexical scope)까지도 포함한다는 것을 알아둡시다.

렉시컬 스코핑(lexical scoping)
변수 이름이 중첩된 함수에서 해석되는 방식을 정의하는 것으로, 중첩되어 있는 더 안쪽의 함수는 부모 함수가 값을 반환한 다음에도 부모 함수의 스코프를 포함하고 있습니다.

레퍼런스 카운팅(참조 횟수 계산)

한 객체를 참조하는 변수의 수를 추적하는 방법으로 가장 단순한 형태의 가비지 컬렉션 알고리즘임.
객체를 참조하는 변수는 처음에는 특정 메모리에 대해 레퍼런스가 하나뿐이지만, 변수의 레퍼런스가 복사될 때마다 레퍼런스 카운트가 늘어남.
객체를 참조하고 있던 변수의 값이 바뀌거나, 변수 스코프를 벗어나면 레퍼런스 카운트는 줄어듬.
레퍼런스 카운트가 0이 되면, 그 객체와 관련한 메모리는 비울 수 있음.
레퍼런스 카운트가 0이 된다는 말은 아무도 그 객체에 대한 레퍼런스를 가지고 있지 않다는 말과 같음.

이 방식은 순환 참조로 인한 문제가 생길 가능성이 높음.

function reference() {
  var obj1 = {};
  var obj2 = {};
  obj1.p = obj2; 
  obj2.p = obj1; 
}
reference();

위 코드에서는 두 객체가 생성되고 서로를 참조하고 있는 형태이기 때문에 순환 참조가 발생함.
이 객체들은 함수 호출 뒤에는 스코프를 벗어나게 되므로 실질적으로 쓸모가 없게 됨.
그래서 이들이 차지하던 메모리는 반환될 수 있지만, 레퍼런스 카운팅 알고리즘에서는 두 객체가 적어도 한 번은 참조한 것으로 간주되기 때문에 둘 다 가비지컬렉션이 될 수 없게 됨.

트레이싱

한 객체에 flag를 두고, 가비지 컬렉션 사이클마다 flag에 표시 후 삭제하는 mark and sweep 방법임.
객체에 in-use flag를 두고, 사이클마다 메모리 관리자가 모든 객체를 추적해서 사용 중인지 아닌지를 표시(mark)함.
그 후 표시되지 않은 객체를 삭제(sweep)하는 단계를 통해 메모리를 해제함.
현재 대부분의 가비지 컬렉션이 mark and sweep 알고리즘을 이용한 가비지 컬렉터를 장착하고 있음.

mark and sweep 알고리즘은 객체가 필요한지 결정하기 위해 해당 객체에 닿을 수 있는지 (reachable)을 판단함.
그리고 3단계를 거침.

  1. 루트(Roots): 일반적으로 루트는 코드에서 참조되는 전역 변수입니다. 예를 들어 자바스크립트에서 루트로 동작할 수 있는 전역 변수는 window 객체입니다. Node.js에서 이와 동일한 객체는 global입니다. 가비지컬렉터는 모든 루트의 완전한 목록을 만들어냅니다.

  2. 그런 다음 모든 루트와 그 자식들을 검사해서 활성화 여부를 표시합니다(활성상태이면 가비지가 아닙니다). 루트가 닿을 수 없는 것들은 가비지로 표시됩니다.

  3. 마지막으로 가비지컬렉터는 활성으로 표시되지 않은 모든 메모리를 OS에 반환합니다.

이 방법은 앞선 레퍼런스 카운팅 방법보다는 나은데, ‘참조받지 않는 객체’는 ‘닿을 수 없는 객체’기 때문에 가비지 컬렉션을 통해 메모리를 해제할 수 있기 때문임.

메모리 누수

Garbage collected 언어에서 메모리 누수의 주요 원인은 예상치 못한 참조임.

예상치 못한 참조는 개발자는 더 이상 사용되지 않을 것이라 생각했지만, 어떠한 이유로 활성화 상태인 루트 트리 안에 존재하는 메모리 조각들임.
자바스크립트에서 예상치 못한 참조는 더이상 사용되지 않지만 코드 상 어딘가에 유지되어 해제되지 못한 변수들임.
어떤 이들은 이를 개발자의 실수라고 말하기도 함.
그래서 자바스크립트에서 발생할 수 있는 일반적인 메모리 누수 형태들을 이해하기 위해서는 흔히 까먹기 쉬운 참조들을 먼저 알 필요가 있음.

이런 메모리 누수는 일반적으로 3가지의 형태가 있음.

  • 우발적으로 생성된 전역변수
  • DOM 외부에서의 참조
  • 클로저의 잘못된 사용

프로그래밍 언어의 메모리 관리 시스템이 특정 메모리가 실제 사용중인지 미사용중인지 완벽히 구분해내는 것은 사실상 불가능에 가까움.
오직 그 코드를 작성한 개발자들만이 해당 메모리 조각을 운영체제로 반환시킬 수 있는지 여부를 명확히 알 수 있기 때문에 해당 부분들을 잘 확인하여 메모리 누수가 일어나는 부분을 막을 줄 알아야 함.

0개의 댓글