S4 Unit 5. [컴퓨터 공학] 기초

나현·2022년 11월 30일
0

학습일지

목록 보기
44/53
post-thumbnail

💡 이번에 배운 내용

  • Section4. 사람과 기계가 모두 쉽고 빠르게 접근 가능한 Web App을 만들 수 있다.
  • Unit5. 컴퓨터 공학 기초: 컴퓨터와 운영체제의 이론적 지식을 학습한다.

느낀점

배울 내용이 너무 많아서 계속해서 공부했던 유닛이었다. 과제도 없지만 오히려 블로깅 하는데 오래 걸렸다. 이 많은 컴퓨터 공학 내용들을 머리 속에 한 번에 집어넣을 수는 없으니 복습말고는 방법이 없는 듯하다. 그나저나 길었던 이번 유닛도 블로깅 완료!


키워드

중앙처리장치 CPU, 산술/논리 연산장치 ALU, 레지스터, 제어장치, 메모리, 주 기억 장치, 보조 기억 장치, RAM, ROM, 플래시 메모리, 캐시 메모리, 프로세스, 스레드, 유니코드, UTF-8, 비트맵, 벡터, 가비지 컬렉션, 레퍼런스 카운팅, 트레이싱, mark and sweep, 메모리 누수


학습내용

Ch1. 컴퓨터 구조

컴퓨터는 하드웨어와 소프트웨어가 합쳐진 형태이다.
하드웨어는 입출력 장치, 중앙처리장치(CPU), 기억장치로 구성되어 있고,
소프트웨어는 하드웨어를 제어하며 작업을 수행하는 프로그램을 의미한다.

컴퓨터의 기본 구성 요소

컴퓨터는 입력장치(Input), 출력장치(Output), 중앙처리장치(CPU), 주 기억장치, 보조 기억장치로 구성된다.

  • 입력 장치
    • 컴퓨터가 처리할 수 있는 형태로 데이터와 명령을 받아들이는 물리적인 장치
    • 컴퓨터에 연결하여 무언가를 입력할 수 있는 장치
    • ex. 키보드 마우스 스캐너 타블렛 조이콘
  • 출력 장치
    • 처리된 데이터를 사람이 이해할 수 있는 형태로 출력하는 물리적인 장치
    • ex. 모니터 프린터
  • 중앙처리장치 CPU
    • 산술/논리 연산 장치(ALU), 제어 장치, 레지스터로 구성
    • 산술/논리 연산 장치(ALU): 덧셈을 수행
    • 제어 장치: 프로그램에 따라 명령과 제어 신호를 생성, 각종 장치의 동작 제어
    • 레지스터: CPU의 내부 메모리, CPU에서 사용하는 데이터를 일시적으로 저장
  • 저장 장치
    주 기억 장치(Memory), 보조 기억 장치
    • 주기억 장치: 데이터나 프로그램을 보관.
      주 기억 장치는 주로 정보를 저장해 두었다가 필요할 때 읽어들이는 저장소
      ex. RAM과 ROM
    • 보조 기억 장치: 주 기억 장치에 비해 기억된 내용을 읽는 속도는 느리지만 대용량의 기억이 가능
      ex. 자기 디스크(플로피 디스크, 하드 디스크), 광 디스크(CD, DVD), 플래쉬 메모리(USB, SSD)

CPU

중앙 처리 장치(CPU)는 연산을 수행하며 기억장치에 기억되어 있는 명령어들을 수행한다.
CPU는 컴퓨터 시스템의 가장 중요한 요소로 위에 언급했듯이
산술/논리 연산 장치(ALU), 레지스터, 제어 장치
로 구성되어 있다. CPU에 대해서 좀 더 자세히 살펴본다.

  • 산술/논리 연산 장치 (Arithmetic Logic Unit, ALU)
    레지스터에 저장된 데이터를 이용하여 산술적인 연산(덧셈, 곰셈 등과 같은)과 논리적인 연산을 담당한다.
    가산기, 보수기, 누산기, 기억 레지스터, 데이터 레지스터로 구성된다.
    레지스터(Register)라는 CPU 전용의 기억장소에 캐시나 메모리로부터 읽어 온 데이터를 저장한다.
    그 외에 부동소숫연산장치(FPU)와 정수연산장치, 논리연산(AND, OR 등)장치 등이 있다.

  • 레지스터(Register)
    위의 설명처럼 레지스터(Register)는 중앙처리장치(CPU) 내부에 있는 기억장치로 데이터를 저장한다. 레지스터에는 여러 종류가 있다.

    • IR (Instruction Register) : 현재 수행 중에 있는 명령어 부호를 저장하고 있는 레지스터
    • PC (Program Counter) : 명령이 저장된 메모리의 주소를 가리키는 레지스터
    • AC (Accumulator) : 산술 및 논리 연산의 결과를 임시로 기억하는 레지스터
  • 제어장치(Control Unit, CU): CPU가 자신 및 주변기기들을 컨트롤하는 장치
    제어장치는 아래와 같이 구성되어 있다.

    • 프로그램 계수기(program counter): 프로그램의 수행 순서를 제어
    • 명령 레지스터(instruction register): 현재 수행중인 명령어의 내용을 임시 기억
    • 명령해독기(instruction decoder): 명령 레지스터에 수록된 명령을 해독, 수행될 장치에 제어신호를 보냄

이 제어 장치는 2가지 방식으로 구현된다.

제어 장치 구현의 방식

  • 고정 배선 제어(Hardwired) 방식:
    제어신호가 Hardwired Circuit 에 의해서 생성 되도록 하드웨어적으로 구성하며
    상태계수기와 PLA(Programmable Logic Array ) 회로로 구성된다.
    상대적으로 고속으로 처리하며 고가이다. RISC 시스템에 적용한다.
  • Micro Program 방식
    발생 가능한 제어 신호들의 조합을 미리 구성하여 ROM 에 저장했다가 필요 시 신호를 발생시키는 Software 방식이다.
    하드웨어 방식에 비해 속도도 낮고 가격도 저렴하며 CISC 시스템에 적용한다.

CPU의 기능

CPU의 기능은 명령어와 데이터에 관련이 있다. 주로 명령어를 인출하고 해독하며, 처리 및 쓰기는 명령어에 따라 필요할 때만 수행한다.
이 명령어 및 명령어 수행 과정과 처리 방식은 CPU에서 중요한 부분을 차지한다.

  • 명령어란?
    시스템이 특정 동작을 수행시키는 작은 단위로 동작코드(Op-code : Operational Code)와 오퍼랜드(Operand)로 구성된다.

    • 동작 코드(Op-code): 각 명령어의 실행 동작을 구분하여 표현
    • 오퍼랜드(Operand): 명령어의 실행에 필요한 자료나 실제 자료의 저장 위치를 의미
  • 명령어 수행 과정
    CPU 가 하나의 명령(Operation)을 처리하는 과정을 명령어의 수행 과정이라고 한다.

    • 읽기(Fetch Instruction, FI): 메모리에서 명령 가져오기
    • 해석(Decode Instruction, DI): 명령 해석
    • 실행(Execute Instruction, EI): 명령 수행
    • 기록(Write Back, WB): 명령 수행 결과 기록
  • 명령어 처리 방식
    명령어 처리 방식에는 위에서 잠깐 언급되었지만 RISC와 CISC가 있다.

    • RISC(Reduced Instruction Set Computer):
      단순한 명령을 조합해 하나의 기능을 수행한다.
      컴퓨터 내부적으로 사용하는 명령어 세트를 단순화 시켜서 처리한다.
    • CISC(Complex Instruction Set Computer):
      하나의 기능에 하나의 명령을 수행한다.

Memory

메모리는 기억소자로 반도체이다. 이 반도체는 전류를 흐르거나, 흐르지 않게 하는데 이 특징을 이용해 임시적인 내용을 기억하는 것이 메모리의 주 기능이다.
메모리에는 여러 종류가 있다. (레지스터 메모리, 캐시 메모리, 주기억 장치, 보조기억 장치 등)
종류를 살펴보기에 앞서 메모리의 특성에 대해 알아둘 필요가 있다.

  • 휘발성: 메모리는 시스템이 활성화 된 상태에서 그 값을 기억하고 있지만 시스템이 꺼지면 지워진다. 이를 휘발한다고 한다.
    보조 기억장치는 시스템이 꺼져도 기억하고 있는 값이 휘발되지 않으므로 비휘발성 기억장치이다.

  • 메모리 성능에는 속도, 시간 등이 중요하다. 각 용어의 의미는 다음과 같다.

    • 메모리 속도: CPU와 데이터를 주고받는 시간. 액세스라고도 한다.
      단위는 ns(nano-second) – 10억분의 1초
      이 속도가 빠를 수록 성능이 좋다.
    • 리프레시 시간: 정보가 사라지지 않게 메모리를 재충전 해주는 시간.
      메모리에서 한번 읽고 나서 다시 읽을 수 있는 사이의 시간을 의미한다.
    • 메모리 액세스 시간: 데이터를 읽어오라는 명령을 받은 뒤 데이터를 읽기 시작하기까지의 시간을 의미한다.
    • 액세스 시간:
      CPU에서 명령어를 처리할 때 명령어의 주소를 보내고,
      그 주소에 해당하는 값을 가져 오는 데 걸리는 시간을 의미한다.
    • 사이클 시간: 리프레시 시간 + 메모리 액세스 시간
      즉 메모리 작업이 완료와 동시에 대기 신호를 내놓은 후, 다음 신호를 받을 준비가 되었다는 신호를 주기까지의 시간이다.

주 기억 장치, 보조 기억 장치

주 기억 장치의 종류로는 RAM과 ROM가,
보조 기억 장치의 종류로는 자기 디스크, 광디스크, 플래시 메모리 등이 있다.

  • 주기억장치
    주기억장치는 RAM, ROM으로 구분된다.

    • RAM(Random Access Memory):
      컴퓨터의 전원이 끊어지면 내용이 휘발되어 보조 저장 장치가 반드시 필요하다.
      RAM의 크기는 프로그램의 수행 속도에 영향을 준다.
      CPU에서 직접 접근이 가능한 유일한 저장 장치이다.
      이 RAM은 또 SRAM과 DRAM이 있다.

      SRAM은 리프레쉬가 필요 없고 전력 소모가 적으나 비싸며,
      DRAM은 리프레쉬가 필요하고 SRAM보다 저가이며 많이 사용되는 편

    • ROM(Read Only Memory):
      대부분 읽을 수만 있는 장치로 구성되며 전원이 끊겨도 내용이 보존된다.
  • 보조기억장치

    • 자기 디스크: 원판 표면의 철 입자의N/S극으로 0과 1을 표현한다. 이 자기 디스크의 데이터를 읽는 주변장치는 디스크 드라이브라고 한다.
      ex. 플로피 디스크(FDD)와 하드 디스크(HDD)
    • 광 디스크(optical disc, OD): 빛의 반사를 이용하여 자료를 읽어내는 저장 매체이다.
      ex. 1세대 CD, 2세대 DVD, 3세대 블루레이 디스크 등
  • 플래시 메모리
    전자적으로 데이터를 지우고 쓸 수 있는 비휘발성 메모리로 충격에 강하다. 휴대용 기기에 많이 사용한다.
    ex. USB와 SSD

캐시 메모리(Cache Memory)

캐시 메모리는 CPU 내 또는 외에 존재하는 메모리로, 속도가 빠른 CPU와 상대적으로 속도가 느린 메인 메모리 간의 속도를 중재하는 버퍼 역할을 한다.
CPU와 메인 메모리 사이에 존재한다.

  • 캐시 메모리의 성능 결정 요소
    메인 메모리의 일정 블록 사이즈의 데이터를 담아 두었다가 CPU에 워드 사이즈 만큼의 데이터를 전송한다. 이 사이즈가 캐시의 성능에 영향을 준다.
    블록사이즈나 워드 사이즈가 상대적으로 크다면, 그만큼 Cache의 Hit Ratio 높아지기 때문이다. 각 용어의 설명은 다음과 같다.
    • ‘Cache Hit’ : CPU가 필요한 데이터가 Cache Memory 내에 들어와 있음
    • ‘Cache Miss’ : 접근하고자 하는 데이터가 없을 경우
    • ‘Hit Ratio’ : 원하는 데이터가 Cache에 있을 확률

이외에도 캐시의 성능을 결정하는 요소로 Cache 크기, 인출 방식 (Fetch Algorithm), 쓰기 정책 (Write Policy), 교체(Replace) 알고리즘,
사상(Mapping) 기법 등이 있다.

Ch2. 운영체제 (OS)

위에서 살펴본 컴퓨터의 장치, 즉 하드웨어에게 일을 시키는 주체가 바로 운영체제이다. 목적과 기능은 다음과 같다.

운영체제의 목적과 기능

  • 운영체제의 목적:
    처리능력 향상, 사용 가능도 향상, 신뢰도 향상, 반환 시간 단축
  • 운영체제의 기능:
    • 프로세서, 기억장치, 입출력장치, 파일 및 정보 등의 자원을 관리한다.
    • 자원을 효율적으로 관리하기 위해 자원의 스케줄링 기능을 제공한다.

      스케줄링: 어떤 자원을 누가, 언제, 어떤 방식으로 사용할지를 결정해주는 것

    • 사용자와 시스템 간의 편리한 인터페이스를 제공한다.
    • 시스템의 각종 하드웨어와 네트워크를 관리하고 제어한다.

운영 체제의 시스템 자원 관리

응용 프로그램은 운영체제를 통해 컴퓨터에게 일을 시킨다.
그런데 운영체제가 없다면 응용 프로그램이 실행될 수 없다.
왜냐면 응용 프로그램이 하드웨어에게 일을 시키려면 권한을 획득해야 하는데 이를 운영체제가 관리하기 때문이다.
즉 운영체제는 시스템 자원을 사용할 수 있도록 권한과 사용자를 관리한다.

  • 시스템 콜(System call): 응용 프로그램이 운영체제와 소통하기 위해운영체제가 제공하는 인터페이스(API)를 의미한다. 응용 프로그램이 시스템 자원을 사용할 수 있도록, 운영체제 차원에서 다양한 함수를 제공한다.

프로세스란

운영 체제에서는 이 프로세스를 사용하여 프로그램을 수행하는데, 쉽게 말해 되는데 실행 중인 하나의 앱을 프로세스라고 한다. 이 때 프로세스는 앱 당 하나가 아니다. 만약 크롬 브라우저 창을 두 개 띄우면 두 개의 프로세스가 생성된다. 이를 하나의 앱이 다중 프로세스를 생성했다고 한다.

정리하자면
프로세스는 특정 메모리 공간에 프로그램의 코드가 할당되고, CPU가 명령어를 하나씩 수행하고 있는 상태를 의미한다.

프로세스의 구성 요소

  • 유저 메모리 영역 관리(Virtual Address Descriptors)
    프로세스별로 독립된 영역을 가지게 되는 유저 메모리 공간이다.
  • 핸들 테이블(Handle Table)
    (프로세스에서 사용하는 모든 핸들에 대한 커널 객체 포인터 정보를 배열 형태로 가지고 있는 공간이다. 프로세스가 종료하게 될 때 이 테이블의 정보를 참고하여 이 프로세서에서 사용하고 있는 모든 커널 객체를 자동으로 반환한다.)
  • 독립적인 메모리 공간

프로세스 특징

  • 자원 소유의 단위
    각각의 프로세스는 자신의 실행 이미지 로드, 실행에 필요한 추가적인 메모리 공간을 가지고 있어야 한다.
    이는 프로세스마다 구별되어야 한다.
    해당 프로세스가 접근하고자 하는 자원과 장치도 프로세서 단위로 할당 받아 관리되어야 한다.
  • 디스패칭의 단위: 스레드
    운영체제는 여러 개의 프로세스가 병렬적으로 실행되게 하기 위해서 CPU 의 사용 시간을 각각의 프로세스에 골고루 나누어 줘야 한다.

프로세스 상태

  • 실행(Run) : 프로세스가 프로세서를 차지하여 서비스를 받고 있는 상태
  • 준비(Ready) : 실행될 수 있도록 준비되는 상태
  • 대기(Waiting) : CPU 의 사용이 아니라 입출력을 기다리는 상태

프로세서와 프로세스의 차이

  • 프로세서(Processor)
    하드웨어적인 측면의 프로세서는 컴퓨터 내에서 프로그램을 수행하는 하드웨어 유닛이다. 이 때 프로세서는 중앙처리장치(CPU)를 의미하며 CPU는 적어도 하나 이상의 ALU와 레지스터를 내장하고 있다.
    소프트웨어적인 측면의 프로세서는 데이터 처리 시스템을 의미한다. 워드프로세서나 컴파일러 등이 여기에 속한다.
  • 프로세스(Process)
    프로세스는 특정 목적을 수행하기 위해 나열된 작업의 목록을 의미한다. 위의 설명대로 앱처럼 메모리에 적재되어 프로세서에 의해 실행 중인 프로그램을 프로세스라고 한다.

스레드란?

스레드는 명령어가 CPU 를 통해서 수행되는 객체의 단위이다. 하나의 프로세스 내에는 반드시 1개 이상의 스레드가 존재하며, 이러한 스레드는 같은 프로세스에 있는 자원과 상태를 공유한다.

같은 프로세스 내에 있는 스레드는 같은 주소 공간에 존재한다. 따라서 동일한 데이터에 접근할 수 있다.
또한 같은 메모리를 참조하는 스레드 중 하나가 메모리를 수정한다면 같이 참조한 다른 스레드에 영향을 준다.
프로세스가 종료되면 그 프로세스에 속해있던 스레드도 함께 종료된다.

스레드는 하나의 프로세스 안에서 수행 능력을 향상시키기 위해 여러 작업을 하고자 할 때 사용한다. 이 스레드를 사용하면 한 프로그램의 요청을 동시에 독립적으로 수행하여 처리할 수 있다.

스레드의 구성요소

스레드는 가상 CPU, 수행 코드, 처리 데이터로 구성된다.

  • 가상 CPU : 인터프리터, 컴파일러에 의해 내부적으로 처리되는 가상 코드
  • 수행 코드 : Thread Class에 구현되어 있는 run() Method 코드
  • 처리 데이터 : Thread에서 처리하는 데이터

스레드의 특징

  • 스레드는 프로세스 내에서 실행되는 흐름의 단위다. 한 번에 하나씩 명령들을 수행한다.
  • 각 스레드마다 call stack이 존재(call stack: 실행 중인 서브루틴을 저장하는 자료 구조)한다.
    각 프로세스는 다른 프로세스의 메모리에 접근할 수 없지만, 나머지 Code, Data, Heap 영역은 스레드 끼리 공유한다.
  • 스레드는 다른 스레드와 독립적으로 동작한다.
  • 스레드에는 싱글 스레드와 멀티 스레드가 있다.

싱글 스레드(Single-Thread)

프로세스가 단일 스레드로 동작하는 방식이다.
일련의 처리를 단일 스레드만으로 직렬 처리한다.
하나의 레지스터, 스택으로 표현하며 자바스크립트가 가장 대표적인 싱글 스레드 언어다.

  • 싱글 스레드의 장점
    • 스레드가 하나라서 다른 스레드의 자원 접근에 대한 동기화를 신경쓰지 않아도 된다.
    • 문맥 교환(context switch) 작업이 필요없다.

      문맥 교환: 여러 개의 프로세스가 하나의 프로세서를 공유할 때 발생하는 작업. 다른 태스크(프로세스, 스레드)가 시작할 수 있도록 이미 실행 중인 태스크(프로세스, 스레드)를 멈추는 것을 말한다. 많은 비용을 필요로 한다.

    • 프로그래밍 난이도가 쉽고, CPU 메모리를 적게 사용한다.
  • 싱글 스레드의 단점
    • 스레드가 하나여서 여러 개의 CPU를 활용하지 못한다.
    • 프로세스끼리는 자원 공유가 어려우므로 부가 인프라가 필요합니다.
    • 연산량이 많은 작업을 하는 경우, 그 작업이 완료되어야 다른 작업을 수행할 수 있다.
    • 에러 처리를 못하는 경우 멈춰버리게 된다.

멀티 스레드 (Multi-Thread)

멀티 스레드(multi thread)란 하나의 프로세스 내에서 둘 이상의 스레드가 동시에 작업을 수행하는 것을 의미한다.

  • 멀티 스레딩의 장점
    • 작업을 분리해서 수행하므로 실시간으로 사용자에게 응답할 수 있다.
    • 한 프로세스를 여러 프로세서에서 수행할 수 있으므로 훨씬 효율적이다.
    • 시스템 자원의 활용을 극대화하고 처리량이 증대한다. 때문에 단일 프로세스 시스템의 효율성을 높일 수 있다.
  • 멀티 스레딩의 단점
    • 설계가 어렵고 디버깅이 까다롭다.
    • 프로세스 밖에서 스레드 각각을 제어할 수 없다.
    • 하나의 스레드에 문제가 발생하면 전체 프로세스가 영향을 받게 된다. 즉 자원 공유의 문제가 발생할 수 있다.
    • 문맥 교환 작업을 요구한다.

동시성과 병렬성의 차이

동시에 돌릴 수 있는 스레드 수는 컴퓨터에 있는 코어 개수로 제한된다.
운영체제는 각 스레드를 시간에 따라 분할하여, 여러 스레드가 일정 시간마다 돌아가면서 실행되도록 한다. 이런 방식을 시분할이라고 한다.

  • Concurrency(동시성, 병행성): 여러 개의 스레드가 시분할 방식으로 동시에 수행되는 것처럼 착각을 불러일으키는 것을 의미한다.
  • Parallelism(병렬성): 멀티 코어 환경에서 여러 개의 스레드가 실제로 동시에 수행되는 것을 의미한다.

Ch3. 문자열과 그래픽

문자열과 그래픽 자료에 대한 기본 정보에 대해 학습한다.

유니코드란?

유니코드(Unicode)는 전 세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계된 산업 표준이다. 유니코드 협회(Unicode Consortium)가 제정하는 이 표준이 등장하기 전에는 언어별 글자를 표현하는 방법이 제각각이었으나 이제는 통일된 유니코드를 사용할 수 있다. 이 유니코드는 ASCII를 확장한 형태로, 유니코드의 목적은 현존하는 문자 인코딩 방법을 모두 유니코드로 교체하는 것이다.

인코딩(부호화):
어떤 문자나 기호를 컴퓨터가 이용할 수 있는 신호로 만드는 것. 그 반대는 디코딩이다. 이 때 인코딩과 디코딩의 기준을 문자열 세트 또는 문자셋(charset)이라고 한다. 보통 문자셋을 유니코드를 사용한다.

ASCII 문자:
영문 알파벳을 사용하는 대표적인 문자 인코딩. 7비트로 모든 영어 알파벳을 표현할 수 있다. 52개의 영문 알파벳 대소문자, 10개의 숫자, 32개의 특수 문자, 하나의 공백 문자를 포함한다.

UTF-8

UTF-8은 Universal Coded Character Set + Transformation Format – 8-bit의 약자이다.
유니코드 문자를 나타내며 UTF-8과 UTF-16은 인코딩 방식에 차이가 있다.

UTF-8의 특징 은 다음과 같다.

1) 가변 길이 인코딩
UTF-8은 유니코드 한 문자를 나타내기 위해 1 byte(= 8 bits)에서 4 bytes까지의 가변 길이를 가지는 인코딩 방식이다.
예를 들어 한글 한 문자는 16진수로 표현할 수 있고, 이를 2진수로 바꾼다.
이 이진수를 다음의 x 안에 채워넣어 표현한다.

ex) '코'

  • 유니코드: U+CF54 (16진수, HEX) -> 2진수로 표시: 1100-1111-0101-0100
    다음의 x 안에 위 2진수를 차례로 채워넣는다.
    1110xxxx 10xxxxxx 10xxxxxx -> 1110'1100' 10'111101' 10'010100'
  • 그러면 다음의 3byte의 결과가 된다.
    11101100 10111101 10010100
  • 이 과정을 자바스크립트로 나타내면 다음과 같다.
let encoder = new TextEncoder(); // 기본 인코딩은 'utf-8'
encoder.encode('코') // Uint8Array(3) [236, 189, 148]
(236).toString(2) // "11101100"
(189).toString(2) // "10111101"
(148).toString(2) // "10010100"

UTF-8은 ASCII 코드의 경우 1 byte, 영어 외 글자는 2byte, 3byte, 보조 글자(이모지 포함)는 4byte를 차지한다.

2) 바이트 순서가 고정됨
UTF-8은 UTF-16에 비해 바이트 순서를 따지지 않고, 순서가 정해져 있다.

그래픽

디지털 이미지는 사진이나 그림을 디지털 형태로 받아들인 것을 의미하며 크게 비트맵(Bitmap)과 벡터(Vector)로 나뉜다.

  • 비트맵(래스터 방식)
    웹 상에서 디지털 이미지를 저장하는 데에 가장 많이 쓰이는 이미지 파일 포맷 형식이다.
    이미지의 각 점들을 격자형의 픽셀 단위로 구성한다.
    확대했을 때 선이 아니라 픽셀이 하나하나 모여 계단처럼 보이는 '계단 현상'이 발생한다.
    확대할수록 선이 뚜렷하지는 않으나 컴퓨터에게 부담을 덜 주는 구조로 되어 있다.
    또한 픽셀 하나당 모두 색상 값을 가지고 있기 때문에 이미지의 사이즈가 커질수록 용량도 무거워진다.

  • 벡터
    벡터는 이미지를 점과 점, 선과 선을 연결해 표현하는 수학적인 공식으로 표현을 한다.
    때문에 비트맵과는 달리 아무리 확대를 해도 ‘계단현상’이 발생하지 않는다.
    벡터 방식으로 이미지를 표현하는 것은 비트맵에 비해 컴퓨터에게 부담을 가하는 방식이다.
    주로 도형, 글자 등을 그리는 작업에 사용된다.
    수학적인 연산으로 만들어진 이미지이기 때문에 사이즈를 키워도 용량에는 변화가 없다.

  • 비트맵(래스터)과 벡터 이미지의 차이점

비트맵(래스터)벡터
기반 기술픽셀수학적으로 계산된 Shape
특징색상의 조합이 다양한 이미지, 사진로고, 일러스트
확대'계단현상' 발생해상도의 영향을 받지 않음
파일 용량(file size)크기가 크면 파일 사이즈도 커짐크기가 커져도 작은 파일 사이즈를 유지
상호 변환벡터로 변환하는 것에 오랜 시간이 걸림쉽게 래스터 이미지로 변환 가능
파일 포맷jpg, gif, png, bmp, psdsvg, ai

Ch4. 가비지 컬렉션

가비지 컬렉션이란?

가비지 컬렉션은 프로그램에서 더 이상 사용하지 않는 메모리를 자동으로 정리하는 것이다.
C 언어 같은 저수준 언어에서는 메모리 관리를 위해 개발자가 스스로 메모리를 할당하고 해제해야 한다.
그러나 JavaScript는 C언어와는 반대로 고수준 언어로 객체가 생성되었을 때 자동으로 메모리를 할당하고 필요하지 않다면 자동으로 해제하는 가비지 컬렉션이 내장되어 있다.
이 가비지 컬렉션이 어떻게 동작하는지, JavaScript가 어떻게 메모리를 관리하는지 알아야 앱의 속도 저하, 예기치 못한 종료, 느린 응답 속도와 같은 문제들이 왜 일어나는지 알 수 있다.

고수준 언어와 저수준 언어

  • 저수준 언어는 기계 친화적인 언어로 레지스터 및 메모리와 직접 상호 작용을 할 수 있다.
    컴파일러, 인터프리터가 필요하지 않아 전반적으로 빠르게 실행되는 응용 프로그램을 빌드하는 데에 사용된다.
  • 고수준 언어는 인간이 이해하기 쉬운 언어로 다양한 작업을 수행하는 프로그램을 개발할 수 있습니다. 컴파일러 또는 인터프리터를 사용하여 컴퓨터가 읽을 수 있는 기계어 코드로 변환해야 하며, 하드웨어와 직접 상호 작용하지는 않는다.

메모리 생존주기

메모리 생존 주기는 다음과 같다.

  • 필요할 때 개발자가 할당
  • 할당된 메모리를 사용(Read and Write)
  • 메모리가 더이상 필요하지 않으면 해제

여기서 할당된 메모리를 사용하는 것은 모든 언어에서 명시적으로 사용되는 부분으로 변수를 할당하는 것을 예로 들 수 있다. JavaScript와 같은 고수준 언어에서는 암묵적으로 이것이 작동하므로 개발자가 직접 제어할 수는 없다.

  • 메모리 할당
    JavaScript는 값을 선언할 때 자동으로 메모리를 할당한다.
    즉 javaScript에서 변수를 선언할 때 개발자가 크기나 타입을 지정하지 않으며 자바스크립트가 메모리 크기 할당을 알아서 자동적으로 처리한다.

  • 할당된 메모리 사용 (값 사용)
    변수나 객체 속성의 값을 읽고 쓰거나, 함수 호출 시에 함수에 인수를 전달하여 수행하는 방식 등 할당된 메모리(변수)를 사용하는 것을 의미한다.

  • 메모리 해제
    할당된 메모리가 더이상 필요 없다면 해제를 해야 앱의 성능을 저하시키지 않는다. 그러나 자바스크립트는 가비지 컬렉션이라는 자동 메모리 관리 방법을 내장한 상태이다.
    가비지 컬렉션은 메모리 할당을 추적하고, 할당된 메모리 블록이 더이상 필요하지 않게 되었는지를 판단해 필요없어진 메모리를 해제한다. 이는 개발자가 제어할 수 없으므로 가비지 컬렉터들은 제한적인 해결책을 구현한다.

가비지 컬렉션 알고리즘

가비지 컬렉션 알고리즘은 다음 레퍼런스 카운팅, 트레이싱 이 2가지가 대표적이다.
알고리즘을 알기에 앞서 참조에 대해 알아둬야 한다.

참조(reference)
어떤 객체가 다른 객체에 접근할 수 있다면 다른 객체를 참조한다고 한다.
여기서 객체는 JavaScript 객체, 함수 스코프(function scope), 전역 렉시컬 스코프(global lexical scope)도 포함하여 의미한다.

  • 렉시컬 스코핑(lexical scoping): 클로저를 배울 때 배운 개념으로, 내부함수가 접근할 수 있는 외부함수의 환경을 의미한다.

알고리즘 1) 레퍼런스 카운팅(참조 횟수 계산)
한 객체를 참조하는 변수의 수를 추적하는 방법이다.
객체를 참조하는 변수는, 변수의 레퍼런스가 복사될 때마다 레퍼런스 카운트가 늘어난다. 객체를 참조하고 있던 변수의 값이 바뀌거나, 변수 스코프를 벗어나면 레퍼런스 카운트는 줄어든다.
만약 레퍼런스 카운트가 0이 되면, 그 객체와 관련한 메모리는 비울 수 있으며 이는 더 이상 그 객체에 대한 참조가 없다는 의미다.
이 레퍼런스 카운팅 횟수를 줄이려면 순환 참조(두 객체가 서로 참조하는 것)를 피해야 한다.

알고리즘 2) 트레이싱(mark and sweep)
객체에 in-use flag를 두고, 메모리 관리자가 모든 객체를 추적해서 사용 중인지 아닌지를 표시(mark)한다. 그 후 표시되지 않은 객체를 삭제(sweep)하여 메모리를 해제한다.
mark and sweep 알고리즘은 객체가 필요한지 결정하기 위해 해당 객체에 닿을 수 있는지(reachable)를 다음과 같이 판단한다.

  1. 루트(Roots): 루트는 참조되는 전역 변수로 자바스크립트에서는 window 객체가 해당된다. Node.js에서는 global이다. 가비지컬렉터는 모든 루트의 목록을 생성한다.
  2. 모든 루트와 그 자식들을 검사하여 활성 여부를 표시한다. 루트가 닿을 수 없다면 가비지로 표시한다.
  3. 가비지 컬렉터는 활성으로 표시되지 않은 모든 메모리를 OS에 반환한다.

이 알고리즘은 레퍼런스 카운팅 방법보다는 나은 방법이다. ‘참조받지 않는 객체’는 ‘닿을 수 없는 객체’기 때문에 가비지 컬렉션을 통해 메모리를 해제할 수 있기 때문이다.

메모리 누수

메모리 누수의 주요 원인은 예상치 못한 참조이다.
예상치 못한 참조는 루트 트리 안에 존재하며, 개발자가 미처 인지하지 못한 활성화 상태의 메모리 조각들이다. 자바스크립트에서는 더이상 사용되지 않지만 코드 상 어딘가에 유지되어 해제되지 못한 변수들을 의미한다.
때문에 다음과 같은 사항에 주의하여 메모리 누수를 방지해야 한다.

  • 우발적으로 생성된 전역변수
  • DOM 외부에서의 참조
  • 클로저의 잘못된 사용

profile
프론트엔드 개발자 NH입니다. 시리즈로 보시면 더 쉽게 여러 글들을 볼 수 있습니다!

0개의 댓글