: 전자 회로 및 기계 장치로 구성
(ex : 입출력장치, 중앙처리장치, 기억장치)
: 하드웨어 위에서 하드웨어 제어하며 작업 수행하는 프로그램.
: 컴퓨터가 처리할 수 있는 형태로 데이터와 명령 받아들이는 물리적인 장치들 (ex: 키보드, 마우스, 스캐너, 태블릿, 조이콘)
: 처리된 데이터를 사람이 이해할 수 있는 형태로 출력하는 물리적 장치 (ex: 모니터, 프린터)
: 주 기억장치(RAM, ROM) & 보조 기억장치(ex: CD, 디스크)
중앙처리장치 내 구비된 레지스터 용량이 작기 때문에 주기억장치는 정보를 저장해두었다 필요할 때 읽어들이는 저장소로 사용됨.
보조기억장치는 주기억장치를 보조하는데 기억된 내용 읽는 속도는 비교적 느리지만 대용량 기억이 가능하므로 현재 사용하지 않는 프로그램은 보조기억장치에 저장. (플로피디스크, 하드디스크는 자기 디스크 / CD, DVD 는 광디스크 / USB, SSD는 플래쉬 메모리)
: 산술적 연산, 논리적 연산 담당하는 장치로 가산기, 보수기, 누산기, 기억 레지스터, 데이터 레지스터 등으로 구성됨.
캐시나 메모리로부터 읽어 온 데이터는 레지스터라는 CPU 전용 기억장소에 저장되는데 ALU는 이렇게 레지스터에 저장된 데이터 이용해 산술 연산을 수행함.
부동소수점연산장치(FPU), 정수연산장치, 논리연산장치 등이 있음.
: CPU가 자신 및 주변기기들을 컨트롤하는 장치
프로그램 순서 제어하는 프로그램 계수기
현재 수행중인 명령어 내용 임시 기억하는 명령 레지스터
명령 레지스터에 수록된 명령 해독해 수행될 장치에 제어 신호 보내는 명령해독기 로 이루어짐
: CPU 내부에 있는 기억장치로 산술 연산 논리장치에 사용되는 범용 레지스터와 PC 등 특수 목적에 사용되는 전용 레지스터로 구분
💡 레지스터 종류
- IR (Instruction Register) : 현재 수행 중에 있는 명령어 부호를 저장하고 있는 레지스터
- PC (Program Counter) : 명령이 저장된 메모리의 주소를 가리키는 레지스터
- AC (Accumulator) : 산술 및 논리 연산의 결과를 임시로 기억하는 레지스터
명령어와 데이터와 관련되어 명령어 인출, 해독을 모든 명령어들에 대해 공통적으로 수행하고, 기억장치로부터 명령어를 읽어옴.
데이터 인출, 처리, 쓰기와 같은 것들을 명령어에 따라 필요할 때 수행함.
컴퓨터에서 말하는 메모리는 기억소자(반도체)를 의미하는데, 반도체는 특성상 전류를 흐르게도 하고 흐르지 않게도 하는 특징이 있어 이를 이용해서 임시적인 내용들을 기억하게 만들 수 있다.
CPU 와 가장 가까이 있는 레지스터 메모리, 캐시 메모리, 주기억 장치, 보조기억 장치는 각각 그 특성에 차이가 있다.
메모리의 속도는 메모리가 CPU와 데이터를 주고받는 시간을 말한다.
이를 액세스라 부르며 단위는 ns(nano-second) – 10억분의 1초
메모리의 성능은 속도가 빠를 수록 성능이 좋음.
메모리는 일정 시간마다 재충전을 해줘야 하는데, 그렇지 않으면 정보는 사라지게 됨. 이 일정기간을 리프레시 시간이라고 함.
메모리에서 한번 읽고 나서 다시 읽을 수 있는 사이 시간을 말한다.
데이터를 읽어오라는 명령을 받고 데이터를 읽기 시작하기까지의 시간.
CPU에서 명령어를 처리할 때 명령어가 갖는 주소를 보내면 CPU에 그 주소에 해당하는 값을 가져 오게 되는데 걸리는 시간이 액세스 시간입니다.
사이클 시간은 메모리 작업이 완료와 동시에 대기 신호를 내놓은 후 다음 신호를 받을 준비가 되었다는 신호를 주기까지의 시간을 의미합니다. (메모리 액세스 시간 + 리프레시 시간)
캐시 메모리는 CPU 내 또는 외에 존재하는 메모리로 메인 메모리와 CPU 간 데이터 속도 향상을 위한 중간 버퍼 역할을 함.
(CPU는 일 처리가 빠른편, 메인 메모리는 느린편)
캐시 메모리는 메인 메모리의 일정 블록 사이즈의 데이터를 담아 두었다가 CPU에 워드 사이즈 만큼의 데이터를 전송하는데 이 사이즈들이 캐시의 성능에 영향을 미친다.
블록사이즈나 워드 사이즈가 상대적으로 크다면 그만큼 캐시의 Hit Ratio율이 높아지기 때문.
Hit Ratio
CPU가 필요한 데이터가 Cache Memory 내에 들어와 있으면 ‘Cache Hit’라 하고 접근하고자 하는 데이터가 없을 경우를 ‘Cache Miss’라 함. 이러한 원하는 데이터가 있을 수도 있고 없을 수도 있는데, 이때 원하는 데이터가 Cache에 있을 확률.
이 외에도 캐시 메모리 성능 결정 요소에는 캐시 크기, 인출 방식, 쓰기 정책, 교체 알고리즘, 사상 기법 등이 있음.
하드웨어 상에 프로그램들이 동작하려면 하드웨어들과 적절하게 데이터 주고 받으며 논리적 일을 시키는 운영체제가 필요함.
운영체제의 목적은 처리능력 향상, 사용 가능도 향상, 신뢰도 향상, 반환시간 단축 등이며 기능은 아래와 같다.
운영체제가 있어야 응용 프로그램들이 실행될 수 있음. 운영체제가 응용 프로그램이 하드웨어에게 일을 시킬 수 있도록 도와준다.
CPU, RAM, 디스크 등 시스템 자원 관리하는 주체가 운영체제.
응용 프로그램이 운영체제로부터 컴퓨터를 조작할 수 있는 권한을 부여받아야 운영체제를 통해 컴퓨터에게 일을 시킬 수 있음.
응용 프로그램이 운영체제와 소통하려면 운영체제가 API(인터페이스)를 제공해야 한다.
응용 프로그램이 시스템 자원을 사용할 수 있도록 운영체제 차원에서 다양한 함수 제공하는 것을 시스템 콜이라고 부름.
EX: 응용 프로그램(워드)이 프린터 사용에 대한 권한을 획득한다 ⇒
응용 프로그램이 프린터를 사용할 때 필요한 API를 호출한다
(API는 시스템 콜로 이루어져 있다.)
프로세스는 프로그램이 실행 중인 상태로 특정 메모리 공간에 프로그램의 코드가 적재되고 CPU 가 해당 명령어를 하나씩 수행하고 있는 상태를 의미함.
운영체제는 프로세스를 이용해 프로그램을 수행하게 되는데, 실행 중인 하나의 어플리케이션을 프로세스라고 부름.
사용자가 에플리케이션 실행하면 운영체제로부터 실행에 필요한 메모리 할당받아 에플리케이션 코드를 실행함.
Ex: Chrome 브라우저를 두 개 실행하면, 두 개의 프로세스가 생성된다. 이렇게 하나의 애플리케이션이 여러 프로세스(다중 프로세스)를 만들기도 합니다.
프로세스 구조체에는 프로세스마다 독립적으로 관리해야하는 유저 메모리 영역이나 프로세스가 사용하는 각종 객체들의 포인터를 관리하는 핸들 테이블을 가짐.
핸들 테이블(Handle Table)
핸들 테이블은 프로세스에서 사용하는 모든 핸들에 대한 커널 객체 포인터 정보를 배열 형태로 가지고 있는 공간.
프로세스가 종료하게 될 때 이 테이블의 정보를 참고하여 이 프로세서에서 사용하고 있는 모든 커널 객체를 자동으로 반환한다.
독립적인 메모리 공간
프로세스 단위로 관리되는 자원 중 가장 중요한 구별점은 가상 메모리인데 페이징 기법을 이용하여 프로세스마다 별도의 고유한 메모리를 사용할 수 있게 하고 있음(윈도우의 경우).
프로세서(Processor)
하드웨어적인 측면 : 컴퓨터 내에서 프로그램을 수행하는 하드웨어 유닛으로, 중앙처리장치(CPU)를 의미하며 적어도 하나 이상의 ALU와 레지스터를 내장하고 있다.
소프트웨어적인 측면 : 데이터 포맷을 변환하는 역할을 수행하는 데이터 처리 시스템.(워드프로세서나 컴파일러 등)
프로세스(Process)
특정 목적을 수행하기 위해 나열된 작업의 목록
메모리에 적재 되어 프로세서에 의해 실행 중인 프로그램을 프로세스라고 볼 수 있음.
명령어가 CPU 를 통해서 수행되는 객체의 단위
하나의 프로세스 내에는 반드시 1개 이상의 스레드가 존재하며, 이러한 스레드는 같은 프로세스에 있는 자원과 상태를 공유한다.
(하나의 스레드가 수정한 메모리는 같은 메모리를 참조하는 스레드에 영향을 미치게 된다. 하나의 스레드에서 오픈한 파일을 다른 스레드가 사용할 수 있고, 프로세스가 종료되면 그 프로세스에 속해있던 스레드도 함께 종료됨.)
여러 개의 작업 단위로 구성된 프로그램에서 요청을 동시에 처리하기 위해서 (하나의 프로세스 안에서 여러개 루틴을 동시에 수행해 수행 능력 향상하고자 할 때 스레드를 사용하게 된다.)
예를 들어, 워드 프로세서에서 사용자로부터 키보드 입력 받거나, 그래픽이나 UI를 그리고 문법 오류를 체크하는 등 워드 프로세서 내에서 여러 요청들을 동시에 처리해야 하는데, 이때 스레드가 필요하게 된다.
run()
Method 코드일련의 처리를 단일 스레드만으로 직렬 처리하는 프로그래밍 방법으로 하나의 레지스터, 스택으로 표현함. (js가 대표적인 싱글 스레드 언어)
하나의 프로세스 내에서 둘 이상의 스레드가 동시에 작업을 수행하는 것을 의미하며 멀티 프로세스(multi process)는 여러 개의 CPU를 사용하여 여러 프로세스를 동시에 수행하는 것을 의미.
동시에 돌릴 수 있는 스레드 수는 컴퓨터에 있는 코어 개수로 제한된다. 운영체제(또는 가상 머신)는 각 스레드를 시간에 따라 분할하여, 여러 스레드가 일정 시간마다 돌아가면서 실행되도록 하는데 이런 방식을 시분할이라고 한다.
: 유니코드 협회(Unicode Consortium)가 제정하는 전 세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계된 산업 표준. (ISO 10646 문자 집합, 문자 인코딩, 문자 정보 데이터베이스, 문자를 다루기 위한 알고리즘 등을 포함하고 있음)
기본적으로 유니코드의 목적은 현존하는 문자 인코딩 방법을 모두 유니코드로 교체하는 것. (이전에는 같은 한글이 적힌 텍스트 파일이더라도 표현 방식이 제각각이라 어떤 파일이 지원하지 않는 다른 인코딩 형식으로 저장된 경우 파일을 제대로 불러올 수 없었다)
: 영문 알파벳을 사용하는 대표적인 문자 인코딩으로 7 비트로 모든 영어 알파벳을 표현할 수 있다. 52개의 영문 알파벳 대소문자와, 10개의 숫자, 32개의 특수 문자, 그리고 하나의 공백 문자를 포함. 유니코드는 ASCII를 확장한 형태이다.
둘은 인코딩 방식의 차이를 의미한다.
UTF-8 : 가변 길이 인코딩, 바이트 순서 고정
: UTF-8은 유니코드 한 문자를 나타내기 위해 1 byte(= 8 bits)에서 4 bytes까지 사용한다.
네트워크를 통해 전송되는 텍스트는 주로 UTF-8로 인코딩되는데 사용된 문자에 따라 더 작은 크기의 문자열을 표현할 수 있기 때문.
UTF-8은 ASCII 코드의 경우 1 byte, 크게 영어 외 글자는 2byte, 3byte, 보조 글자는 4byte를 차지. 이모지는 보조 글자에 해당하기 때문에 4byte가 필요함.
UTF-16 : 코드 그대로 바이트로 표현 가능, 바이트 순서 다양
: UTF-16은 유니코드 코드 대부분(U+0000부터 U+FFFF; BMP) 을 16 bits로 표현.
(대부분에 속하지 않는 기타 문자는 32 bit(4 bytes)로 표현하므로 UTF-16도 가변 길이라고 할 수 있으나, 대부분은 2 바이트로 표현)
U+ABCD라는 16진수를 있는 그대로 이진법으로 변환하면 1010-1011-1100-1101
이고, 이 이진법으로 표현된 문자를 16 bits(2 bytes)로 그대로 사용하며, 바이트 순서(엔디언)에 따라 UTF-16의 종류도 달라집니다.
UTF-8에서는 한글은 3 바이트, UTF-16에서는 2 바이트를 차지.
비트맵
웹 상에서 디지털 이미지를 저장하는 데에 가장 많이 쓰이는 이미지 파일 포맷 형식으로 래스터 그래픽(점 방식)이라고 함.
이미지 각 점들이 격자형 픽셀 단위로 구성되고, 한 지역을 차지하는 셀은 위치에 따라 다른 값을 가짐.
비트맵은 사각의 픽셀 형태로 모여 있기 때문에 확대를 하면 ‘계단현상’ 또는 ‘깨짐 현상’이 발생하며, 경계가 뚜렷하지 않다.
픽셀 단위로 이미지를 표현하는 방식은 컴퓨터에게 부담을 덜 주는 구조로 되어 있음.
픽셀 하나 당 모두 색상 값을 가지고 있어서 이미지의 사이즈가 커질수록 용량 또한 무거워진다는 특징이 있다.
벡터
벡터는 이미지를 수학적인 공식으로 표현한다.
점과 점을 연결해 선을 표현하고 선과 선을 연결해 면을 표현하는 식의 수학적 원리로 그림을 그리기 때문에 비트맵과는 달리 아무리 확대를 해도 ‘계단현상’ 또는 ‘깨짐 현상’이 발생하지 않는다.
그러나 그렇기 때문에 벡터 방식으로 이미지를 표현하는 것은 비트맵에 비해 컴퓨터에게 부담을 가하는 방식임. 주로 도형, 글자 등을 그리는 작업에 사용된다. 또한 수학적인 연산으로 만들어진 이미지이기 때문에 사이즈를 키워도 용량에는 변화가 없다는 특징이 있다.
프로그램에서 더 이상 사용하지 않는 메모리를 자동으로 정리하는 것
이 기능을 가진 언어(혹은 엔진) : 자바, C#, 자바스크립트 등
C 언어 같은 저수준 언어에서는 메모리 관리를 위해 malloc()
과 free()
를 사용해 개발자가 스스로 메모리를 할당하고 해제해야 함.
JavaScript는 C언어와는 반대로 고수준 언어로서, 객체가 생성되었을 때 자동으로 메모리를 할당하고 필요하지 않다면 자동으로 해제하는 가비지 컬렉션이 내장되어 있다.
고수준 언어와 저수준 언어?
프로그래밍 언어가 인간에게 친화적인지, 기계에게 친화적인지에 따라 고수준 언어와 저수준 언어로 갈리는데,
저수준 언어는 보다 기계 친화적인 언어로 레지스터 및 메모리와 직접 상호 작용을 할 수 있음. 전반적으로 빠르게 실행되는 응용 프로그램을 빌드하는 데에 사용된다. 컴파일러나 인터프리터가 필요하지 않으므로 고수준 언어보다 빠른 편.
고수준 언어는 인간 친화적인 언어로, 인간이 이해하기 쉽고 다양한 작업을 수행하는 프로그램을 개발할 수 있음.
영어와 유사한 구문이 있기 때문에 컴파일러 또는 인터프리터를 사용하여 컴퓨터가 읽을 수 있는 기계어 코드로 변환해야 함. 하드웨어와 직접 상호 작용하지는 않는다.
메모리 생존 주기는 프로그래밍 언어에 관계 없이 비슷한데
1번과 3번은 C언어와 같은 기계친화적인 저수준 언어에서는 명시적이고, JavaScript와 같은 고수준 언어에서는 암묵적으로 작동한다.
두 가지 알고리즘이 가장 유명한데 둘 다 참조(reference) 개념을 의존하고 있음
💡 참조(reference)
명시적이든, 암묵적이든 관계없이 메모리 관리 관점에서 어떤 객체가 다른 객체에 접근할 수 있다면 다른 객체를 참조한다고 말함. 예를 들어서, JavaScript 객체는 자신의 프로토타입(prototype)에 대해 암묵적인 참조를 갖고 있고, 자신의 속성(property) 값에 대한 명시적 참조도 가지고 있음.
렉시컬 스코핑(lexical scoping)
변수 이름이 중첩된 함수에서 해석되는 방식을 정의하는 것으로, 중첩되어 있는 더 안쪽의 함수는 부모 함수가 값을 반환한 다음에도 부모 함수의 스코프를 포함하고 있습
한 객체를 참조하는 변수의 수를 추적하는 방법으로 가장 단순한 형태의 가비지 컬렉션 알고리즘.
객체를 참조하는 변수는 처음에는 특정 메모리에 대해 레퍼런스가 하나뿐이지만, 변수의 레퍼런스가 복사될 때마다 레퍼런스 카운트가 늘어난다. 객체를 참조하고 있던 변수의 값이 바뀌거나, 변수 스코프를 벗어나면 레퍼런스 카운트는 줄어드는데 레퍼런스 카운트가 0이 되면, 그 객체와 관련한 메모리는 비울 수 있음.
(레퍼런스 카운트가 0이 된다는 말은 아무도 그 객체에 대한 레퍼런스를 가지고 있지 않다는 말과 같으므로)
이 방식은 순환 참조로 인한 문제가 생길 가능성이 높다.
한 객체에 flag를 두고, 가비지 컬렉션 사이클마다 flag에 표시 후 삭제하는 mark and sweep 방법.
객체에 in-use flag를 두고, 사이클마다 메모리 관리자가 모든 객체를 추적해서 사용 중인지 아닌지를 표시(mark)한다. 그 후 표시되지 않은 객체를 삭제(sweep)하는 단계를 통해 메모리를 해제함.
현재 대부분의 가비지 컬렉션이 mark and sweep 알고리즘을 이용한 가비지 컬렉터를 장착하고 있음.
mark and sweep 알고리즘은 객체가 필요한지 결정하기 위해 해당 객체에 닿을 수 있는지 (reachable)을 판단합니다. 그리고 3단계를 거칩니다.
window
객체입니다. Node.js에서 이와 동일한 객체는 global
입니다. 가비지컬렉터는 모든 루트의 완전한 목록을 만들어낸다. 이 방법은 앞선 레퍼런스 카운팅 방법보다는 나은데, ‘참조받지 않는 객체’는 ‘닿을 수 없는 객체’기 때문에 가비지 컬렉션을 통해 메모리를 해제할 수 있기 때문.
Garbage collected 언어에서 메모리 누수의 주요 원인은 예상치 못한 참조이다.
예상치 못한 참조는 개발자는 더 이상 사용되지 않을 것이라 생각했지만, 어떠한 이유로 활성화 상태인 루트 트리 안에 존재하는 메모리 조각들을 말한다.
자바스크립트에서 예상치 못한 참조는 더이상 사용되지 않지만 코드 상 어딘가에 유지되어 해제되지 못한 변수들인데 어떤 이들은 이를 개발자의 실수라고 말하기도 함. 그래서 자바스크립트에서 발생할 수 있는 일반적인 메모리 누수 형태들을 이해하기 위해서는 흔히 까먹기 쉬운 참조들을 먼저 알아야 한다.
일반적인 메모리 누수의 3가지의 형태
프로그래밍 언어의 메모리 관리 시스템이 특정 메모리가 실제 사용중인지 미사용중인지 완벽히 구분해내는 것은 사실상 불가능에 가깝고 오직 그 코드를 작성한 개발자들만이 해당 메모리 조각을 운영체제로 반환시킬 수 있는지 여부를 명확히 알 수 있기 때문에 해당 부분들을 잘 확인하여 메모리 누수가 일어나는 부분을 막을 줄 알아야 한다.