LearnCPP - 4

Justin·2026년 2월 13일

Learncpp.com

LearnCPP.com

목록 보기

3/22

자료형 (Data types)

컴퓨터에 있는 모든 데이터는 결국 단순히 '비트의 나열(0과 1의 연속)'일 뿐이에요. 그래서 우리는 컴파일러에게 이 메모리의 내용을 어떻게 의미 있게 해석해야 하는지 알려주기 위해 자료형(data type), 줄여서 타입(type)을 사용합니다.

여러분이 어떤 객체(변수)에 값을 주면, 컴파일러와 CPU는 그 자료형에 맞는 적절한 비트 순서로 값을 인코딩(encoding, 변환)해서 메모리에 저장합니다. (기억하세요: 메모리는 오직 비트만 저장할 수 있어요!)

예를 들어, 만약 정수형 객체에 65라는 값을 할당한다면, 이 값은 0100 0001이라는 비트 순서로 변환되어 해당 객체에 할당된 메모리에 저장됩니다.

반대로, 그 객체를 사용하여 값을 불러올때는, 저장되어 있던 비트 순서가 다시 원래의 값으로 재구성(reconstituted)됩니다.
즉, 0100 0001이 다시 값 65로 변환되는 것이죠.

다행히도, 이런 복잡한 작업은 컴파일러와 CPU가 모두 알아서 처리해 줍니다.
그래서 여러분은 값이 어떻게 비트 순서로 변환되고 다시 돌아오는지에 대해 깊게 고민할 필요가 없어요.

다양한 종류의 자료형 (Other sets of types)

C++에는 세 가지 종류의 자료형이 있습니다.

기본 자료형(fundamental data types)

가장 기초적이고 필수적인 자료형을 제공합니다.
int, double, char, bool…

복합 자료형(compound data types)

기본 자료형을 조합해서 만들거나, “형태”가 더 복잡한 타입들 입니다.
int*, int&, struct Point, enum Color…

C++ 표준 라이브러리 자료형(C++ standard library)

표준 라이브러리는 모든 C++ 배포판에 포함되어 있으므로, 이 타입들은 광범위하게 사용 가능하며 호환성을 위해 표준화되어 있습니다.

표준 라이브러리의 타입을 사용하려면 적절한 헤더를 포함(include)하고 표준 라이브러리를 링크해야 합니다.
std::string, std::vector<int>, std::map<...>, std::unique_ptr<...>…

기본 자료형 (Fundamental data types)

C++ 언어는 사용자가 바로 사용할 수 있는 많은 미리 정의된 자료형을 제공합니다.
이 중 가장 기본적인 것들을 기본 자료형이라고 합니다.
비공식적으로는 기초 타입(basic types) 또는 원시 타입(primitive types) 이라고도 부릅니다).

Types	Category	Meaning	Example
`float` `double` `long double`	Floating Point	a number with a fractional part	3.14159
`bool`	Integral (Boolean)	true or false	true
`char` `wchar_t` `char8_t` (C++20) `char16_t` (C++11) `char32_t` (C++11)	Integral (Character)	a single character of text	'c'
`short int` `int` `long int` `long long int` (C++11)	Integral (Integer)	positive and negative whole numbers, including 0	64
`std::nullptr_t` (C++11)	Null Pointer	a null pointer	nullptr
`void`	Void	no type	n/a

정수(Integer) vs 정수형(Integral) 타입

표준 정수 타입 short int long long long
정수형 타입 bool 다양한 char 타입들 표준 정수 타입
모든 정수형 타입은 메모리에 정수 값으로 저장되지만, 출력 시 표준 정수 타입만이 정수 값(숫자)으로 표시됩니다.

또한 정수형 타입이라는 용어는 오직 기본 자료형만을 포함한다는 점에 유의하세요.
이는 enum이나 enum class 같은 비(非)기본 자료형은 정수형 타입이 아니라는 것을 의미합니다.
비록 정수로 저장되고, enum의 경우 정수로 출력되더라도 말이죠.

_t 접미사 (The _t suffix)

std::nullptr_t 같이 새로운 버전의 C++에서 정의된 많은 타입들은 _t 접미사를 사용합니다.
이 접미사는 타입(type)을 의미하며, 현대적인 타입들에 적용되는 일반적인 명칭법입니다.
만약 _t가 붙은 무언가를 본다면, 그것은 아마도 타입일 것입니다.
하지만 많은 타입들이 _t 접미사를 가지고 있지 않으므로, 이것이 일관되게 적용되는 규칙은 아닙니다.

보이드 (Void)

기본적으로 void는 타입 없음(no type)을 의미합니다.
보이드는 불완전한 타입의 첫 번째 예시입니다.
불완전한 타입이란 선언은 되었으나 아직 정의되지 않은 타입을 말합니다.
불완전한 타입은 인스턴스화(instantiated)할 수 없습니다.

객체 크기 (Object sizes)

최신 컴퓨터의 메모리는 보통 바이트(byte) 단위로 구성됩니다.
각 메모리 바이트는 고유한 주소(address)를 가지고 있습니다.
객체가 사용하는 메모리의 양은 해당 객체의 자료형(data type)에 따라 결정됩니다.

기본 자료형 크기 (Fundamental data type sizes)

놀랍게도 C++ 표준은 기본 자료형의 정확한 크기(비트 단위)를 정의하지 않습니다.
자료형의 크기를 말할 때는, 실제로는 해당 자료형으로 인스턴스화된(instantiated) 객체의 크기를 의미합니다.

대신 표준은 다음과 같이 명시합니다.
- 객체는 최소 1바이트를 차지해야 합니다 (각 객체가 고유한 메모리 주소를 갖도록 하기 위함).
- 1바이트는 최소 8비트여야 합니다.
- 정수형인 char short int long long long 은 각각 최소 8 16 16 32 64비트의 크기를 가집니다.
- char와 char8_t는 정확히 1바이트입니다.

분류	자료형 (Type)	최소 크기 (Minimum Size)	일반적인 크기 (Typical Size)
불리언 (Boolean)	`bool`	1 byte	1 byte
문자 (Character)	`char`	1 byte (exactly)	1 byte
문자 (Character)	`wchar_t`	1 byte	2 or 4 bytes
문자 (Character)	`char8_t`	1 byte	1 byte
문자 (Character)	`char16_t`	2 bytes	2 bytes
문자 (Character)	`char32_t`	4 bytes	4 bytes
정수 (Integral)	`short`	2 bytes	2 bytes
정수 (Integral)	`int`	2 bytes	4 bytes
정수 (Integral)	`long`	4 bytes	4 or 8 bytes
정수 (Integral)	`long long`	8 bytes	8 bytes
부동 소수점 (Floating point)	`float`	4 bytes	4 bytes
부동 소수점 (Floating point)	`double`	8 bytes	8 bytes
부동 소수점 (Floating point)	`long double`	8 bytes	8, 12, or 16 bytes
포인터 (Pointer)	`std::nullptr_t`	4 bytes	4 or 8 bytes

sizeof 연산자 (The sizeof operator)

특정 머신에서 자료형의 크기를 확인하기 위해, C++은 sizeof라는 연산자를 제공합니다.
sizeof 연산자는 자료형이나 변수를 받아, 해당 자료형의 객체 크기를 바이트 단위로 반환하는 단항 연산자(unary operator)입니다.

오버플로우 (Overflow)

표현식 평가 중 결과가 수학적으로 정의되지 않거나 해당 타입의 표현 가능한 값 범위에 있지 않은 경우, 그 동작은 미정의(undefined)됩니다.
통상적으로 이를 오버플로우(overflow)라고 부릅니다.
산술 연산(덧셈이나 곱셈 등)이 표현 가능한 범위를 벗어나는 값을 생성하려고 시도하는 것을 정수 오버플로우(integer overflow) 또는 산술 오버플로우(arithmetic overflow)라고 합니다.

부호 없는 정수의 오버플로우 (Overflow)

숫자 280은 1바이트 범위인 0~255에 담기에 너무 큽니다.
- 이 타입의 가장 큰 수보다 1 큰 수는 256입니다.
- 따라서 280을 256으로 나누면 몫은 1이고 나머지는 24가 됩니다.
- 결과적으로 24가 저장됩니다.
이를 생각하는 또 다른 방법은 모듈러 래핑(modulo wrapping) 또는 순환(wrap around)입니다.
해당 타입으로 표현할 수 있는 가장 큰 수보다 큰 수는 단순히 범위를 "한 바퀴 돌아서" 처음으로 돌아갑니다.

반대 방향으로도 래핑이 가능합니다.
- unsigned short 타입의 가장 큰 수는 65535입니다.
- 0은 2바이트 부호 없는 정수로 표현 가능하므로 괜찮습니다.
- -1은 표현할 수 없으므로 범위의 맨 끝(최댓값)으로 래핑되어 값 65535를 생성합니다.
- -2는 65534가 됩니다. 이런 식으로 계속됩니다.

부호 없는 숫자에 대한 논란

signed 값은 0에서 멀리 떨어진 값들이 범위의 끝에 있기 때문에 실수로 범위의 위나 아래를 넘기기 쉽지 않습니다.
하지만 unsigned 숫자는 범위의 시작이 0이고, 대다수의 값이 0 근처에 있기 때문에 범위의 하단을 넘겨 오버플로우 시키기가 훨씬 쉽습니다.

더 교묘하게도, 부호 있는 정수 와 부호 없는 정수를 섞어서 사용할 때 예상치 못한 동작이 발생할 수 있습니다.
C++에서는 수학 연산에 부호 있는 정수 하나와 부호 없는 정수 하나가 포함된 경우, 부호 있는 정수가 보통 부호 없는 정수로 변환됩니다.

Best Practice

음수가 아니어야 하는 수량일지라도 저장하거나 수학적 연산을 할 때는 부호 없는 숫자보다 부호 있는 숫자를 선호하십시오.

부호 있는 숫자와 부호 없는 숫자를 섞어서 사용하지 마십시오.

그렇다면 언제 부호 없는 숫자를 사용해야 할까요?

비트 조작(bit manipulation)을 다룰 때 부호 없는 숫자가 선호됩니다.
또한 암호화나 난수 생성 알고리즘처럼 잘 정의된 래핑 동작이 필요한 경우에도 유용합니다.
주로 배열 인덱싱(array indexing)과 관련된 경우 부호 없는 숫자의 사용이 불가피할 때가 있습니다.
임베디드 시스템(예: 아두이노)이나 프로세서/메모리가 제한된 환경을 위해 개발하는 경우, 성능상의 이유로 부호 없는 숫자의 사용이 더 일반적이고 용인되며(어떤 경우에는 불가피하게) 사용됩니다.

고정 너비 정수 (Fixed-width integers)

크기가 고정되어 있기 때문에 이를 고정 너비 정수(fixed-width integers)라고 부릅니다.
고정 너비 정수는 <cstdint> 헤더에 다음과 같이 정의되어 있습니다.
고정 너비 정수는 사실 새로운 타입을 정의하는 것이 아닙니다.
원하는 크기를 가진 기존 정수형의 별칭(alias)일 뿐입니다.

이름	고정 크기	고정 범위	비고
`std::int8_t`	1 byte (signed)	-128 ~ 127	많은 시스템에서 `signed char`처럼 취급됨. 아래 참고.
`std::uint8_t`	1 byte (unsigned)	0 ~ 255	많은 시스템에서 `unsigned char`처럼 취급됨. 아래 참고.
`std::int16_t`	2 byte (signed)	-32,768 ~ 32,767
`std::uint16_t`	2 byte (unsigned)	0 ~ 65,535
`std::int32_t`	4 byte (signed)	-2,147,483,648 ~ 2,147,483,647
`std::uint32_t`	4 byte (unsigned)	0 ~ 4,294,967,295
`std::int64_t`	8 byte (signed)	-9,223,372,036,854,775,808 ~ ...	(매우 큰 값)
`std::uint64_t`	8 byte (unsigned)	0 ~ 18,446,744,073,709,551,615

빠른(Fast) 및 최소(Least) 정수 타입

빠른 타입 std::int_fast#_t 및 std::uint_fast#_t
적어도 # 비트의 크기를 가지면서 가장 빠른 부호 있는/없는 정수 타입을 제공합니다. (# = 8 16 32 64)
예를 들어 std::int_fast32_t는 32비트 이상인 정수 중 가장 빠른 타입을 제공합니다.
여기서 '가장 빠르다'는 것은 CPU가 가장 빠르게 처리할 수 있는 정수형을 의미합니다.

최소 타입 std::int_least#_t 및 std::uint_least#_t
적어도 # 비트의 크기를 가지면서 가장 작은 부호 있는/없는 정수 타입을 제공합니다. (# = 8 16 32 64)
예를 들어 std::uint_least32_t는 32비트 이상인 정수 중 가장 작은 타입을 제공합니다.

과학적 표기법(Scientific notation)

과학적 표기법은 긴 숫자를 간결하게 작성하기 위한 유용한 약기법입니다.
과학적 표기법의 숫자는 다음과 같은 형태를 띱니다.

관례상 과학적 표기법의 숫자는 소수점 앞에 한 자리 숫자만 오고, 나머지 자릿수는 소수점 뒤에 오도록 작성합니다.
C++에서는 지수를 입력하거나 표시하기 어렵기 때문에, 우리는 e (또는 간혹 E)라는 문자를 사용하여 "10의 거듭제곱" 부분을 표현합니다.

유효 숫자 (Significant digits)

가수에 있는 숫자들을 유효 숫자라고 합니다.
유효 숫자가 많을수록 숫자는 더 정밀합니다.

십진수를 과학적 표기법으로 변환하는 방법

1. 지수는 0에서 시작합니다.
1. 숫자에 명시적인 소수점이 없다면, 암시적으로 오른쪽 끝에 있는 것입니다. (예: 123.)
1. 소수점 왼쪽에 0이 아닌 숫자가 단 하나만 남을 때까지 소수점을 왼쪽이나 오른쪽으로 이동합니다.
- 소수점을 왼쪽으로 한 칸 이동할 때마다 지수가 1씩 증가합니다.
- 소수점을 오른쪽으로 한 칸 이동할 때마다 지수가 1씩 감소합니다.
1. 선행 0 (가수의 왼쪽 끝에 있는 0) 을 잘라냅니다.
1. 원래 숫자에 소수점이 없었던 경우에만 후행 0(가수의 오른쪽 끝에 있는 0)을 잘라냅니다.
- 우리는 이 0들이 유효하지 않다고 가정합니다.
- 만약 유효하다는 추가 정보가 있다면 유지할 수 있습니다.

부동 소수점 수 (Floating point numbers)

부동 소수점 타입 변수는 4320.0 -3.33 0.01226 과 같이 소수 부분이 있는 숫자를 저장할 수 있는 변수입니다.
부동 소수점 데이터 타입은 항상 signed 부호가 있습니다.

부동 소수점 정밀도 (Floating point precision)

부동 소수점 타입의 정밀도는 정보 손실 없이 표현할 수 있는 유효 숫자의 개수를 정의합니다.
부동 소수점 타입이 가진 정밀도의 자릿수는 크기와 저장되는 특정 값에 따라 달라집니다.

float 은 6~9자리의 정밀도를 가집니다.
이는 float가 최대 6자리의 유효 숫자를 가진 어떤 숫자든 정확하게 표현할 수 있음을 의미합니다.
7~9자리의 유효 숫자를 가진 숫자는, 값에 따라 정확하게 표현될 수도 있고 아닐 수도 있습니다.
그리고 9자리 이상의 정밀도를 가진 숫자는 확실히 정확하게 표현되지 않습니다.

double 값은 15~18자리의 정밀도를 가지며, 대부분의 double 값은 적어도 16자리의 유효 숫자를 가집니다.
long double은 차지하는 바이트 수에 따라 최소 15 18 또는 33 자리의 유효 숫자를 가집니다.

우리는 std::setprecision()이라는 출력 조정자 함수를 사용하여 std::cout이 보여주는 기본 정밀도를 재설정할 수 있습니다.
출력 조정자는 데이터가 출력되는 방식을 변경하며 <iomanip> 헤더에 정의되어 있습니다.
숫자를 정확하게 저장할 수 없어 정밀도가 손실되는 것을 반올림 오차(rounding error)라고 합니다.

불리언 변수 (Boolean variables)

불리언 변수는 true 와 false 두 가지 값만 가질 수 있는 변수입니다.
불리언 변수를 선언하려면 bool 키워드를 사용합니다.
정수가 불리언으로 변환될 수 있는 모든 문맥에서, 정수 0은 false 로 변환되고, 그 외의 모든 정수는 true로 변환됩니다.
불리언 변수의 기본값은 false 입니다.

bool b;

불리언 변수를 초기화하거나 값을 대입하려면 true와 false 키워드를 사용합니다.

bool b1 { true };
bool b2 { false };
b1 = false;
bool b3 {}; // 기본값인 false로 초기화됨

불리언 값은 실제로는 불리언 변수에 true 나 false라는 단어로 저장되지 않고, 정수값으로 저장됩니다.
true는 정수 1로, false는 정수 0으로 저장됩니다.
불리언은 정수값을 저장하기 때문에 정수형으로 간주됩니다.

std::boolalpha를 사용하여 true 또는 false로 출력하기

만약 std::cout이 0이나 1 대신 true나 false를 출력하게 하려면 std::boolalpha를 출력하면 됩니다.
이것은 아무것도 출력하지 않지만, std::cout이 bool 값을 출력하는 방식을 변경합니다.

#include <iostream>

int main()
{
    std::cout << true << '\n';
    std::cout << false << '\n';

    std::cout << std::boolalpha; // bool 값을 true 또는 false로 출력하게 설정

    std::cout << true << '\n';
    std::cout << false << '\n';
    return 0;
}

이 코드는 다음과 같이 출력합니다.

1 0 true false

std::noboolalpha를 사용하면 설정을 다시 끌 수 있습니다.

문자형 (Chars)

char 기본 자료형은 단 하나의 문자를 저장하기 위해 설계되었습니다.
문자란 글자 한 자 숫자 기호 또는 공백 등이 될 수 있습니다.

char 데이터 타입은 정수형입니다.
즉, 내부적으로 값이 정수로 저장된다는 뜻입니다.

char 변수에 저장된 정수는 ASCII 문자로 해석됩니다.

문자(char) 초기화

문자 리터럴을 사용하여 char 변수를 초기화할 수 있습니다.

char ch2{ 'a' }; // 'a'의 코드 포인트로 초기화 (정수 97로 저장됨) (권장함)

정수로도 초기화할 수 있지만, 가능하면 피해야 합니다.

char ch1{ 97 }; // 정수 97로 초기화 ('a') (권장하지 않음)

암시적 형 변환 (Implicit type conversion)

대부분의 경우, C++은 우리가 기본 자료형의 값을 다른 기본 자료형으로 변환하는 것을 허용합니다.
데이터의 타입을 다른 타입으로 변환하는 과정을 형 변환(type conversion)이라고 합니다.
우리가 명시적으로 요청하지 않았는데도 컴파일러가 대신 형 변환을 수행하는 것을 암시적 형 변환(implicit type conversion)이라고 합니다.

형 변환은 새로운 값을 생성합니다 (Type conversion produces a new value)

형 변환 과정은 변환할 데이터를 제공하는 값 자체를 수정하지 않습니다.
대신, 변환 과정은 그 데이터를 입력으로 사용하여 변환된 새로운 결과값을 만들어냅니다.
변환될 데이터가 인자로 전달되고, 변환된 결과가 임시 객체에 담겨 반환되어 호출자가 사용하게 됩니다.

어떤 형 변환은 변환되는 값을 항상 보존하지만, (예: char에서 int)
어떤 변환은 변환 중에 값이 변경될 수 있습니다. (예: double에서 int)
중괄호 초기화의 경우 에러를 발생시킵니다. (축소 변환을 허용하지 않기 때문입니다.)

static_cast 연산자를 통한 명시적 형 변환 소개

명시적 형 변환은 프로그래머가 컴파일러에게 값을 한 타입에서 다른 타입으로 변환하도록 명시적으로 지시하고, 그 변환 결과에 대해 전적으로 책임을 지겠다고 선언하는 것입니다.
명시적 형 변환을 수행하기 위해 대부분의 경우 static_cast 연산자를 사용합니다.

static_cast<새로운_타입>(표현식)

std::size_t란 무엇일까요?

다음 코드를 한 번 살펴볼게요.

#include <iostream>

int main(){
    std::cout << sizeof(int) << '\n';

    return 0;
}

이 코드가 다음과 같이 출력된답니다.

아주 간단하죠? 여기서 우리는 sizeof 연산자(operator)가 정수 값을 반환한다는 것을 유추할 수 있어요.
그렇다면 이 반환 값은 정확히 어떤 정수형(integral type)일까요? int일까요? 아니면 short일까요?

정답은 바로 sizeof가 반환하는 값의 타입이 std::size_t라는 것입니다.
std::size_t는 컴파일러의 구현에 따라 정의되는 부호 없는 정수형의 별칭이에요.
다시 말해, std::size_t가 unsigned int가 될지, unsigned long이 될지, 아니면 unsigned long long이 될지 등은 컴파일러가 알아서 결정한다는 뜻이지요.

일반적인 정수형이 시스템에 따라 크기가 달라질 수 있는 것처럼, std::size_t 역시 시스템에 따라 크기가 변할 수 있습니다.
std::size_t는 부호가 없는 최소 16비트(2바이트) 이상의 크기를 가진다는 것이 보장되지만, 대부분의 시스템에서는 애플리케이션의 주소 너비와 동일한 크기를 갖게 됩니다.
즉, 32비트 애플리케이션에서는 일반적으로 32비트 부호 없는 정수가 되고, 64비트 애플리케이션에서는 64비트 부호 없는 정수가 되는 식이죠.

Justin

안녕하세요.

이전 포스트

LearnCPP - 1 & 2

다음 포스트

LearnCPP - 4

LearnCPP.com

자료형 (Data types)

다양한 종류의 자료형 (Other sets of types)

기본 자료형 (Fundamental data types)

정수(Integer) vs 정수형(Integral) 타입

_t 접미사 (The _t suffix)

보이드 (Void)

객체 크기 (Object sizes)

기본 자료형 크기 (Fundamental data type sizes)

sizeof 연산자 (The sizeof operator)

오버플로우 (Overflow)

부호 없는 정수의 오버플로우 (Overflow)

부호 없는 숫자에 대한 논란

그렇다면 언제 부호 없는 숫자를 사용해야 할까요?

고정 너비 정수 (Fixed-width integers)

빠른(Fast) 및 최소(Least) 정수 타입

과학적 표기법(Scientific notation)

유효 숫자 (Significant digits)

십진수를 과학적 표기법으로 변환하는 방법

부동 소수점 수 (Floating point numbers)

부동 소수점 정밀도 (Floating point precision)

불리언 변수 (Boolean variables)

std::boolalpha를 사용하여 true 또는 false로 출력하기

문자형 (Chars)

문자(char) 초기화

암시적 형 변환 (Implicit type conversion)

형 변환은 새로운 값을 생성합니다 (Type conversion produces a new value)

static_cast 연산자를 통한 명시적 형 변환 소개

std::size_t란 무엇일까요?

LearnCPP - 1 & 2

LearnCPP - 5

0개의 댓글