데이터 타입은 값의 종류를 말한다. 자바스크립트(ES6)는 7개의 데이터 타입을 제공한다. 7개의 데이터 타입은 원시타입(Primitive type)과 객체 타입(Object / Reference type)으로 분류한다.
숫자 타입의 값 1과 문자열 타입의 값 '1'은 값을 생성한 목전과 용도가 다르다. 숫자 타입의 값은 주로 산술 연산을 위해 생성하지만 문자열 타입의 값은 주로 텍스트를 화면에 출력하기 위해 생성한다. 확보해야 할 메모리공간, 메모리에 저장되는 2진수, 읽는 해석 방식 차이점이 3가지나 있다.
개발자가 명확한 의도를 가지고 타입을 구별해서 값을 생성하고 자바스크립트 엔진은 타입을 구별해서 값을 취급한다.
C나 자바의 경우 정수와 실수를 구분한다. 자바스크립트는 독특하게 하나의 숫자타입만 가진다. 숫자 타입의 값은 배정밀도 64비트 부동소수점 형식을 따른다. 즉, 모든 수를 실수로 처리한다. 정수만 표현하는 데이터타입은 없다는 의미다.
정수로 표시되는 수끼리 나누더라도 실수가 나올 수 있다.
console.log(4 / 2); // 2
console.log(3 / 2); // 1.5
console.log(1 === 1.0); // true
숫자 타입의 특별한 세가지 값
console.log(10 / 0); // Infinity
console.log(10 / -0); // -Infinity
console.log(1 * 'String'); // NaN
자바스크립트는 대소문자를 구별(Case-Sensitive)하므로 NaN을 NAN, Nan, nan과 같이 표현하면 값이 아닌 식별자로 해석한다.
const x = nan; // ReferenceError: nan is not defined
문자열 타입은 텍스트 데이터를 나타내는 데 사용한다. 문자열은 0개 이상의 16비트 유니코드 문자(UTF-16)의 집합으로 전 세계 대부분의 문자를 표현할 수 있다.
문자열은 작은따옴표, 큰따옴표 또는 백틱으로 텍스트를 감싼다. 다른 타입의 값과 달리 문자열을 따옴표로 감싸는 이유는 키워드나 식별자 같은 토큰과 구분하기 위해서다.
자바스크립트의 문자열은 원시 타입이며, 변경 불가능한 값이다. 이것은 문자열이 생성되면 그 문자열을 변경할 수 없다는 것을 의미한다.
템플릿 리터럴은 멀티라인 문자열, 표현식 삽입, 태그드 템플릿 등 편리한 문자열 처리 기능을 제공한다. 템플릿 리터럴은 런타임에 인발 문자열로 변환된다.
일반 문자열 내에서는 줄바꿈이 허용되지 않는다. 일반 문자열 내에서 줄바꿈 등의 공백을 표현하려면 백슬래시로 시작하는 이스케이프 시퀀스를 사용해야한다.
일반 문자열과 달리 템플릿 리터럴 내에서는 이스케이프 시퀀스를 사용하지 않고도 줄바꿈이 허용된다.
const template = `<ul>
<li>Home</li>
</ul>`;
문자열은 문자열 연산자 +를 사용해 연결할 수 있다. +연산자는 피연산자 중 하나 이상이 문자열인 경우 문자열 연결 연산자로 동작한다.
const one = 'first';
const two = 'second';
console.log('My name is' + ' ' + one + ' ' + two); // My name is first second
표현식을 삽입하려면 ${}으로 표현식을 감싼다.
const one = 'first';
const two = 'second';
console.log(`My name is ${one} ${two}.`); // My name is first second.
템플릿 리터럴이 아닌 일반 문자열에서의 표현식 삽입은 무자열로 취급된다.
불리언 타입의 값은 참(true)과 거짓(false)으로 구분되는 조건에 의해 프로그램의 흐름을 제어하는 조건문에서 자주 사용한다.
undefined 타입의 값은 undefined가 유일하다.
자바스크립트 엔진이 변수를 초기화할 때 사용하는 값이다. 변수를 참조했을 때 undefined가 반환된다면 참조한 변수가 선언 이후 값이 할당된적이 없는 것이고 초기화되지 않은 변수라는 것을 간파할 수 있다.
undefined를 직역하면 "정의되지 않은"이다. undefined에서 말하는 정의란 변수에 값을 할당하여 변수의 실체를 명확히 하는 것을 말한다. 자바스크립트의 경우 변수를 선언하면 암묵적으로 정의가 이뤄지기 때문에 선언과 정의의 구분이 모호하다.
ECMAScript 사양에서 변수는 '선언한다.'라고 표현하고, 함수는 '정의한다'라고 표현한다.
null 타입의 값은 null이 유일하다.
프로그래밍 언어에서 null은 변수에 값이 없다는 것을 의도적으로 명시할 때 사용한다. 변수에 null을 할당하는 것은 변수가 이전에 참조했던 값을 더 이상 참조하지 않겠다는 의미다. 이전에 할당되어 있던 값에 대한 참조를 명시적으로 제거하는 것을 의미한다.
HTML 요소를 검색해 반환하는 document.qeurySelector 메서드는 조건에 부합하는 HTML 요소를 검색할 수 없는 경우 에러 대신 null을 반환한다.
심벌 타입은 변경 불가능한 원시 타입의 값이다. 심벌 값은 다른 값과 중복되지 않는 유일무이한 값이다. 이름이 충돌할 위험이 없는 객체의 유일한 프로퍼티 키를 만들기 위해 사용한다. 심벌 이외의 원시 값은 리터럴을 통해 생성하지만 심벌은 symbol 함수를 호출해 생성한다.
자바스크립트의 데이터 타입은 크게 원시 타입과 객체 타입으로 분류한다. 자바스크립트는 객체 기반의 언어이며, 자바스크립트를 이루고 있는 거의 모든 것이 객체이다.
값은 메모리에 저장하고 참조할 수 있어야 한다. 메모리에 값을 저장하려면 먼저 확보해야 할 메모리 공간의 크기를 결정해야 한다. 이는 변수에 할당되는 값의 데이터 타입에 따라 결정된다.
ECMAScript 사양은 문자열과 숫자 타입 외의 데이터 타입의 크기를 명시적으로 규정하고 있지 않다. 숫자 타입은 배정밀도 64비트 부동소수점 형식을 사용한다고 명시되어 있고 배정밀도 64비트 부동소수점 형식은 8바이트로 숫자를 표현한다.
값을 참조하려면 메모리 셀의 개수(바이트 수)를 알아야 한다. 저장되어 있는 값이 숫자 타입일 때 8바이트 단위로 읽어 들이지 않으면 값이 훼손된다. 숫자 타입은 8바이트 단위로 저장되므로 score 변수를 참조하면 8바이트 단위로 메모리 공간에 저장된 2진수를 값을 읽어 들인다.
메모리에서 읽어 들인 2진수를 어떻게 해석해야 할까
예를 들어서 변수에 할당된 값은 숫자이다. 그러면 메모리 공간의 주소에서 읽어 들인 2진수를 숫자로 해석한다.
정적 타입 언어는 데이터 타입을 사전에 선언해야 한다. 이를 명시적 타입 선언이라 한다. 정적 타입 언어는 변수 선언 시점에 변수의 타입이 결정되고 변수의 타입을 변경할 수 없다. 또한 컴파일 시점에 타입 체크(선언한 데이터 타입에 맞는 값을 할당했는지 검사하는 처리)를 수행한다. 이를 통해 타입의 일관성을 강제함으로써 더웅 안정적인 코드의 에러를 줄인다.
자바스크립트는 변수를 선언할 때 타입을 선언하지 않는다. 어떠한 데이터 타입의 값이라도 자유롭게 할당할 수 있다. 자바스크립트의 변수는 선언이 아닌 할당에 의해 타입이 결정된다. 그리고 재할당에 의해 변수의 타입은 언제든지 종적으로 변할 수 있다. 자바스크립트는 동적 타입 언어이다.
변수는 타입을 가질까? 기본적으로 변수는 타입을 갖지 않는다. 값이 타입을 갖는다. 변수에 할당된 값에 의해 변수의 타입이 동적으로 결정된다고 표현한다.
동적 타입 언어의 특징은 데이터 타입에 대해 무감각해질 정도로 편리하다는 것이다. 동적 타입 언어의 변수는 값을 확인하기 전에는 타입을 확신할 수 없다. 숫자 타입의 변수일 것이라고 예측하지만 사실은 문자열 타입의 변수일 수도 있다. 결국 동적 타입 언어는 유연성은 높지만 신뢰성이 떨어진다.
이러한 이유로 안정적인 프로그램을 만들기 위해 변수를 사용하기 이전에 데이터 타입을 체크해야 하는 경우가 있는데 이는 매우 번거로울뿐더러 코드의 양도 증가한다.