#6. 데이터 타입

해피데빙·2022년 7월 12일
0

데이터 타입이란?

  • 값의 종류
  • 자바스크립트의 모든 값은 데이터 타입을 갖는다
  • 자바스크립트는 7개의 데이터 타입
    - 원시 타입 : 숫자, 문자열, 불리언, undefined, null, 심벌
    • 객체 타입 : 객체, 함수, 배열 등

'1'(문자열)과 1(숫자)은 생성한 목적과 용도가 다르다
그러므로 확보해야 할 메모리 공간의 크기도 다르고 메모리에 저장되는 2진수도 다르며 읽어 들여 해석하는 방식도 다르다

  • 개발자는 명확한 의도를 가지고 타입을 구별해서 값을 생성한다
  • 자바스크립트 엔진은 타입을 구별해서 값을 취급한다

1. 숫자 타입

포인트
자바스크립트는 모든 수를 실수로 처리한다 (즉 하나의 숫자 타입만 존재한다)
모두 메모리에 배정밀도 64비트 부동소수점 형식의 2진수로 저장된다
하지만 값을 참조하면 모두 10진수로 해석된다 (다른 진수를 표현하기 위한 데이터 타입 X)

cf. C나 자바의 경우, 정수(소수점 이하가 없는 숫자)와 실수(소수점 이하가 있는 숫자)를 구분
: int, long, float, double 등과 같은 다양한 숫자 타입을 제공한다

하지만 자바스크립트는 하나의 숫자 타입만 존재!
숫자 타입의 값은 배정밀도 64비트 부동소수점 형식(??)을 따른다
-> 모든 수를 실수로 처리하며 정수로 표현하기 위한 데이터 타입이 별도로 존재 x

var integer = 10; //정수
var double = 10.12; //실수
var negative = -20; //음의 정수

정수, 실수, 2진수, 8진수, 16진수 리터럴은 모두 메모리에 배정밀도 64비트 부동소수점 형식의 2진수로 저장된다.
자바스크립트는 2진수, 8진수, 16진수를 표현하기 위한 데이터 타입을 제공하지 않기 때문에 이들 값을 참조하면 모두 10진수로 해석된다.

자바스크립트의 숫자 타입은 정수만을 위한 타입이 없고 모든 수를 실수로 처리한다고 했다
이는 정수로 표시된다 해도 사실은 실수라는 것을 의미한다
따라서 정수로 표시되는 수끼리 나누더라도 실수가 나올 수 있다

추가적으로 세가지 특별한 값도 표현할 수 있다

  • infinity : 양의 무한대
  • -infinity : 음의 무한대
  • NaN : 산술 연산 불가
숫자 타입의 세 가지 특별한 값 
console.log(10/0); //Infinity
console.log(10/-0); //-Infinity
console.log(1 * 'String'); //NaN

cf. 자바스크립트는 대소문자를 구별하므로 정확하게 표현을 해야 한다

2. 문자열 타입

문자열 타입은 텍스트 데이터를 나타내는데 사용한다. 문자열은 0개 이상의 16비트 유니코드 문자의 집합으로 전 세계 대부분의 문자를 표현할 수 있다

'', "", `` 등으로 텍스트를 감싼다

이유1. 키워드나 식별자 같은 토큰과 구분하기 위해
이유2. 스페이스와 같은 공백 문자를 포함시키기 위해

cf. C는 문자열 타입을 제공하지 않고 문자의 배열로 문자열을 표현
자바는 문자열을 객체로 표현한다

자바스크립트의 문자열은 원시 타입, 변경 불가능한 값 (immutable)
-> 문자열이 생성되면 그 문자열을 변경할 수 없다는 것을 의미

3. 템플릿 리터럴

  • ES6부터 도입된 새로운 문자열 표기법
  • 멀티라인 문자열, 표현식 삽입, 태그드 템플릿 등 편리한 문자열 처리 기능 제공
  • 런타임에 일반 문자열로 변환되어 처리된다

탬플릿 리터럴은 일반 문자열과 비슷해 보이지만 작은따옴표 또는 큰타옴표 같은 일반적인 따옴표 대신 백틱을 사용해 표현한다

멀티라인 문자열

: 일반 문자열 내에서는 줄바꿈(개행) X
: 그러므로 일반 문자열 내에서 줄바꿈 등의 공백을 표현하려면 백슬래시로 시작하는 이스케이프 시퀀스를 사용해야 한다

cf.이스케이프 시퀀스란?
프로그래밍 언어 특성상 표현할 수 없는 기능, 문자를 표현해준다.
컴퓨터를 제어하는 목적으로 사용되는 특수한 문자이다.
제어 시퀀스(control sequence), 이스케이프 문자, 확장 비트열 이라고도 한다.
\와 ₩는 같은 의미이다.

이스케이프 시퀀스

\0 null
\b 백스페이스
\a 경고(alert)
\n 줄바꿈(new line)
\t 수평 탭(horizontal tab)
\v 수직 탭(vertical tab)
\b 백스페이스(backspace)
\f 폼 피드(form feed)
\r 캐리지 리턴(carriage return): 커서를 처음으로 이동
\ 백슬래시( \, backslash)
\’ 작음따옴표( ‘, single quotes)
\” 큰따옴표( “, double quotes)
\ooo 8진수 숫자를 사용하여 ASCII 코드의 문자 표현
\xhh 16진수 숫자를 사용하여 ASCII 코드의 문자 표현
\uXXXX 유니코드 (ex. '\u0041' ('A'), '\uD55C'('한'))

cf. 라인 피드와 캐리지 리턴

  • 개행 문자 : 텍스트의 한 줄이 끝남을 표시하는 문자 또는 문자열
    과거 타자기에서 커서를 제어하는 방식에서 비롯된 두가지 방식
    1) 라인 피드 : 커서를 정지한 상태에서 종이를 한줄 올리는 것
    2) 캐리지 리턴 : 종이를 움직이지 않고 커서를 맨 앞줄로 이동하는 것
    -> 일반적으로 캐리지 리턴보다는 라인 피드를 사용해 개행한다
var template = `<ul>\n\t<li><a href="#">Home</a></li></ul>`
console.log(template)

<ul> 
	<li><a href="#">Home</a></li>
</ul>

표현식 삽입

문자열은 문자열 연산자 +를 사용해 연결할 수 있다. + 연산자는 피연산자 중 하나 이상이 문자열인 경우 문자열 연결 연산자로 동작한다. 그 외의 경우는 덧셈 연산자로 동작한다.

템플릿 리터럴 내에서는 표현식 삽입을 통해 간단히 문자열을 삽입할 수 있다.
표현식을 삽입하려면 ${}으로 표현식을 감싼다.
이때 표현식의 평가 결과가 문자열이 아니더라도 문자열로 타입이 강제로 변환되어 삽입된다.
템플릿 리터널 내에서만 사용해야 한다!

-> 문자열 연산자보다 1)가독성 좋고 2)간편하게 문자열을 조합할 수 있다

var first = 'Ung-mo'; 
var last = 'Lee'; 
console.log('My name is ' + first + ' ' + last + '.'); 

console.log(`My name is ${first} ${last}.`);

4. 불리언 타입

  • 불리언 타입의 값은 논리적 참, 거짓을 나타내는 true와 false뿐이다
  • 참과 거짓으로 구분되는 조건에 의해 프로그램의 흐름을 제어하는 조건문에서 자주 사용한다

5. undefined 타입

  • undefined 타입의 값은 undefined가 유일하다
  • var 키워드로 선언한 변수를 암묵적으로 undefined로 초기화된다
    : 변수 선언에 의해 확보된 메모리 공간을 처음 할당이 이뤄질 때까지 빈 상태X(대부분 비어 있지 않고 쓰레기 값이 들어 있다), 자바스크립트 엔진이 undefined로 초기화한다
    : 변수를 선언한 이후 값을 할당하지 않은 변수를 참조하면 undefined가 반환된다
var foo; 
console.log(foo); //undefined

이처럼 undefined는 개발자가 의도적으로 할당하기 위한 값이 아니라 자바스크립트 엔진이 변수를 초기화할 때 사용하는 값

변수를 참조했을 때 undefined가 반환된다면 참조한 변수가 선언 이후 값이 할당된 적이 없는, 즉 초기화되지 않은 변수라는 것을 간파할 수 있다

그러므로 직접 할당하는 것은 권장하지 않는다
변수에 값이 없다는 것을 명시하고 싶을 때는 null을 할당한다

cf. 선언과 정의

  • undefined : 정의되지 않은
  • 정의 : 어떤 대상을 명확하게 규정하는 것을 의미한다
    -> 자바스크립트의 undefined에서 말하는 정의란 변수의 실체를 명확히 하는 것을 말한다

선언과 정의 엄격 구분
C에서 선언과 정의 : 실제로 메모리 주소를 할당하는가의 구분

  • 컴파일러에게 식별자의 존재만 알리는 것은 선언 (런타임 전에 선언을 통해 식별자를 알린다) ex. let name;
  • 실제로 컴파일러가 변수를 생성해서 식별자와 메모리 주소가 연결되면 정의
    ex. name과 메모리 주소와 연결

자바스크립트는 변수를 선언하면 암묵적으로 정의가 이뤄지기 때문에 (var은 undefined라는 값으로 메모리 공간에 초기화된다) 선언과 정의의 구분이 모호하다. ECMAScript 사양에서 변수는 '선언한다'라고 표현한다, 함수는 '정의한다'라고 표현한다

6. null 타입

null 타입의 값은 null이 유일하다

  • 대소문자 구분 : Null, NULL, null 모두 다르다

1. 변수에 값이 없다는 것을 의도적으로 명시할 때 사용

  • 변수에 null을 할당하는 것은 변수가 이전에 참조하던 값을 더 이상 참조하지 않겠다는 의미
  • 이는 이전에 할당되어 있던 값에 대한 참조를 명시적으로 제거하는 것
  • 자바스크립트 엔진은 누구도 참조하지 않는 메모리 공간에 대해 가비지 콜렉션을 수행한다
var foo = 'Lee'; 
//이전 참조를 제거. foo변수는 더 이상 'Lee'를 참조하지 않는다 

foo = null; 
  1. 함수가 유효한 값을 반환할 수 없는 경우에 명시적으로 null을 반환하기도 한다
    ex. html 요소를 검색해 반환하는 document.querySelector 메서드는 조겁에 부합하는 html 요소를 검색할 수 없는 경우 : 에러 대신 null을 반환한다

7. 심벌 타입

ES6에서 추가된 7번째 타입
변경 불가능한 원시 타입의 값 (다른 값과 중복되지 않는 유일무이한 값)
-> 그러므로 주로 이름이 충돌할 위험이 없는 객체의 유일한 프로퍼티 키를 만들기 위해 사용한다

심벌 이외의 원시 값은 리터럴을 통해 생성하지만 심벌은 Symbol 함수를 호출해 생성한다

  • 이때 생성된 심벌 값은 외부에 노출되지 않는다
  • 다른 값과 중복되지 않는 유일무이한 값

8. 객체 타입

자바스크립트의 데이터 타입

  • 원시 타입
  • 객체 타입

자바스크립트를 이루고 있는 거의 모든 것이 객체다
자바스크립트는 객체 기반의 언어

9. 데이터 타입의 필요성

1. 데이터 타입에 의한 메모리 공간의 확보와 참조

  • 값은 메모리에 저장하고 참조할 수 있어야 한다
  • 메모리에 값을 저장하려면 먼저 확보해야 할 메모리 공간의 크기를 결정해야 한다
    (낭비와 손실 없이 값을 저장하기 위해 )
var score = 100; 
  • 값의 종류에 따라 정해진 크기의 메모리 공간을 확보한다
  • 변수에 할당되는값의 데이터 타입에 따라 확보해야 할 메모리 공간의 크기가 결정된다
    ex.리터럴 100을 숫자 타입의 값으로 해석하고 숫자 타입의 값 100을 저장하기 위해 8바이트의 메모리 공간을 확보한다

cf. 데이터 타입에 따라 확보되는 메모리 공간의 크리
ECMAScript 사양은 문자열과 숫자 타입 외의 데이터 타입의 크기를 명시적으로 규정하고 있지는 않다. 따라서 문자열과숫자 타입을 제외하고 데이터 타입에 따라 메모리 공간의 크기는 제조사에 따라 다를 수 있다.

값을 참조하는 경우
score을 통해 숫자 타입의 값 100이 저장되어 있는 메모리 공간의 주소를 찾아갈 수 있다
정확히 말하면 숫자 값 100이 저장되어 있는 메모리 공간의 선두 메모리 셀의 주소를 찾아갈 수 있다

이때 값을 참조하려면 한 번에 읽어 들여야 할 메모리 공간의 크기, 즉 메모리 셀의 개수(바이트 수)를 알아야 한다. score 변수의 경우, 저장되어 있는 값이 숫자 타입이므로 8바이트 단위로 읽어들이지 않으면 값 훼손된다. 이걸 데이터 타입을 통해서 미리 알 수 있다

=> 심벌 테이블이라는 자료 구조를 통해 컴파일러 또는 인터프리터가 식별자와 바인딩된 값의 메모리 주소, 데이터 타입, 스코프 등을 관리할 수 있다

2. 데이터 타입에 의한 값의 해석

메모리에서 읽어 들인 2진수는 비트의 나열로 저장되어 있다 .
이를 데이터 타입에 따라 다르게 해석할 수 있다.

정리

  • 값을 저장할 때 확보해야 하는 메모리 공간의 크기를 결정하기 위해
  • 값을 참조할 때 한 번에 읽어 들여야 할 메모리 공간의 크기를 결정하기 위해
  • 메모리에서 읽어 들인 2진수를 어떻게 해석할지 결정하기 위해

10. 동적 타이핑

정적 타입 언어

  • ex. C, 자바
  • 변수를 선언할 때 변수에 할당할 수 있는 값의 종류, 즉 데이터 타입을 사전에 선언해야 한다 [명시적 타입 선언]
  • 변수의 타입 변경 X
  • 변수에 선언한 타입에 맞는 값만 할당 가능
  • 컴파일 시점에 타입체크를 수행 : 통과 못하면 에러 발생, 프로그램 실행 X
    => 안정성 보장

cf. 타입체크 : 선언한 데이터 타입에 맞는 값을 할당했는지 검사하는 처리

동적 타입 언어 [동적 타이핑]

ex. 자바스크립트,파이썬, php, 루비 등

  • 변수 선언할 때 타입을 선언하지 않는다
  • 어떤 데이터 타입의 값이라도 자유롭게 할당 가능
  • 선언이 아닌 값을 할당하는 시점에 변수의 타입이 동적으로 결정된다 [타입 추론]
  • 언제든 변경 가능하다
  • 변수는 기본적으로 타입을 갖지 않고 값이 타입을 갖는다
    => 변수에 할당되어 있는 값에 의해 변수의 타입이 동적으로 결정된다

단점 :

  • 변화하는 변수 값을 추적하기 어렵다,
  • 값을 확인하기 전에 타입을 확신할 수 없다,
  • 엔진에 의해 암묵적으로 타입이 자동으로 변환되기도 한다.
    => 유연성은 높지만 신뢰성이 떨어진다
profile
노션 : https://garrulous-gander-3f2.notion.site/c488d337791c4c4cb6d93cb9fcc26f17

0개의 댓글