[모던 JS Deep Dive] 38장 브라우저의 렌더링 과정

JiYeeeah·2024년 4월 5일

웹 애플리케이션의 클라이언트 사이드 자바스크립트는 브라우저에서 HTML, CSS와 함께 실행되기 때문에 브라우저 환경을 고려해야 더 효율적인 프로그래밍이 가능합니다. 이를 위해 브라우저가 HTML, CSS, 자바스크립트로 작성된 텍스트 문서를 어떻게 파싱하여 브라우저에 렌더링하는지 살펴보는 시간입니다.

파싱

텍스트 문서의 문자열을 토큰token으로 분해(어휘 분석 lexical analysis)하고, 토큰에 문법적 의미와 구조를 반영하여 트리 구조의 자료구조인 파스 트리를 생성하는 일련의 과정

렌더링

HTML, CSS, JS로 작성된 문서를 파싱하여 브라우저에 시각적으로 출력하는 것

브라우저 렌더링 과정

브라우저 렌더링 과정
  1. 브라우저는 HTML, CSS, 자바스크립트, 이미지, 폰트 파일 등 렌더링에 필요한 리소스를 요청하고 서버로부터 응답 받음
  2. 브라우저의 렌더링 엔진은 서버로부터 응답된 HTML과 CSS를 파싱DOM과 CSSOM을 생성 → 이들을 결합하여 렌더 트리 생성
  3. 브라우저의 자바스크립트 엔진은 서버로부터 응답된 자바스크립트를 파싱ASTAbstract Syntax Tree를 생성하고 바이트코드로 변환하여 실행 (이때 자바스크립트는 DOM API를 통해 DOM이나 CSSOM을 변경할 수 있음 → 변경된 DOM과 CSSOM은 다시 렌더 트리로 결합)
  4. 렌더 트리를 기반으로 HTML요소의 레이아웃(위치와 크기)을 계산하고 브라우저 화면에 HTML요소를 페인팅

38.1 요청과 응답

브라우저의 핵심 기능은 필요한 리소스(HTML, CSS, JS, 이미지, 폰트 등 정적 파일 또는 서버가 동적으로 생성한 데이터)를 서버에 요청request하고 서버로부터 응답response받아 브라우저에 시각적으로 렌더링하는 것이다.
서버에 요청을 전송하기 위해 브라우저는 주소창을 제공한다. 주소창에 URL을 입력하고 엔터키를 누르면 URL의 호스트 이름DNS Domain Name System를 통해 IP 주소로 변환되고 이 IP 주소를 갖는 서버에게 요청을 전송한다.
여기서 서버는 일반적으로 루트 요청에 대해 암묵적으로 index.html을 응답하도록 기본 설정되어 있다. 하지만 개발자 도구의 Network 패널을 확인해보면 index.html뿐 아니라 CSS, 자바스크립트, 이미지, 폰트 파일들도 응답되는 것을 확인할 수 있다. 이는 브라우저 렌더링 엔진이 HTML(index.html)을 파싱하는 도중에 외부 리소스를 로드하는 태그를 만나 HTML파싱을 일시 중단하고 해당 리소스 파일을 요청해 응답 받았기 때문이다.
그리고 반드시 주소창을 통해 서버에게 정적 파일만 요청할 수 있는 것은 아니다. 자바스크립트를 활용해 동적으로 서버에 정적/동적 데이터를 요청할 수 있다.

38.2 HTTP 1.1과 HTTP 2.0

HTTP HyperText Transfer Protocol : 웹에서 브라우저와 서버가 통신하기 위한 프로토콜(규약)
HTTP/1.1 : 커넥션당 하나의 요청과 응답만 처리 ⇒ 리소스의 동시 전송이 불가능한 구조 ⇒ 요청할 리소스의 개수에 비례하여 응답시간도 증가하는 단점
HTTP/2 : 커넥션당 여러 개의 요청과 응답, 즉 다중 요청/응답이 가능 ⇒ HTTP/1.1에 비해 페이지 로드 속도가 약 50% 빠르다고 알려져 있다

38.3 HTML 파싱과 DOM 생성

HTML 문저는 문자열로 이루어진 순수한 텍스트이다. 이걸 브라우저에 시각적인 픽셀로 렌더링 하려면 브라우저가 이해할 수 있는 자료구조(객체)로 변환하여 메모리에 저장해야한다. 브라우저의 렌더링 엔진은 다음 그림과 같은 과정을 통해 응답받은 HTML문서를 파싱하여 DOM Document Object Model을 생성한다.

[HTML 파싱과 DOM 생성]

바이트 → 문자 → 토큰 → 노드 → DOM

  1. 서버에 존재하던 HTML 파일이 브라우저의 요청에 의해 응답됨.
    이때 서버는 브라우저가 요청한 HTML 파일을 읽어 들여 메모리에 저장한 다음 메모리에 저장된 바이트(2진수)를 인터넷을 경유하여 응답.
  2. 브라우저는 서버가 응답한 HTML 문서를 바이트 형태로 응답받음.
    그리고 응답된 바이트 형태의 HTML 문서는 meta 태그의 charset 어트리뷰트에 의해 지정된 인코딩 방식(예: UTF-8)을 기준으로 문자열로 변환됨.
  3. 문자열로 변환된 HTML 문서를 읽어 들여 문법적 의미를 갖는 코드의 최소 단위인 토큰token들로 분해함.
  4. 각 토큰들을 객체로 변환하여 노드node들을 생성.
    토큰의 내용에 따라 문서 노드, 요소 노드, 어트리뷰트 노드, 텍스트 노드가 생성.
    노드는 이후 DOM을 구성하는 기본 요소가 됨.
  5. HTML 문서는 HTML 요소들의 집합으로 이루어지며 HTML 요소는 중첩 관계를 가짐. 즉, HTML 요소의 콘텐츠 영역(시작 태그와 종료 태그 사이)에는 텍스트뿐만 아니라 다른 HTML 요소도 포함될 수 있음.
    이때 HTML 요소 간에는 중첩 관계에 의해 부자 관계가 형성됨. 이러한 HTML 요소 간의 부자 관계를 반영하여 모든 노드들을 트리 자료구조로 구성.
    이 노드들로 구성된 트리 자료구조를 DOM(Document Object Model)이라고 부름

38.4 CSS 파싱과 CSSOM 생성

브라우저의 렌더링 엔진HTML을 처음부터 한 줄씩 순차적으로 파싱하여 DOM을 생성한다. 그러다가 CSS를 로드하는 link태그나 style태그를 만나면 DOM 생성을 일시 중단하고 link 태그의 href 어트리뷰트에 지정된 CSS 파일을 서버에 요청한다. CSS는 HTML과 동일한 파싱 과정 (바이트 → 문자 → 토큰 → 노드 → CSSOM)을 거치며 해석하여 CSSOM CSS Object Model을 생성한다. 이후 HTML 파싱이 중단된 지점부터 다시 DOM 생성을 재개한다.

38.5 렌더 트리 생성

브라우저의 렌더링 엔진은 HTML과 CSS를 각각 DOM과 CSSOM으로 파싱하여 생성한다. 그리고 이 DOM과 CSSOM은 렌더링을 위해 렌더 트리render tree로 결합된다.

렌더 트리

렌더링을 위한 트리 구조의 자료구조

  • 브라우저 화면에 렌더링되는 노드만으로 구성되어있다.
    브라우저 화면에 렌더링되지 않는 노드 (ex.meta 태그, script태그 등)와 CSS에 의해 비표시(ex. display: none)되는 노드들은 포함되지 않는다.

이후 완성된 렌더 트리는 각 HTML 요소의 레이아웃(위치와 크기)을 계산하는 데 사용되며 페인팅 처리에 입력된다.
지금까지의 브라우저 렌더링 과정은 반복해서 실행될 수 있다. 이를 리렌더링이라고 하는데 성능에 악영향을 주는 작업이므로 피해야 한다.

38.6 자바스크립트 파싱과 실행

자바스크립트 파싱과 실행은 브라우저의 렌더링 엔진이 아닌 자바스크립트 엔진이 처리한다.

CSS 파싱과 마찬가지로 script태그를 만나면 DOM 생성을 일시 중단하고 자바스크립트 파싱을 위해 자바스크립트 엔진에 제어권을 넘긴다. 파싱과 실행이 종료되면 렌더링 엔진으로 다시 제어권을 넘겨 HTML 파싱이 중단된 지점부터 DOM 생성을 재개한다.

자바스크립트 엔진

자바스크립트 코드를 파싱하여 CPU가 이해할 수 있는 저수준 low-level language으로 변환하고 실행한다.

  • 자바스크립트 엔진의 종류 : 구글 크롬, Node.js의 V8, 파이어폭스의 SpiderMonkey, 사파리의 JavaScriptCore 등, 모든 자바스크립트 엔진은 ECMAScript 사양을 준수

자바스크립트 엔진은 자바스크립트를 해석하여 AST Abstract Syntax Tree 추상적 구문 트리를 생성한다. 이 AST를 기반으로 인터프리터가 실행할 수 있는 중간 코드intermediate code바이트 코드를 생성하여 실행한다.

자바스크립트 파싱과 실행

  • 토크나이징 tokenizing
    어휘 분석 lexical analysis하여 문법적 의미를 갖는 코드의 최소 단위인 토큰token들로 분해

  • 파싱 parsing
    구문 분석 syntactic analysis하여 AST 생성

    • AST : 토큰에 문법적 의미와 구조를 반영한 트리 구조의 자료구조
  • 바이트코드 생성과 실행
    AST가 인터프리터가 실행할 수 있는 중간 코드인 바이트코드로 변환됨 → 인터프리터에 의해 실행

38.7 리플로우와 리페인트

DOM이나 CSSOM을 변경하는 DOM API가 사용된 경우, 변경된 DOM과 CSSOM은 렌더 트리로 결합되고 변경된 렌더트리를 기반으로 레이아웃과 페인트 과정을 거쳐 브라우저의 화면에 다시 렌더링 된다. 이를 리플로우, 리페인트라고 한다.

리플로우 reflow

  • 레이아웃 계산을 다시 하는 것
  • 레이아웃에 영향을 주는 변경(노드 추가/삭제, 요소의 크기/위치 변경, 윈도우 리사이징 등)이 발생한 경우에만 실행

리페인트 repaint

  • 재결합된 렌더 트리를 기반으로 다시 페인트를 하는 것

레이아웃에 영향이 없는 경우에는 리플로우 없이 리페인트만 실행되기도 한다.

38.8 자바스크립트 파싱에 의한 HTML 파싱 중단

렌더링 엔진과 자바스크립트 엔진은 직렬적으로 동기적으로 파싱을 수행한다. script 태그의 위치에 따라 HTML 파싱이 블로킹되어 DOM 생성이 지연될 수 있고, DOM이나 CSSOM 생성이 완료되지 않은 상태에서 자바스크립트 코드에 DOM API를 사용할 경우 문제가 발생할 수 있다. script 태그의 위치가 중요하기에 body 요소의 가장 아래에 자바스크립트를 위치시키는 것도 좋다.
자바스크립트가 실행될 시점에 이미 렌더링 엔진이 HTML 요소를 모두 파싱하여 DOM 생성을 완료한 이후라면 에러가 발생할 우려도 없고 자바스크립트 이전에 DOM 생성이 완료되어 렌더링되므로 페이지 로딩시간이 단축된다는 장점이 있다.

38.9 script태그의 async/defer 어트리뷰트

DOM 생성이 중단되는 문제를 근본적으로 해결하기 위해 HTML5부터 script태그에 async와 defer 어트리뷰트가 추가되었다. 이 들은 src 어트리뷰트를 통해 외부 자바스크립트 파일을 로드하는 경우에만 사용할 수 있다. (인라인 자바스크립트에서는 사용 불가)

<script async src="extern.js"></script>
<script defer src="extern.js"></script>

둘은 실행 시점에 차이가 있다.

async

  • 자바스크립트 파일의 로드가 완료된 직후 파싱과 실행이 진행된다. (이때 HTML 파싱이 중단된다.)
  • script 태그의 순서와 상관없이 로드가 완료된 자바스크립트부터 먼저 실행하여 순서가 보장되지 않는다.

defer

  • HTML 파싱이 완료된 직후 (DOM 생성이 완료된 직후) 파싱과 실행이 진행된다.

간단 정리

  1. 브라우저에서 렌더링에 필요한 리소스를 요청하고 응답받는다
  2. 응답받은 HTML과 CSS를 브라우저의 렌더링 엔진이 파싱하여 DOM과 CSSOM을 생성한다.
    이 둘은 결합하여 렌더 트리를 만든다.
  3. 자바스크립트는 자바스크립트 엔진이 파싱하여 AST Abstract Syntax Tree 추상 구문 트리를 생성하고 바이트코드로 변환해서 실행된다.
    이때 자바스크립트에서 DOM API를 가지고 DOM이나 CSSOM을 변경할 수 있다. → 변경되면 리플로우, 리페인팅
  4. 렌더 트리를 기반으로 HTML 요소의 레이아웃을 계산하고 브라우저 화면에 페인팅한다.

챕터 처음에 정리되어 있는 것이랑 거의 다르지 않다. 처음에 정리되어있는 것 부터 읽었을 때는 이해가 안됐는데 챕터를 끝까지 읽고 나니 정리되어 있는 것이 군더더기 없다..! 챕터가 끝나면 처음으로 돌아와서 정리된 것을 다시 읽어보는 것도 좋은 방법인 것 같다.

profile
Have Fun, Make Fun

0개의 댓글