브라우저의 렌더링 과정 - 38

늘보·2021년 8월 24일
1

Web

목록 보기
2/6
post-custom-banner

이 내용은 '모던 Javascript Deep Dive'(이웅모 님) 책의 내용을 제 생각과 함께 정리한 글입니다.
틀린 내용 혹은 수정이 필요한 내용이 있다면 말씀해주시면 감사하겠습니다.


이전에 원티드 프리온보딩 코스에서 과제로 진행되었던 '브라우저의 렌더링 과정'을 보다 상세하게 이어서 정리하는 글이다.

HTTP 1.1과 HTTP 2.0

  • HTTP는 웹에서 브라우저와 서버가 통신하기 위한 프로토콜(규약)이다.

  • HTTP 1.1은 기본적으로 커넥션당 하나의 요청과 응답만 처리한다. 즉, 여러 개의 요청을 한 번에 전송할 수 없고 응답 또한 마찬가지다. 따라서 리소스의 개수에 비례하여 응답 시간도 증가하는 단점이 있다.

  • 이와 달리, HTTP/2는 커넥션당 여러 개의 요청과 응답, 즉 다충 요청/응답이 가능하다. 따라서 HTTP/2.0은 리소스의 동시 전송 덕분에 페이지 로드 속도가 약 50% 정도 더 빠르다고 알려져 있다.


HTML 파싱과 DOM 생성

  • 브라우저의 요청에 의해 서버가 응답한 HTML 문서는 문자열로 이루어진 순수한 텍스트다. 순수한 텍스트인 HTML 문서를 브라우저에 시각적인 픽셀로 렌더링하려면 HTML 문서를 브라우저가 이해할 수 있는 자료구조(객체)로 변환하여 메모리에 저장해야 한다.

  • 예를 들어, 다음과 같은 index.html이 서버로부터 응답되었다고 가정해보자.

<!DOCTYPE html>
<html>
  <head>
    <meta charset="UTF-8">
    <link rel="stylesheet" href="style.css">
  </head>
  <body>
    <ul>
      <li id="apple">Apple</li>
      <li id="banana">Banana</li>
      <li id="orange">Orange</li>
    </ul>
    <script src="app.js"></script>
  </body>
</html>
  • 브라우저의 렌더링 엔진은 다음 그림과 같은 과정을 통해 응답받은 HTML 문서를 파싱하여 브라우저가 이해할 수 있는 자료구조인 DOM(Document Object Model)을 생성한다.
  1. 서버에 존재하던 HTML 파일이 브라우저의 요청에 의해 응답된다. 이 때 서버는 브라우저가 요청한 HTML 파일을 읽어 들여 메모리에 저장한 다음 메모리에 저장된 바이트(2진수)를 인터넷을 경유하여 응답한다.

  2. 브라우저는 서버가 응답한 HTML 문서를 바이트(2진수) 형태로 응답받는다. 그리고 응답된 바이트 형태의 HTML 문서는 meta 태그의 charset 어트리뷰트에 의해 지정된 인코딩 방식(ex: UTF-8)을 기준으로 문자열로 변환된다. 참고로 meta 태그의 charset 어트리뷰트에 선언된 인코딩 방식은 content-type: text/html; charset=utf-8과 같이 응답 헤더(response header)에 담겨 응답된다. 브라우저는 이를 확인하고 문자열로 반환한다.

  3. 문자열로 변환된 HTML 문서를 읽어 들여 문법적 의미를 가지는 코드의 최소 단위인 토큰(token)들로 분해한다.

  4. 각 토큰들을 객체로 변환하여 노드(node)들을 생성한다. 토큰의 내용에 따라 문서 노드, 요소 노드, 어트리뷰트 노드, 텍스트 노드가 생성된다. 노드는 이후 DOM을 구성하는 기본 요소가 된다.

  5. HTML 문서는 HTML 요소들의 집합으로 이루어지며 HTML 요소는 중첩 관계를 가진다. 즉, HTML 요소의 콘텐츠 영역(시작 태그와 종료 태그 사이)에는 텍스트 뿐 아니라 다른 HTML 요소도 포함될 수 있다. 이 때, HTML 요소 간에는 중첩 관계에 의해 부자 관계가 형성된다. 이러한 HTML 요소 간의 부자 관계를 반영하여 모든 노드들을 트리 자료구조로 구성한다. 이 노드들로 구성된 트리 자료구조를 DOM(Document Object Model) 부른다.

  • 즉, DOM은 HTML 문서를 파싱한 결과물이다. DOM에 대해서는 39장에서 더 자세히 보도록 하자.

CSS 파싱과 CSSOM 생성

  • 렌더링 엔진은 HTML을 처음부터 한 줄씩 순차적으로 파싱하여 DOM을 생성해 나간다. 이처럼 렌더링 엔진은 DOM을 생성해 나가다가 CSS를 로드하는 link 태그나 style 태그를 만나면 DOM 생성을 일시 중단한다.

  • 이후 link 태그의 href 어트리뷰트에 지정된 CSS 파일을 서버에 요청하여 로드한 CSS 파일이나 style 태그 내의 CSS를 HTML과 동일한 파싱 과정(바이트 - 문자 - 토큰 - 노드 - CSSOM)을 거치며 해석하여 CSSOM(CSS Object Model)을 생성한다. 이후 CSS 파싱이 완료되면 HTML 파싱을 다시 시작하며 DOM 생성을 재개한다.

  • 앞에서 본 index.html을 다시 보자. 여기에는 CSS 파일을 로드하는 link 태그가 있다.

<!DOCTYPE html>
<html>
  <head>
    <meta charset="UTF-8">
    <link rel="stylesheet" href="style.css">
...
  • 렌더링 엔진은 meta 태그까지 HTML을 순차적으로 해석한 다음, link 태그를 만나면 DOM 생성을 일시 중단하고 link 태그의 href 어트리뷰트에 지정된 CSS 파일을 서버에 요청한다.

  • 예를 들어, 다음과 같은 style.css 파일이 서버로부터 응답되었다고 가정해보자.

body {
  font-size: 18px;
}

ul {
  list-style-type: none;
}
  • 서버로부터 CSS 파일이 응답되면 렌더링 엔진은 HTML과 동일한 해석 과정(바이트 - 문자 - 토큰 - 노드 - CSSOM)을 거쳐 CSS를 파싱하여 CSSOM을 생성한다.

  • CSSOM은 CSS의 상속을 반영하여 생성된다. 위 예제에서 body 요소에 적용한 font-size 프로퍼티와 ul 요소에 적용한 list-style-type 프로퍼티는 모든 li 요소에 상속된다. 이러한 상속 관계가 반영되어 다음과 같은 CSSOM이 생성된다. (p.668 그림 참조)


렌더 트리 생성

  • 렌더링 엔진은 서버로부터 응답된 HTML과 CSS를 파싱하여 각각 DOM과 CSSOM를 생성한다. 그리고 이 둘은 렌더링을 위해 렌더 트리(Render Tree)로 결합된다.

  • 렌더 트리는 렌더링을 위한 트리 구조의 자료구조다. 따라서 브라우저 화면에 렌더링되지 않는 노드(ex: meta 태그, script 태그)와 CSS에 의해 비표시(ex: display: none;)되는 노드들은 포함하지 않는다.

다시 말해, 렌더 트리는 브라우저 화면에 렌더링 되는 노드만으로 구성된다.

  • 이후 완성된 렌더 트리는 각 HTML 요소의 레이아웃(위치와 크기)을 계산하는 데 사용되며 브라우저 화면에 픽셀을 렌더링하는 페인팅(painting) 처리에 입력된다.

  • 이 부분은 p.669의 그림을 참조하면 이해가 더 빠르게 된다.

  • 지금까지 살펴본 브라우저의 렌더링 과정은 반복해서 실행될 수 있다. 다음과 같은 경우 반복해서 레이아웃 계산과 페인팅이 재차 실행된다.

렌더링 과정을 반복시키는 요인들

  1. JS에 의한 노드 추가 또는 삭제

  2. 브라우저 창의 리사이징에 의한 뷰포트(viewport) 크기 변경

  3. HTML 요소의 레이아웃(위치, 크기)에 변경을 발생시키는 width/height, margin, padding, border, display, position, top/right/bottom/left의 스타일 변경

  • 레이아웃 계산과 페인팅을 다시 실행하는 리렌더링은 비용이 많이 드는, 즉 성능에 악영향을 주는 작업이다. 따라서 가급적 리렌더링이 빈번하게 발생하지 않도록 주의할 필요가 있다.

JS의 파싱과 실행

  • DOM은 HTML 문서의 구조와 정보뿐만 아니라 HTML 요소와 스타일 등을 변경할 수 있는 프로그래밍 인터페이스로서 DOM API를 제공한다. 즉, JS 코드에서 DOM API를 사용하면 이미 생성된 DOM을 동적으로 조작할 수 있다.

  • CSS 때와 마찬가지로 렌더링 엔진은 DOM을 생성해 나가다 script 태그를 만나면 DOM 생성을 일시 중단하고 JS 코드의 파싱을 위해 JS 엔진에 제어권을 넘긴다. 이후 JS의 파싱과 실행이 종료되면 렌더링 엔진으로 다시 제어권을 넘겨 HTML 파싱이 중단된 지점부터 다시 HTML 파싱을 시작하여 DOM 생성을 재개한다.

  • JS 엔진은 JS 코드를 파싱하여 CPU가 이해할 수 있는 저수준 언어로 변환하고 실행하는 역할을 한다. JS 엔진은 구글 크롬과 Node.js V8, 파이어폭스의 SpiderMonkey, 사파리의 JavascriptCore 등 다양한 종류가 있으며, 모든 JS 엔진은 ECMAScript 사양을 준수한다.

  • JS 엔진은 JS 코드 파싱을 시작하고, JS를 해석하여 AST(Abstract Syntax Tree - 추상적 구문 트리)를 생성한다. 그리고 AST를 기반으로 인터프리터가 실행할 수 있는 중간 코드(intermediate code)인 바이트코드를 생성하여 실행한다.

토크나이징(tokenizing)

  • 단순한 문자열은 JS 소스코드를 어휘 분석(lexical analysis)하여 문법적 의미를 가지는 코드의 최소 단위인 토큰(token)들로 분해한다.

파싱(parsing)

  • 토큰들의 집합을 구문 분석(syntactic analysis)하여 AST를 생성한다. AST는 토큰에 문법적 의미와 구조를 반영한 트리 구조의 자료구조다. AST는 인터프리터나 컴파일러만이 사용하는 것이 아니다. AST를 사용하면 Typescript, Babel, Prettier 같은 트랜스파일러(transpiler)를 구현할 수도 있다.

바이트코드 생성과 실행

  • 파싱의 결과물로서 생성된 AST는 인터프리터가 실행할 수 있는 중간 코드인 바이트코드로 변환되고 인터프리터에 의해 실행된다.

리플로우와 리페인트

  • 만약 JS 코드에 DOM이나 CSSOM을 변경하는 DOM API가 사용된 경우 DOM이나 CSSOM이 변경된다. 이 때 변경된 DOM과 CSSOM은 다시 렌더 트리로 결합되고 변경된 렌더 트리를 기반으로 레이아웃과 페인트 과정을 거쳐 브라우저의 화면에 다시 렌더링 한다. 이를 리플로우(reflow), 리페인트(repaint)라 한다.

  • 리플로우는 레이아웃 계산을 다시 하는 것을 말하며, 노드 추가/삭제, 요소의 크기/위치 변경, 위도우 리사이징 등 레이아웃에 영향을 주는 변경이 발생한 경우에 한하여 실행된다. 리페인트는 재결합된 렌더 트리를 기반으로 다시 페인트를 하는 것을 말한다.

  • 따라서 리플로우와 리페인트가 반드시 동시에 실행되는 것은 아니다. 레이아웃에 영향이 없는 변경은 리플로우 없이 리페인트만 실행된다.


JS 파싱에 의한 HTML 파싱 중단

지금까지 살펴본 바와 같이 렌더링 엔진과 JS 엔진은 병렬적으로 파싱을 실행하지 않고 직렬적으로 파싱을 수행한다.

  • 이처럼 브라우저는 동기적(synchronous)으로, 즉 위에서 아래 방향으로 순차적으로 HTML, CSS, JS를 파싱하고 실행한다. 이것은 script 태그의 위치에 따라 HTML 파싱이 블로킹되어 DOM 생성이 지연될 수 있다는 것을 의미한다. 따라서 script 태그의 위치는 중요한 의미를 가진다.

  • 다음 예제를 보자.

<!DOCTYPE html>
<html>
  <head>
    <meta charset="UTF-8">
    <link rel="stylesheet" href="style.css">
    <script>
      /*
      DOM API인 document.getElementById는 DOM에서 id가 'apple'인 HTML 요소를
      취득한다. 아래 DOM API가 실행되는 시점에는 아직 id가 'apple'인 HTML 요소를 파싱하지
      않았기 때문에 DOM에는 id가 'apple'인 HTML 요소가 포함되어 있지 않다.
      따라서 아래 코드는 정상적으로 id가 'apple'인 HTML 요소를 취득하지 못한다. << 중요 부분!
      */
      const $apple = document.getElementById('apple');

      // id가 'apple'인 HTML 요소의 css color 프로퍼티 값을 변경한다.
      // 이때 DOM에는 id가 'apple'인 HTML 요소가 포함되어 있지 않기 때문에 에러가 발생한다.
      $apple.style.color = 'red'; // TypeError: Cannot read property 'style' of null
    </script>
  </head>
  <body>
    <ul>
      <li id="apple">Apple</li>
      <li id="banana">Banana</li>
      <li id="orange">Orange</li>
    </ul>
  </body>
</html>
  • DOM API인 document.getElementById('apple')은 DOM에서 id'apple'인 HTML 요소를 취득한다. 하지만 document.getElementById('apple')을 실행하는 시점에는 아직 id'apple'인 HTML 요소를 파싱하지 않았기 때문에 DOM에는 id'apple'인 요소가 포함되어 있지 않은 상태다. 따라서 위 예제는 정상적으로 동작하지 않는다.

  • 이러한 문제를 회피하기 위해 body 요소의 가장 아래에 JS를 위치시키는 것은 좋은 아이디어다. 그 이유는 다음과 같다.

  1. DOM이 완성되지 않는 상태에서 JS가 DOM을 조작하면 에러가 발생할 수 있다. (위와 같이)

  2. JS 로딩/파싱/실행으로 인해 HTML 요소들의 렌더링에 지장받는 일이 발생하지 않아 페이지 로딩 시간이 단축된다.


script 태그의 async/defer 어트리뷰트

  • 앞에서 본 JS 파싱에 의한 DOM 생성이 중단(blocking)되는 문제를 근본적으로 해결하기 위해 HTML5부터 script 태그에 asyncdefer 어트리뷰트가 추가되었다.

  • asyncdefer 어트리뷰트는 다음과 같이 src 어트리뷰트를 통해 외부 JS 파일을 로드하는 경우에만 사용할 수 있다. 즉, src 어트리뷰트가 없는 인라인 JS에는 사용할 수 없다.

<script async src="extern.js"></script>
<script defer src="extern.js"></script>
  • asyncdefer 어트리뷰트를 사용하면 HTML 파싱과 외부 JS 파일의 로드가 비동기적(asynchronous)으로 동시에 진행된다. 하지만 JS의 둘은 실행 시점에 차이가 있다.

async 어트리뷰트

  • HTML 파싱과 외부 JS 파일의 로드가 비동기적으로 동시에 진행된다. 단, JS의 파싱과 실행은 JS 파일의 로드가 완료된 직후 진행되며, 이 때 HTML 파싱이 중단된다.

  • 여러 개의 script 태그에 async 어트리뷰트를 지정하면 script 태그의 순서와는 상관없이 로드가 완료된 JS부터 먼저 실행되므로 순서가 보장되지 않는다. 따라서 순서 보장이 필요한 script 태그에는 async 어트리뷰트를 지정하지 않아야 한다.

defer 어트리뷰트

  • async와 마찬가지로 비동기적으로 진행된다. 단, JS의 파싱과 실행은 HTML 파싱이 완료된 직후, 즉 DOM 생성이 완료된 직후(이 때 DOMContentLoaded 이벤트가 발생한다) 진행된다. 따라서 DOM 생성이 완료된 이후 실행되어야 할 JS에 유용하다.

  • 위의 두 어트리뷰트는 모두 IE10 이상에서 지원된다.

post-custom-banner

0개의 댓글