웹 서버는 HTTP 요청을 처리하고 응답을 제공한다.
웹 서버는 HTTP 및 그와 관련된 TCP 처리를 구현한 것이다.
웹 서버는 여러 가지 형태가 가능하다. 이러한 구현들을 각각 살펴보자.
몇몇 웹 서버는 IETF ident 프로토콜을 지원한다. 이것은 서버에게 어떤 사용자 이름이 HTTP 커넥션을 초기화했는지 알 수 있게 해준다.
하지만 ident는 조직 내부가 아닌 공공 인터넷에서는 속도, 보안을 이유로 잘 쓰이지 않는다.
몇몇 웹서버는 요청 메시지를 쉽게 다룰 수 있도록 내부의 자료 구조에 저장한다.
고성능 웹 서버는 수천 개의 커넥션을 동시에 열 수 있도록 지원한다. 웹 서버 아키텍처 차이에 따라 요청하는 처리 방식도 달라진다. 아키텍처 차이에 따른 웹 서버의 종류는 다음과 같다.
웹 서버가 요청을 받으면, 서버는 요청으로부터 메서드, 리소스, 헤더, 본문(없는 경우도 있음)을 얻어내어 처리한다.
웹 서버는 HTML 페이지나 JPED 이미지 같은 미리 만들어진 콘텐츠를 제공하며, 마찬가지로 동적 콘텐츠도 제공한다. 웹 서버가 알맞은 콘텐츠를 전달하려면, 요청 메시지 URI에 대응하는 리소스를 웹 서버에서 찾아내 식별해야 한다.
웹 서버는 다음과 같이 여러 종류의 리소스 매핑을 지원한다.
리소스 매핑의 가장 단순한 형태로 요청 URI를 웹 서버의 파일 시스템 안에 있는 파일 이름으로 사용하는 것이다. 일반적으로 웹 서버 파일 시스템의 특별한 폴더를 웹 콘텐츠를 위해 예약 해둔다.
아파치 웹 서버의 경우 http.conf 설정 파일에 DocumentRoot 줄을 추가하여 웹서버의 Docroot를 설정할 수 있다.
웹 서버는 경로가 파일이 아닌 디렉터리를 가리키는, 디렉터리 URI에 대한 요청을 받을 수 있다.
대부분의 웹 서버는 요청한 URI에서 대응되는 디렉터리 안에서 index.html 혹은 index.html으로 이름이 붙은 파일을 찾는다.
웹 서버들 중에서 애플리케이션 서버라고 불리는 것들은 웹 서버를 복잡한 백엔드 애플리케이션과 연결 하는 일을 한다.
만약 어떤 리소스가 서버사이드 인클루드를 포함하고 있는 것으로 설정되어 있다면, 서버는 그 리소스의 콘텐츠를 클라이언트에게 보내기 전에 처리한다.
접근 제어 되는 리소스에 대한 요청이 도착했을 때, 웹 서버는 클라이언트의 IP 주소에 근거하여 접근을 제어하거나 비밀번호를 물어볼 수도 있다.
서버가 리소스를 식별하면 서버는 요청 메서드로 서술되는 동작을 수행한 뒤 응답 메시지를 반환한다.
만약 트랜잭션이 응답 본문을 생성한다면, 그 내용을 응답 메시지와 함께 돌려보낸다.
본문이 있다면, Content-Type 헤더, Content-Length 헤더, 실제 응답 본문의 내용을 주로 포함하여 돌려보낸다.
MIME 타입과 리소스를 연결하는 여러 가지 방법
웹 서버는 종종 성공 메시지 대신 브라우저가 다른 곳으로 가도록 리다이렉션 응답을 반환한다.
리다이렉트는 주로 다음의 경우에 유용하다.
서버는 커넥션 너머로 데이터를 보낼 때 계속해서 커넥션 상태를 추적해야 한다.
트랜잭션이 완료되었을 때, 웹 서버는 트랜잭션이 어떻게 수행되었는지에 대한 로그를 로그 파일에 기록한다.
📌 데이빗 고울리, 브라이언 토티, 마조리 세이어, 세일루 레디, 안슈 아가왈 공저 이응준, 정상일 공역, 『HTTP 완벽 가이드: 웹은 어떻게 동작하는가』, 인사이트(2014)