코드스테이츠-부트캠프 [Deploy]-AWS

김희목·2024년 4월 1일
0

코드스테이츠

목록 보기
56/56

아마존 웹 서비스(AWS)

아마존 웹 서비스(AWS)란 아마존이 자사의 노하우를 살려 제공하고 있는 ‘클라우드 컴퓨팅 서비스’를 의미합니다. AWS에는 컴퓨팅, 스토리지, 데이터베이스, 분석, 네트워킹, 모바일, 개발자 도구, 관리 도구, IoT, 보안, 엔터프라이즈 애플리케이션 등 다양한 서비스가 준비되어 있으며, AWS의 다양한 서비스를 조합하여 모든 애플리케이션과 인프라를 구축할 수 있기도 합니다. 일전에는 여러 사업자에게 각각 빌려야 했던 인프라를 일괄로 빌릴 수 있게 됐으며, 필요에 따라 운영체제(OS), 웹 서버, DB 서버 등 필요한 소프트웨어까지 통째로 사용할 수 있는 편리한 서비스이기도 합니다.


아마존 웹 서비스(AWS)의 특징

AWS의 특징으로는,

  • 서비스를 조합하기 쉽습니다. AWS에서만 제공하는 서비스로도 필요한 기능을 대부분 구축 가능하며, AWS와 AWS 외부 시스템을 조합하여 구축하기 쉽습니다.

  • 앞으로 사용할 양을 미리 생각하지 않고 현재 필요한 만큼만 사용하고 부족해지면 그때마다 추가할 수 있으며, 같은 양을 계속 빌려야 하는 정액제와 차별점이 있습니다.

  • 네트워크 및 서버가 매우 큰 규모가 아니라면 네트워크나 서버 전문가가 아니더라도 사용 가능합니다.

  • 현재를 기준으로 전 세계 31개의 지리적 리전 내에 99개의 가용 영역을 운영하고 있어, 글로벌로 확장 시 확장하고자 하는 지역과 지리적으로 가까운 리전에서 서비스 시작 가능합니다.

  • 한국어 지원 및 원화 결제 가능하며, 보안 관련하여 법령, 규정, 프라이버시 기준을 준수하고 있는 안전한 서비스입니다.

이런 AWS는 165개 이상의 서비스를 제공하고 있으며, 목적에 따라 다양한 서비스를 사용할 수 있습니다. 그중 유명한 서비스로는 EC2, S3, RDS 등이 있습니다. 해당 서비스들에 대하여 개념을 익혀두면 향후 프로젝트에서 여러분들이 만든 앱을 배포할 때 큰 어려움이 없을 것입니다.


Cloud Computing

클라우드의 등장

  • 서버의 자원과 공간, 및 네트워크 환경 제공
  • 필요할 때마다 컴퓨팅 능력을 유연하게 조절
  • 사용한 만큼의 요금만 지급
  • 다른 컴퓨터로 즉시 이주가능

클라우드의 단점

  • 클라우드 서비스 종속
  • 서비스에 영향을 미침

운영 환경 자체가 클라우드 제공자에게 종속되어 버리므로, 클라우드 서비스에 문제가 생기면 내가 배포하고 관리하는 환경에도 영향이 미칩니다.

운영환경이 특정 클라우드 사업자(vendor)에게 종속된다는 얘기는, 백엔드 구성 자체가 특정 회사의 기술로만 구성해야만 하는 경우가 발생할 수도 있다는 이야기입니다.

따라서 AWS와 같은 대표적인 클라우드 사업자가 제공하는 기술을 익히는 것도 중요하지만, 그만큼 이 인프라 자체에 대한 이해가 더욱 중요합니다.

대표적인 클라우드 서비스 형태

대표적인 클라우드 서비스의 형태는 SaaS, IaaS, PaaS 세 가지입니다.

SaaS는 Software as a Service의 약자입니다.

클라우드 제공자가 당장 사용 가능한 소프트웨어를 제공하는 경우 대부분 SaaS에 해당합니다.

PaaS는 Platform as a Service의 약자입니다.

클라우드 제공자가 데이터베이스, 개발 플랫폼까지 제공하는 경우 대부분 PaaS에 해당합니다.

IaaS는 Infrastructure as a Service의 약자입니다.

클라우드 제공자가 가상 컴퓨터까지 제공하는 경우 대부분 IaaS에 해당합니다.


EC2

EC2란 아마존 웹 서비스에서 제공하는 클라우드 컴퓨팅 서비스입니다.

클라우드 컴퓨팅은 인터넷(클라우드)을 통해 서버, 스토리지, 데이터베이스 등의 컴퓨팅 서비스를 제공하는 서비스입니다.

정리하면 아마존에서 가상의 컴퓨터를 한 대 빌리는 것과 같습니다.

AWS에서 제공하는 Elastic Compute Cloud 서비스 앞에 붙은 Elastic이라는 단어는 어떤 의미일까요?

해당 단어는 고사양 게임을 플레이하는 것에 비유하여 설명하면 이해하기 편합니다.

집에서 고사양 게임을 하기 위해서는 게임을 1시간을 하든지 10시간을 하든지 간에 기본적으로 지출해야 하는 돈이 있습니다.

그런데 후불제 PC방에 간다면 집에서 게임을 하기 위해서 기본적으로 지출해야 하는 비용 대신, PC방을 사용한 시간에 대해서만 비용을 지불하면 됩니다.

EC2 서비스도 이런 후불제 PC방과 같이 사용한 만큼비용을 지불하기 때문에 '탄력적인'이라는 의미의 Elastic이라는 단어가 붙어있습니다.
Elastic은 비용적인 부분뿐만이 아니라 필요에 따라 성능, 용량을 자유롭게 조절할 수 있다는 의미도 가지고 있습니다.

정리하자면 EC2 서비스는 AWS에서 비용, 성능, 용량 면에서 탄력적인 클라우드 컴퓨터를 제공하는 서비스라고 할 수 있습니다.


장점

1.구성하는 데 필요한 시간이 짧다는 것입니다.

  • 만약 PC를 구매한다면 구매해서 배송받기까지의 시간이 필요하지만 EC2 서비스는 몇 번의 클릭만으로 PC를 구성할 수 있습니다.

  • 또한, 이후에 설명할 AMI를 통해서 필요한 용도에 따라 다양한 운영체제에 대한 선택이 가능하다는 것입니다.

2.EC2에서는 AMI라는 다양한 템플릿을 제공하고 있어서 필요에 따라 손쉽게 운영체제를 선택하고 구성할 수 있습니다.

  • 운영체제뿐만이 아니라 CPU와 RAM, 용량까지도 손쉽게 구성할 수 있습니다.

3.EC2는 컴퓨터를 한 대 빌리는 것이므로 컴퓨터로 할 수 있는 모든 일을 할 수 있습니다.

  • 빌린 컴퓨터는 직접 사용하는 컴퓨터와 다르게 아마존이 전 세계에 만들어 놓은 데이터 센터(인프라)에 만들어져 있기 때문에 컴퓨터를 조작하기 위해 네트워크(인터넷)를 통해서 컴퓨터를 제어해야 한다는 차이점이 있을 뿐 일반적인 컴퓨터와 다른 점은 없습니다.

4.아마존 EC2를 통해서 할 수 있는 가장 기본적인 일은 웹서버를 설치하고 웹 서버를 통해서 사용자가 웹 브라우저를 통해 요청하는 서비스를 제공하는 것입니다.

  • 인스턴스는 1대의 컴퓨터를 의미하는 단위이고 AWS에서 컴퓨터를 빌리는 것을 인스턴스를 생성한다고 합니다.

AMI는 소프트웨어 구성이 기재된 템플릿입니다.

이미지 종류로는 단순히 운영체제(윈도우, 우분투 리눅스 등)만 깔려있는 템플릿을 선택할 수도 있고, 아예 특정 런타임이 설치되어 있는 템플릿이 제공되는 경우도 있습니다. (우분투 + node.js, 윈도우 + JVM 등)

AWS EC2 인스턴스를 생성한다는 것은 AMI를 토대로 운영체제, CPU, RAM 혹은 런타임 등이 구성된 컴퓨터를 빌리는 것입니다.


RDS

RDS는 Relational Database Service의 약자로 AWS에서 제공하는 관계형 데이터베이스 서비스입니다.

왜 RDS를 사용할까요?

우리는 이전 슬라이드에서 EC2가 가상의 컴퓨터를 임대하는 서비스라고 배웠습니다. EC2 인스턴스에 MySQL 같은 관계형 데이터베이스 엔진을 설치하면 굳이 RDS를 사용할 이유가 없지 않을까요? 데이터베이스만 따로 분리해서 서비스를 이용해야 할 이유가 있을까요?

EC2 인스턴스에 관계형 데이터베이스 엔진을 설치해서 데이터를 관리할 때와 RDS를 통해 데이터를 관리할 때의 차이는 개인 소유 차량과 렌터카 회사에서 대여한 차량으로 비유할 수 있습니다.

EC2 인스턴스에 데이터베이스를 설치하여 데이터를 관리하는 것은 개인 소유 차량을 이용하는 것과 비슷합니다. 개인 소유 차량을 이용하면 유지 보수, 보험처리 같은 일들을 온전히 운전자가 부담합니다. 차량 정비를 위해서 정비소에 주기적으로 방문해야 하고, 기타 차량과 관련된 다른 일이 생길 때 들여야 하는 시간과 수고가 큽니다.

EC2 인스턴스를 사용하면 데이터베이스와 관련해서 자동으로 관리를 담당하는 부분이 매우 적기 때문에, 사용자가 일일이 시간을 투자하여 데이터베이스 엔진의 설치와 버전 관리, 데이터 백업을 해야 합니다.

게다가 가용성과 내구성이 확보되지 않기 때문에 데이터베이스에 저장된 데이터가 유실되거나 정상적으로 사용하지 못할 확률이 커지며, 후에 필요에 따라 데이터베이스의 규모를 확장하기 어렵습니다.

그에 비해 RDS를 이용하는 것은 렌터카 회사에서 차량을 대여하는 것과 비슷합니다. 렌터카 회사에서 차량을 대여하면 대여 차량과 관련하여 시간이 들어가는 일들을 렌터카 회사에서 대신 처리합니다. 운전자는 차량을 관리하는 일에 대해서 시간을 따로 쏟을 필요 없이 운전만 하면 되기에 매우 편리합니다.

RDS를 이용하면 데이터베이스 유지 보수와 관련된 일들을 RDS에서 전적으로 자동 관리합니다. 사용자가 해야 할 일은 초기 설정을 제외하고 데이터베이스에 저장된 데이터를 관리하는 일 밖에 없기에 큰 편의성을 느낄 수 있습니다.


클라우드 스토리지

클라우드 스토리지란 쉽게 말해서 인터넷 공간에 데이터를 저장하는 저장소입니다. 컴퓨터 부품으로 비유하면 하드디스크의 역할을 하는 서비스입니다.

우리는 알게 모르게 클라우드 스토리지 서비스를 이용해왔습니다. 구글의 Google Drive, 네이버의 MYBOX, 마이크로소프트의 Onedrive와 같은 서비스가 좋은 예시입니다.


클라우드 스토리지 서비스의 장점

클라우드 스토리지 서비스는 뛰어난 접근성을 가지고 있습니다. 컴퓨터의 하드디스크에 저장된 파일에 접근하기 위해서는 해당 컴퓨터를 이용해야만 합니다. 그러나 클라우드 스토리지를 이용하면 웹 환경이라면 언제 어디서나 저장된 파일에 접근할 수 있습니다. 또한 컴퓨터뿐만 아니라 웹에 접속이 가능한 다른 전자기기를 활용하여 클라우드 스토리지에 저장된 데이터에 접속할 수 있습니다.


S3

S3는 Simple Storage Service의 약자로 AWS에서 제공하는 클라우드 스토리지 서비스입니다.

우리는 클라우드 스토리지 서비스가 뛰어난 접근성을 가지고 있다는 점을 배웠습니다. S3도 마찬가지로 뛰어난 접근성을 가지고 있습니다.


S3의 이점

1.높은 확장성

  • 높으면 많은 시간과 수고를 들이지 않고 스토리지 규모를 확장/축소할 수 있습니다.

  • S3에서는 스토리지의 용량을 무한히 확장할 수 있습니다. 그리고 사용한 만큼만 비용을 지불하면 되기 때문에 비용적인 측면에서 매우 효율적입니다.

2.강력한 내구성

  • 스토리지의 내구성이 높으면 저장된 파일을 유실할 가능성이 적어집니다. S3는 99.999999999%의 내구성을 보장합니다.

3.99.99%의 가용성

  • 성이 높으면 스토리지에 저장된 파일들을 정상적으로 사용할 수 있는 시간이 길어집니다. S3는 연간 99.99%의 스토리지 가용성을 보장하도록 설계가 되어 있습니다. 이는 다른 말로 1년 동안 S3에 파일을 저장했을 시, 8.76 시간 동안만 스토리지를 이용하는 데 있어서 장애가 발생한다는 뜻입니다.

4.다양한 스토리지 클래스를 제공

  • 저장소를 어떤 목적으로 활용할지에 따라 효율적으로 선택할 수 있는 스토리지 클래스가 달라집니다.

  • S3 사용자들이 대표적으로 많이 선택하는 스토리지 클래스는 두 가지가 있습니다. Standard 클래스와 Glacier 클래스입니다.

    • Standard 클래스 : 범용적인 목적으로 사용하기 좋습니다. 데이터에 빠른 속도로 접근할 수 있고, 데이터 액세스 요청에 대한 처리 속도가 빠릅니다. 대신 데이터를 오래 보관하는 목적으로는 효율적인 선택지가 아닙니다. 보관 비용이 높게 발생하기 때문입니다.
    • Glacier 클래스 : 장기적인 보관 목적으로 스토리지를 사용, 비록 저장된 데이터에 액세스하는 속도는 느리지만, 데이터를 보관하는 비용이 매우 저렴하다는 장점이 있습니다.

5.정적 웹사이트 호스팅이 가능

  • '정적' 파일에 대한 이해가 선행되어야 합니다. 정적 파일은 서버의 개입 없이 생성된 파일을 뜻합니다.

  • 반대로 클라이언트가 서버에 요청을 보내면, 서버가 요청에 맞추어 그 자리에서 생성한 파일을 '동적' 파일이라고 부릅니다.

웹 호스팅(Web Hosting)이란 뭘까요? 웹 호스팅이란 서버의 한 공간을 임대해 주는 서비스를 뜻합니다.

  • 버킷을 통해 정적 웹 사이트 호스팅이 가능

버킷이란 파일을 담는 바구니(최상위 티렉토리)라고 설명 가능하고, 무한히 많은 파일을 저장 가능, 버킷의 이름은 각 리전에서 고유해야하며, 정책을 생성하여 엑세스 권한을 부여할 수 있다.


리전

리전이란 AWS에서 클라우드 서비스를 제공하기 위해서 운영하는 물리적인 서버의 위치를 뜻합니다.

그리고 리전에는 가용 영역이 위치하고 있습니다. (서울은 현재 기준으로 4개의 가용 역역이 존재하고 있습니다.) 가용 영역(Availability Zone)이란 각 리전 안에 존재하는 데이터 센터(IDC)를 뜻합니다. 가용 영역은 각각 개별적인 위치에 떨어져서 존재합니다. 그래서 한 곳의 가용 영역이 재난이나 사고로 인해 가동이 불가능해지더라도 다른 가용 영역에 백업을 해놓은 데이터를 활용하여 문제없이 서버가 가동되게 합니다. 이런 가동 방식 덕분에 AWS에서 제공하는 서비스들은 높은 가용성과 내구성을 보장합니다.


정리

현재까지 EC2, RDS, S3의 개념을 학습하고 있는데, 해당 서비스들이 공통적으로 '높은 가용성'과 '높은 내구성'을 보장한다는 점을 배우셨을 겁니다. AWS는 어떤 원리로 해당 서비스들의 높은 가용성과 내구성을 보장할 수 있는 걸까요?


배포 전략

로컬 환경에서 작업한 코드의 결과물을 확인하기 위해서는 로컬 환경에서 클라이언트와 서버, 데이터베이스를 띄워서 작성한 코드를 구동하면 됩니다.

단, 이 방법으로는 로컬 환경에서만 확인이 가능했습니다.

개발한 서비스를 사용자가 이용할 수 있도록 하는 것을 배포라고 합니다.

그렇다면 사용자들에게 Client를 어떻게 제공할지
그리고 Client를 받은 사용자들이 서비스를 이용하기 위한 요청을 처리할 Server를 어떻게 제공할 것인지
Server의 데이터를 저장하고 제공할 Database는 어떻게 제공할 것인지 생각해 봐야 합니다.

AWS에서 제공하는 서비스인 S3라는 서비스를 통해 사용자들에게 Client를 제공할 수 있습니다.

로컬 환경에서는 자체 개발 서버 (예, create-react-app)를 이용해서 클라이언트 앱을 실행시키는 것이 보통입니다.
그럼, 클라이언트를 위해서 EC2 인스턴스를 사용해야 할까요?

그렇지 않습니다. 클라이언트 앱을 정적 파일로 빌드하여 제공합니다.

따라서 S3를 이용해서 클라이언트를 배포합니다.

이때 필요한 것이 빌드입니다.

빌드란 쉽게 말해서 불필요한 데이터를 없애고, 여러 갈래로 퍼져있는 데이터들을 통합/ 압축하여 배포하기에 최적화된 상태를 만드는 것입니다. 빌드 과정을 진행하기 전과 비교했을 때 데이터의 용량이 줄어들고, 웹 사이트의 로딩 속도가 빨라진다는 장점이 생깁니다.

하지만 일반적인 의미의 빌드는, 소스코드를 실행 가능한 번들로 변환하는 컴파일 과정을 의미합니다. 웹 앱에서와같이 HTML, CSS, JS의 형태로 배포하는 경우는 조금 다릅니다. 웹 앱은 배포 가능한 정적 파일(static files)의 형태로 만들어 줘야 합니다.

asset 자체가 정적인 경우, 있는 그대로 배포하면 됩니다. React의 경우 npm run build와 같은 명령을 사용해서, 정적 파일 형태의 결과물을 만들어 낸 후 배포하면 됩니다. 사용하고 있는 환경에 따라 빌드 과정은 다를 수 있습니다.

AWS에서 제공하는 CDN 서비스인 CloudFront를 통해서 각지의 데이터 센터에 데이터를 분산시켜서 저장해 뒀다가 가까운 지역에서 데이터를 주는 방식으로 사용자에게 더 빠르게 서비스를 제공할 수 있습니다.

사용자들이 제공받은 Client Application을 통해서 요청을 전달할 Server Application은 어떻게 배포해야 할까요?

AWS EC2 서비스를 통해 손쉽게 서버를 구성하고 서비스를 제공할 수 있습니다.

AWS에서는 Database 특화 서비스인 RDS 서비스를 제공하고 있습니다.

AWS가 유지 보수 작업을 담당하는 RDS를 이용하여 즉시 데이터베이스를 사용할 수 있습니다.

RDS 서비스를 이용하여 EC2를 통해 배포된 Server Application의 데이터를 저장, 제공하는 데이터베이스를 배포할 수 있습니다.


Deploy

배포란 여러분이 개발한 서비스를 사용자들이 이용 가능하게 하는 일련의 과정입니다.

회사마다 추가적인 과정이 있을 수 있지만, 기본적으로 4단계를 거쳐서 개발한 서비스를 배포하게 됩니다.


Development

각자의 컴퓨터에서 코드를 작성하고 테스트하는 과정입니다.

개발 단계이기 때문에 실제 데이터를 이용하지 않고 더미 데이터를 이용해서 테스트합니다.

Integration

각자의 컴퓨터에서 작성한 코드를 합치는 과정입니다.

내가 작성한 코드가 다른 코드를 침범해서 오류를 일으키지 않는지, 코드 간에 conflict가 있지는 않은지 확인하는 과정을 거칩니다.

Staging

실제 출시 단계인 Production 단계와 가장 유사한 환경에서 테스트를 진행합니다.

실제 데이터를 복사해서 문제가 있지 않은지 등 다양한 환경에서 테스트를 진행합니다.
또한 서비스와 관련된 부서 혹은 인원의 확인 과정을 거칩니다. 예를 들면 작성된 코드가 마케팅팀 혹은 디자인팀이 예상했던 결과인지 확인을 거치는 과정입니다.

Production

개발된 서비스를 출시하는 단계입니다.
사용자가 접속할 수 있는 Production 환경에서 코드를 구동하고 서비스를 제공합니다.
실제 데이터를 가지고 서비스가 운영되기 때문에 문제가 생기면 안 되는 단계입니다.


Development 환경과 Production 환경은 서로 다를 수가 있습니다.

여러분이 개발부터 배포까지 모든 것을 통제할 수 있는 상황이라면, 크게 걱정 없이 Production 환경을 구성할 수 있을 겁니다.

그러나, 여러 명이 함께 작업하는 프로젝트라면 어떨까요? node 버전도 제각각일 거고, 인증 정보나 데이터베이스 등에 접근하기 위해 사용하는 엔드포인트도 제각각일 겁니다.

예를 들어봅시다. 내 로컬에 설치된 데이터베이스 비밀번호는 rlazheld1234! 인 데, 클라우드에 설치된 데이터베이스 비밀번호는 supersecret! 일 수 있을 거예요.
이 모든 케이스를 코드 안에 담을 수 있을까요? 아니죠. 이처럼 Development 환경과 Production 환경은 서로 다를 수가 있습니다.

마치, 우리나라에서 잘 자라는 식물을 사막 한가운데에서 똑같은 방식으로 재배한다고 잘 자라지 않는 것과 비슷해요.

따라서 배포에서는, 환경의 차이를 이해하고 환경 설정을 코드와 분리하는 것이 중요합니다.


작성한 코드가 다른 환경에서 정상 작동할 수 있게 하려면

설정을 환경 변수(envvars나 env라고도 불림)에 저장해야 합니다. 환경 변수는 코드 변경 없이 배포 때마다 쉽게 변경할 수 있습니다.

설정 파일과 달리, 잘못해서 코드 저장소에 올라갈 가능성도 낮습니다.

애플리케이션의 모든 설정이 정상적으로 코드 바깥으로 분리되어 있는지 확인할 수 있는 간단한 방법은 어떠한 인증정보도 유출시키지 않고 코드가 지금 당장 오픈 소스가 될 수 있는지 확인하는 것입니다.

이러한 환경 설정을 코드로부터 분리하는 방법론을 이야기하고 있습니다.

코드 상의 모든 곳에 절대 경로가 아닌 상대 경로를 사용해야 하며, .env 등을 이용해 환경 변수를 설정하세요.

그 외에도 docker와 같은 가상화 도구는 환경 자체를 메타데이터로 담아서 아예 모든 개발 환경을 통일시킵니다.(Advanced) Docker와 같은 개발 환경 자체를 통일시키는 솔루션을 사용합니다.

0개의 댓글