
우리가 사용하였던 EBS라는 현재 사용하는 저장소와, 이제 DB를 따로 떼서 관리해줄 RDS에 대한 개념을 정리하고자 한다.
컴퓨터 본체를 보면, CPU와 램카드, 그래픽카드, SSD, HDD가 다같이 장착되어 컴퓨터가 돌아가게 된다.
EC2 인스턴스가 연산에 관한 (CPU, 메모리 등) 처리를 한다고 하면, 데이터를 저장하는 역할(SSD, HDD)은 바로 EBS가 한다고 보면 된다.
즉, EBS는 클라우드에서 사용하는 가상 하드디스크(HDD)라고 말할 수 있다.
EBS는 AWS 클라우드의 Amazon EC2 인스턴스에 사용할 영구 블록 스토리지 볼륨을 제공한다.
그리고 단 몇분 내에 사용량을 많게 또는 적게 확장할 수 있으며, 프로비저닝(빌리는 행위)한 부분에 대해서만 저렴한 비용을 지불 할 수 있다.
EBS의 가장 큰 특징은 EC2 인스턴스가 종료되어도 별개로 작동하여 유지가 가능하다는 점이다.
보통 컴퓨터 본체가 꺼지면 하드도 꺼져 당연히 이용을 못하겠지만, EBS는 네트워크로 별개로 연결된 서비스이기 때문에 가능한 것이다.
그래서 만일 잠시 인스턴스의 처리 기능이 필요하지않고 저장 장치 기능만 필요할때는, 인스턴스를 정지시켜도 EBS는 독립적으로 살아있기 때문에 스토리지 기능만 이용하는데 인스턴스의 추가 요금을 내지 않아도 된다.
집 컴퓨터 같은 경우 CPU를 i9으로 업그레이드 한다고 하면 컴퓨터를 끄고 본체를 뜯어서 교체해줘야 하지만, 네트워크로 연결된(묶여있는) 인스턴스와 EBS는 단순히 인스턴스만 다른걸로 EBS와 재연결만 시키면 되기 때문이다.
거꾸로 하나의 EBS를 여러 EC2 장착(EBS Multi Attach) 가능하기도 하다. 여러 컴퓨터가 있으면 하나의 하드를 공용 저장소로 사용하는 원리이다.
이것은 당연히 물리적인 컴퓨터에서는 불가능하지만 네트워크(클라우드)에서만 가능한 특징인 셈이다.
EBS는 EC2와 같은 가용영역(AZ)에 존재한다. AZ가 같아야 연결 및 통신이 빠르기 때문이다.
만일 다른 AZ로 생성해서 EC2에 붙이려고 한다면 에러가 나게 된다.
EBS로 생성한 디스크 하나하나 저장 단위를 말한다.
EBS 볼륨을 인스턴스에 연결한다는 말은 EC2에 물리적 하드 드라이브처럼 사용하겠다는 뜻이다.
쉽게 말하자면, 윈도우에서 흔히 볼수 있는 C 드라이브, D드라이브는 각각 디스크이며 볼륨이라고 보면 된다.
EBS 타입이란 시중에서도 같은 하드 저장 디스크라도 SSD와 HDD로 나뉘고 용량에 따라 성능과 가격이 차이나는 것처럼, EBS도 각각 타입으로 나뉘놓은 것이다.
EBS는 총 5가지 타입을 제공하는데, 다음과 같다.
| 타입 | 범용타입 | 프로비저닝 된 IOPS | troughput 최적화 HDD | Cold HDD | 마그네틱 |
|---|---|---|---|---|---|
| 이름 | GP3 | IO2 | ST1 | SC1 | Standard |
| 용량 | 1GB~16TB | 4GB~16TB | 500GB~16TB | 500GB~16TB | 1GB~1TB |
| 사용 | 일반 범용 | IOPS가 중요한 어플리케이션/데이터베이스 | 쓰루풋이 중요한 어플리케이션/하둡/OLAP 데이터베이스 등 | 파일 저장소 | 백업/비 주기적인 데이터 액세스 |
| MAX IOPS | 16,000 | 64,000 | 500 | 250 | 40~200 |
각 하드의 성능은 용량과 MAX IOPS 수치를 보면 된다.
IOPS 수치가 높을수록 데이터 통신이 빠르다고 보면 된다. 그래서 프로비저닝 된 IOPS(64,000)이 가장 빠르고 좋다.
일반적으로 범용타입인 GP3를 선택하면 되지만, 자신은 요금을 극도로 아끼겠다 하면 마그네틱을 사용하면 된다.
EC2 인스턴스의 저장 타입은 대표적으로 두가지가 있다. 앞서 배운 EBS 기반과 그리고 인스턴스 저장 기반이다.
EC2를 생성할때, EC2 타입을 고르는 항목에서 인스턴스 스토리지 항목에 EBS 전용과 1 x 100 (SSD)라고 써져있는 유형들을 볼 수 있을 것이다.
EBS 전용은 말 그대로 스토리지를 EBS로만 사용할수 있는 EC2 인스턴스 타입이라는 뜻이며, (SSD)라고 명시되어있는 것이 인스턴스 스토리지를 따로 가지고 있다는 뜻이다.
지금까지 EC2 인스턴스를 생성할때 EBS 볼륨을 같이 설정해서 만들었다면, 이번에는 이미 생성된 EC2 인스턴스에 직접 EBS 볼륨을 추가해서 연결하는 방법을 알아보자.
EC2 대시보드 좌측 메뉴에서 Elastic Block Store > 볼륨으로 이동한 뒤, 우측 상단의 볼륨 생성 버튼을 클릭한다.
ap-northeast-2c — 연결할 EC2 인스턴스가 위치한 AZ와 반드시 일치시켜줘야 한다Name, Value = MyVolume2볼륨이 생성되면 볼륨 목록에서 사용 가능 상태를 확인할 수 있다.
해당 볼륨을 선택한 뒤, 우측 상단 작업 드롭다운에서 볼륨 연결을 클릭한다.
볼륨을 인스턴스에 연결했으면, 필히 인스턴스를 재시작을 해주어야 볼륨 추가 적용이 된다.
ls -al /dev/xvd* 명령이나 lsblk 명령어를 입력하면 연결된 디스크를 확인할 수 있다.
새로 연결한 /dev/xvdb라는 볼륨이 보인다.
$ ls -al /dev/xvd* # 디렉토리 조회
$ lsblk # 파일 시스템 조회
💡 Tip: 만일 디바이스 명을
/dev/sdf로 지정했다면, 최신 Linux 커널로 인해 내부적으로 xvdf로 바뀌게 된다. 따라서 장치명이/dev/xvdf로 나오게 된다.
착각하기 쉬운게 /dev/xvdb는 디렉토리가 아니다.
리눅스에서 /dev는 단순히 외부 디바이스, 하드를 모아둔 곳이지, 하드(EBS 볼륨)를 리눅스에 연결했다고 해서 바로 D: 드라이브 처럼 저장디스크를 바로 사용할수 있는 것이 아니다.
이를 파일시스템으로 포맷해줘야 컴퓨터에서 하드를 쓸수있게 된다.
파일 시스템이란?
저장장치에 파일을 어떻게 쓰고, 관리하고, 찾고, 읽을 것인지에 대한 규칙이다. 이 체계가 있어야만 리눅스에서 파일을 읽고 쓸 수 있게된다.비유: 하드디스크 = 도서관, 파일시스템 = 도서검색대, 파일 = 책, 데이터 = 원하는 내용
파일 시스템 종류
- Linux: ext, ext2, ext3, ext4, xfs
- Windows: FAT12, FAT16, FAT32, exFAT, NTFS
- Mac: HFS, HFS+
file -s "장치명" 명령어를 이용하여 볼륨에 파일시스템이 있는지 확인한다. 값이 data라고 나타난다면 파일시스템이 존재하지 않는 것이다.
$ file -s /dev/xvdb
파일시스템이 없다면, 다음 명령어로 ext4 파일시스템으로 포맷해준다.
$ sudo -s # 루트 권한 획득
$ mkfs -t ext4 /dev/xvdb # 해당 볼륨을 파일시스템으로 포맷
이제 DB를 따로 떼서 관리해줄 RDS를 사용하여 보자.
| 항목 | 1. RDS 사용 | 2. EC2에 MySQL 직접 설치 |
|---|---|---|
| 설정 난이도 | 중간 (AWS 콘솔에서 생성) | 낮음 (apt install mysql) |
| 메모리 | EC2 메모리 여유 생김 | EC2 1GB를 Spring Boot + MySQL이 나눠씀 |
| 안정성 | 높음 (AWS 관리형) | 메모리 부족 시 OOM 위험 |
| 비용 | 12개월 후 ~$15~20/월 | 추가 비용 없음 (영구 무료) |
| 적합한 경우 | 포트폴리오, 실제 서비스 운영 | 학습용, 테스트용, 단기 프로젝트 |
AWS RDS란 관계형 데이터베이스를 간편하게 클라우드에서 설정, 운영, 확장이 가능하도록 지원하는 웹 서비스이다.
RDS는 MySQL이나 오라클 같은 데이터베이스의 설치, 모니터링, 백업, 알람 등 관리를 대신해주며, 하드웨어 프로비저닝, 데이터베이스 설정, 패치 및 백업과 같이 잦은 운영 작업을 자동화하여 비용 효율적이고 크기 조정 가능한 DB 서비스를 제공한다.
따라서 RDS를 통해 개발자는 DB 인프라를 구성하는데 힘을 들이지 않고, 개발이라는 본질적인 작업에 집중할 수 있게되는 장점이 있다.
물론 EC2 자체가 컴퓨터니까 EC2 인스턴스에 직접 데이터베이스를 설치해서 사용해도 된다.
하지만 AWS RDS는 EC2에 RDB(관계형 데이터베이스)를 직접 구축하여운영할 때보다 더 많은 부분을 자동으로 관리할 수 있어 편리하기 때문에 많이 애용된다.
Amazon EC2에서 직접 관리해야 하는 항목: 앱 최적화, 스케일링, 고가용성 처리, 데이터베이스 백업, DB S/W 패치, DB S/W 설치, OS 패치, OS 설치, 서버 설치 및 장비, 랙 & 스택, 전력/냉난방 제어/회선
AWS RDS에서 자동 관리되는 항목: 앱 최적화를 제외한 스케일링, 고가용성 처리, 데이터베이스 백업, DB S/W 패치, DB S/W 설치, OS 패치, OS 설치, 서버 설치 및 장비, 랙 & 스택, 전력/냉난방 제어/회선
→ RDS를 사용하면 스케일링부터 백업까지 AWS가 자동으로 관리해주므로, 개발자는 앱 최적화에만 집중하면 된다.
cf) AWS 데이터베이스 서비스인 Amazon Aurora는 용량지정 X, 사용한만큼만 비용 지불
RDS의 가장 큰 특징은 파라미터 그룹(Parameter Group) 시스템인데, 이는 DB의 설정값들을 모아 그룹화한 개념이다.
이 DB 설정들을 모은 그룹을 각 DB 인스턴스에 적용시켜 DB의 설정값을 적용하는 시스템이다.
왜냐하면 위에서 말했듯이 직접 RDS 인스턴스 수정이 불가능 하기 때문에 이런 우회적인 방법으로 설정값을 세팅하는 원리이다.
💡 Tip: AWS 프리티어로는 RDS를 12개월동안 단일 AZ, db.t2.micro 인스턴스를 750시간 무료 사용할 수 있다.
RDS에서는 Amazon Aurora, PostgreSQL, MySQL, MariaDB, Oracle, MS SQLServer 총 6개의 데이터베이스 엔진 중에서 원하는 DBMS를 선택할 수 있다.
또한 AWS Database Migration Services를 사용하여 기존 데이터베이스를 Amazon RDS로 손쉽게 마이그레이션 또는 복제 할 수 있다.
각 DB 엔진 특징
Amazon Aurora: MySQL 및 PostgreSQL호환 관계형 데이터베이스로, 오픈 소스 데이터베이스의 간편 성과 비용 효율성을 결합한 것이다. 표준 MySQL보다 5배, PostgreSQL보다 3배 빠르다고 한다. 상용 데이터베이스의 보안, 가용성 및 안전성을 1/10의 비용으로 제공하기도 한다.
PostgreSQL: 오픈 소스 관계형 데이터베이스 중 기능도 많고 성능도 좋은 거의 원탑의 데이터베이스이다.
MySQL: 세계적으로 가장 많이 사용되는 오픈 소스 관계형 데이터베이스다. Amazon RDS를 통해 비용 효율적이고 크기 조정이 가능한 MySQL 서버를 몇 분 안에 생성할 수 니다.
MariaDB: MySQL을 개발한 개발자가 만든 오픈 소스 관계형 데이터베이스이다. MySQL 업그레이드 판이라고 봐도 된다.
Oracle: 오라클사의 유료 관계형 데이터베이스로서, RDS를 사용해 클라우드에서 손쉽게 배포, 설정, 운영 할 수 있는 완전 관리형 상용 데이터베이스이다. 다만 유료 데이터베이스라 라이선스 비용이 든다.
SQL Server(MSSQL): Microsoft에서 개발한 관계형 데이터베이스 관리 시스템으로 Amazon RDS를 통해 손쉽게 배포, 운영, 확장이 가능하다.
자동 백업(Automated Backups) 줄여서 AB는 매일마다 스냅샷과 트랜잭션 로그를 참고하여 자동으로 백업을 해준다.
RDS에서는 디폴트로 AB 기능이 설정되어 있다.
그리고 AB를 통해 데이터베이스를 Retention Period(1~35일) 안의 과거 특정 시간으로 되돌아갈 수도 있다.
단, 풀백 동작은 과거 상태로 그대로 돌아가는게 아닌, 다른 DB 인스턴스를 새로 생성해서 스냅샷을 적용 시키는 형식임을 유의하자.
RDB 백업 정보는 S3에 저장되며, AB동안 약간의 I/O suspension(딜레이)이 존재할 수 있다.
그나마 Multi-az로 하면 Standby를 통해 백업을 수행하기 때문에 딜레이가 덜하다.
💡 Standby 란?
돌발 사태로 예정된 기능이 이뤄지지 못할 경우를 대비한 '임시'를 뜻함
AB(자동 백업)이 자동으로 스냅샷을 떠서 백업하는 것이라면, 수동 백업은 유저 혹은 다른 프로세스로부터 요청에 따라 만들어지는 DB 스냅샷이다.
즉, EC2 스냅샷을 뜨듯이 사용자에 의해 수동적으로 진행되는 백업이다.
만약 원본 RDS를 삭제한다고 하더라도, 스냅샷은 S3 버킷에 그대로 존재한다. 따라서 스냅샷만으로 RDS 인스턴스를 복원시킬 수 있다.
반대로 AB 백업 기능은 인스턴스를 삭제할 때 스냅샷도 모두 없어진다는 특징이 있다.
스냅샷의 복구는 항상 새로운 DB Instance를 생성하여 수행되며, 만약 데이터베이스를 복구해야 한다면, 새로운 DB를 만들고 기존 DB의 연결을 끊고 새로 만든 DB에 연결해 주는 작업이 필요하다.
원본 RDS 인스턴스를 가지고 새로운 DB를 복원시 새로운 인스턴스와 Endpoint가 생성된다.
원본 DNS는 앞에 original인 반면, 복원된 것은 앞에 restored가 붙게된다.
원본: original.ap-northeast-2.rds.amazonaws.com
복원: restored.ap-northeast-2.rds.amazonaws.com
| 요금 발생 유형 | 요금 정책 |
|---|---|
| 온디맨드 | 인스턴스에서 실행한 컴퓨팅 파워에 대해서 시간당 요금 지불 |
| 예약 | 온디맨드보다 저렴. 1년~3년 약정 기간에 DB 인스턴스 예약 |
| DB Storage | 범용(SSD) 스토리지: 프로비저닝한 스토리지에 대해 요금 청구 (I/O는 요금 청구 없음). 프로비저닝 IOPS(SSD) 스토리지: DB에 필요한 I/O 용량을 지정하거나 프로비저닝 가능. 프로비저닝한 처리량 및 스토리지에 대해 비용 청구(I/O 요금청구 없음) |
| 백업 스토리지 | 리전별로 할당. 리전 전체 데이터베이스 스토리지의 최대 100프로에 해당하는 백업 스토리지는 추가비용 없음. DB 인스턴스 종료 후에 백업스토리지에 월별 GiB당 요금청구. 추가 백업 스토리지에는 월별 GiB당 요금 청구 |
| 스냅샷 내보내기 | 스냅샷 용량에 따라 요금 지불. 동일한 스냅샷에서 추가로 데이터 내보내는건 요금 없음. RDS내에서 데이터 내보내거나 S3로 내보낸 |
| 데이터 전송 | 동일한 가용 영역에서 Amazon RDS와 Amazon EC2 인스턴스 간에 전송된 데이터는 무료. 같은 리전의 서로 다른 가용 영역에서 Amazon EC2 인스턴스와 Amazon RDS DB 인스턴스 간에 전송된 데이터의 경우, 양쪽 모두에 Amazon EC2 리전 데이터 전송 요금이 청구 |
데이터베이스는 관리가 중요하다.
만일 어느 데이터베이스가 장애가 나면 재빨리 다른 데이터베이스로 옮겨 서비스를 지속하는 등 고가용적인 관리가 필요하다.
또한 트래픽이 몰려 데이터베이스 서버가 터지는걸 대비해 분산 기법도 이용해야 한다.
AWS RDS는 데이터베이스를 보다 효율적으로 관리할수 있게 하는 인프라 아키텍처 방법 3가지를 제공한다.
| Multi-AZ | Multi-Region | Read Replica | |
|---|---|---|---|
| 목적 | 고가용성 | DR/로컬 퍼포먼스 | 확장성/성능 |
| 복제방식 | Sync | Async | Async |
| 액티브 | Primary DB만 읽기/쓰기 가능 | Read만 가능 | Read만 가능 |
| 백업 | 자동백업(Standby기준) | 자동 백업 가능 | 기본적으로 백업 x |
| 엔진 업데이트 | Primary만 업데이트 | 각 리전별로 다른 업데이트 | DB별로 다른 업데이트 |
| FailOver | 자동으로 Standby로 Failover | 수동으로 Failover | 수동으로 Failover |
RDS 멀티 AZ는 위 사진에서 보듯이, 두개 이상의 AZ에 걸쳐 데이터베이스를 구축하고 원본과 다른 DB(Standby)를 자동으로 동기화(Sync)하는 구조이다.
Multi AZ는 AWS에 의해서 자동으로 관리가 이루어 진다.
만약 RDS DB를 만들고, DB에 특정 레코드를 insert 할 시, 다른 AZ(Availability Zone)에 똑같은 복제본이 만들어지게 된다.
그리고 유사시 우리가 현재 사용하고 있는 메인 DB에 문제가 생길 경우 RDS는 이를 즉시 발견하고 다른 AZ에 만들어진 복제본을 원본 DB를 숨겨시켜 그대로 사용하게 된다. 이를 Disaster Recovery(재해 복구)라고 부른다.
이번 포스팅에서는 EBS의 개념과 EC2 연결 방법, 그리고 RDS의 개념과 특징, 백업 시스템, 가격 모델, 구성 아키텍처까지 정리하였다.
다음 포스팅에서는 실제로 RDS를 구축하고 EC2와 연결하는 과정을 다룰 예정이다.