AWS는 S3나 EBS, EFS외에도 다른 스토리지 서비스를 제공하고 있습니다. 대용량 데이터를 AWS로 안전하고 빠르게 마이그레이션이 필요하거나 인터넷 연결이 힘든 환경에서도 AWS 서비스를 제공하는 스토리지 서비스, HPC에 사용할 수 있는 고성능 파일 시스템을 지원하는 서비스, 하이브리드 클라우드를 위한 스토리지 서비스, 스토리지 파일 전송 및 동기화 서비스 등 부가적인 스토리지 서비스를 제공하여 AWS로 마이그레이션이나 하이브리드 클라우드 구성을 돕습니다.
AWS Snow Family
- 엣지에서 데이터를 모으고 처리하고 AWS 외부에서 AWS로 데이터를 마이그레이션하기 위한 매우 안전한 휴대기기를 의미한다.
Data Migration
- 종류
- Snowcone
- Snowball Edge
- Snowmobile
- 네트워크를 통해 대량의 데이터를 전송하는데 걸리는 시간은 꽤 오래 걸릴 수 있다.
- 대용량 데이터 마이그레이션에 발생하는 문제점
- 연결 제한
- 대역폭 제한
- 데이터 전송을 위한 높은 네트워크 비용
- 대역폭 공유 - 전체 대역폭을 사용할 수 없다.
- 연결 불안정 - 다시 전송을 시작해야하는 경우가 발생할 수 있다.
- Snow Family는 데이터 마이그레이션을 할 수 있게 해주는 오프라인 기기이다.
- AWS는 우편으로 실제 물리장치를 배송해준다.
- 사용자는 데이터를 물리장치에 로딩 후 AWS에 반송한다.
- 네트워크를 사용한 데이터 마이그레이션에 일주일 이상이 소요된다면 Snowball 기기를 사용해야한다.
Snowball Edge
- 거대한 박스 형태
- 테라바이트나 페타바이트 용량의 데이터를 AWS로 물리적으로 전송하기 위해 사용
- 네트워크를 통하지 않고 장치에 저장 후 옮긴다.
- 전송 작업 당 비용이 청구
- 블록 스토리지나 Amazon S3와 호환 가능한 객체 스토리지를 제공
- 유형
- Storage Optimized
- 80TB 용량의 HDD가 제공
- 블록 볼륨이나 S3 호환 객체 스토리지
- Compute Optimized
- 42TB HDD or 28TB NVMe가 제공
- 블록 볼륨이나 S3 호환 객체 스토리지
- Use case
- 대규모 데이터의 클라우드 마이그레이션
- 데이터센터 폐지 또는 재해 복구를 위해 AWS로 데이터 백업
Snowcone
- 아주 작은 휴대 기기이며 열악한 환경에서도 견딜만큼 견고하고 안전하다.
- 데이터의 양이 적은 환경에서 사용
- 에지 컴퓨팅, 스토리지, 데이터 전송에 사용
- 유형
- Snowball이 적합하지 않은 경우에 Snowcone을 사용
- 공간 제약이 있는 환경
- 베터리와 케이블을 제공할 수 있는 환경
- AWS 전송 방법
- 오프라인으로 데이터를 발송
- 기기가 인터넷에 연결가능할 때 데이터 센터에 연결하는 방법
- AWS DataSync 서비스를 사용해서 데이터를 다시 AWS에 전송
Snowmobile
- 실제 트럭이다. 개꿀
- 엑사바이트급 데이터를 옮길 수 있다.
- Snowmobile 한대당 100PB 용량을 옮길 수 있다.
- 보안이 뛰어나다.
- 10PB 이상의 데이터를 옮길 경우에 Snowball보다 더 좋다.
Usage Process
- AWS 콘솔에서 기기 배송 요청
- Snowball 클라이언트 또는 AWS OpsHub 서버 설치
- Snowball을 서버에 연결 후 클라이언트 안에서 파일 복사
- 장치가 준비되면 기기를 AWS로 반송
- 전자 마커가 있어 올바른 AWS 시설로 기기가 곧바로 배송
- S3 버킷에 데이터가 로딩
- 최고 수준의 보안 조치에 따라 Snowball에서 데이터를 완전히 제거
Edge computing
- 본래 목적은 데이터 마이그레이션이 전부이지만 엣지 로케이션에서 컴퓨팅 성능을 제공할 수도 있다.
- 종류
- Snowcone
- 2개 CPU, 4GB RAM, 유무선 액세스
- USB-C 전원 혹은 베터리 옵션
- Snowball Edge - Compute Optimized
- 104개 vCPU, 416GiB RAM
- GPU 선택 - 영상 작업이나 머신러닝 용
- 28TB NVMe or 42TB HDD
- 스토리지 클러스터링이 16개 노드로 전체 스토리지 용량을 늘릴 수 있다.
- Snowball Edge - Storage Optimized
- 40개 vCPU, 80GiB RAM, 80TB 스토리지
- 모든 기기들은 EC2 인스턴스와 람다 함수를 실행할 수 있다.
- 람다 함수를 위해 AWS IoT Greengrass 서비스를 활용
- 엣지 컴퓨팅은 엣지 로케이션에서 데이터를 생성하는 중에 그 데이터를 처리하는 것을 의미
- 엣치 로케이션은 인터넷이 없거나 클라우드에서 멀리 떨어져 있는 모든 위치를 의미
- 트럭이나 바다에 있는 배
- 이러한 위치는 데이터가 생산되지만 인터넷 연결이 제한되거나 컴퓨팅 능력에 액세스 할 수 없는 곳
- 엣지 로케이션에서 엣지 컴퓨팅을 위해 Snowball Edge나 Snowcone을 주문하여 사용가능
- Use case
- 데이터 전처리
- 엣지에서 머신러닝
- 미디어 스트림의 사전 트랜스코딩
- 데이터를 AWS로 보내야한다면 장치를 AWS로 반송한다.
- 데이터가 생성되는 곳 가까이서 데이터를 처리하고 AWS로 반송
- 장기간 사용할 수 있으므로 렌트할 수 있고 1년 또는 3년까지 할인된 가격으로 사용할 수 있다.
OpsHub
- 과거에 엣지 장치를 사용하기 위해서는 CLI를 사용 해야했지만 OpsHub를 사용하면 GUI 환경에서 엣지 장치를 사용할 수 있다.
- 클라우드가 아닌 로컬 장치에 설치해서 사용
- 싱글 혹은 클러스터 기기를 열어서 설정
- 파일 전송
- 인스턴스 시작 및 관리
- 기기와 메트릭을 관리
- 호환되는 AWS 서비스 사용
Snowball into Glacier
- Snowball을 바로 Glacier로 불러올 수 없다.
- S3의 수명 주기 정책을 생성하여 Amazon Glacier로 객체를 전환할 수 있다.
Amazon FSx
- AWS에서 제공하는 완전 관리형 서비스
- 타사 고성능 파일 시스템을 실행
- 종류
- FSx for Lustre
- FSx for Windows File Server
- FSx for NetApp ONTAP
- FSx for OpenZFS
- etc
FSx for Windows File Server
- 완전 관리형 Windows 파일 서버 공유 드라이버
- SMB 프로토콜과 Windows NTFS 지원
- Microsoft Active Directory를 지원하므로 사용자 보안을 추가할 수 있고 ACL로 사용자 할당량을 추가해 액세스를 제어
- Windows뿐만 아니라 Linux EC2 인스턴스에도 마운트할 수 있다.
- 기존 On-premise Windows 파일 서버가 있는 경우 Microsoft DFS - Distributed File System 기능을 사용해서 파일 시스템을 그룹화할 수 있다.
- 이 기능으로 On-premise Windows 파일 서버와 FSx for Windows File Server를 결합할 수 있다.
- 10s of GB/s, millions of IOPS, 100s PB of Data까지 확장될 수 있다.
- Storage Options
- SSD - 지연시간이 짧아야 하는 워크로드를 저장 - DB, 미디어 처리, 데이터 분석
- HDD - 넓은 스펙트럼의 워크로드를 저장 - home 디렉토리, CMS
- VPN이나 Direct Connect 같은 프라이빗 연결로 On-premise 인프라에 액세스 가능
- 고가용성 다중 AZ에 대해 구성 가능
- 모든 데이터는 재해 복구 목적으로 Amazon S3에 매일 백업
FSx for Lustre
- Lustre = Linux + Cluster
- Lustre는 원래 분산 파일 시스템으로 대규모 연산에 사용
- 머신 러닝, HPC에 사용
- 동영상 처리, 금융 모델링, 전자 설계 자동화 등의 애플리케이션에 사용
- 100s GB/s, millions of IOPS, sub-ms 지연시간까지 확장할 수 있다.
- Storage Options
- SSD - 낮은 지연 시간, IOPS 특화 워크로드, 크기가 작고 무작위 파일 작업, HDD보다 비쌈
- HDD - 처리량 특화 워크로드, 크고 시퀸셜 파일 작업
- S3와 무결정성 통합 가능
- FSx로 S3를 파일 시스템처럼 읽어들일 수 있다.
- FSx의 연산 출력값을 다시 S3에 쓸 수 있다.
- VPN이나 Direct Connect 같은 프라이빗 연결로 On-premise 인프라에 액세스 가능
Deployment Options
- 스크래치 파일 시스템
![](https://velog.velcdn.com/images/whddms310/post/5cbefa9b-165c-4ea3-b546-4c98c26b048a/image.png)
- 임시 스토리지로 데이터가 복제되지 않는다.
- 서버가 오작동하면 파일이 모두 유실
- 최적화로 초과 버스트를 사용 가능
- 영구 파일 시스템보다 성능을 6배 높일 수 있다.
- 200MBps per TiB
- 단기 처리 데이터에 사용, 데이터 복제가 없어 비용 최적화 가능
- 영구 파일 시스템
- 장기 스토리지 동일한 가용 영역에 데이터가 복제
- 서버가 오작동하면 몇 분내에 해당 파일이 대체된다.
- 민감한 데이터의 장기 처리 및 스토리지
FSx for NetApp ONTAP
- AWS 관리형 NetApp ONTAP
- NFS, SMB, iSCSI 프로토콜과 호환 가능
- On-premise 시스템의 ONTAP이나 NAS에서 실행 중인 워크로드를 AWS로 옮길 수 있다.
- 지원 플랫폼
- Linux
- Windows
- MacOS
- VMware Cloud on AWS
- Amazon Workspaces & AppStream 2.0
- Amazon EC2, ECS and EKS
- 스토리지는 자동으로 스케일링 된다.
- 복제와 스냅샷 기능 지원
- 비용이 적게 든다.
- 데이터 압축이나 중복제거 가능
- 지정 시간 복제 기능
FSx for OpenZFS
- AWS 관리형 OpneZFS
- 여러 버전의 NFS 프로토콜과 호환 가능
- 주로 ZFS에서 실행되는 워크로드를 내부적으로 AWS로 옮길 때 사용
- 지원 플랫폼
- Linux
- Windows
- MacOS
- VMware Cloud on AWS
- Amazon Workspaces & AppStream 2.0
- Amazon EC2, ECS and EKS
- 백만 IOPS까지 확장 가능, 0.5ms이하 지연시간
- 스냅샷, 압축 지원
- 비용이 적게 든다
- 데이터 중복 제거 기능은 지원하지 않음
- 지정 시간 동시 복제 기능
Create FSx
-
사용할 파일 시스템 유형 선택 - Lustre
-
파일 시스템 세부 정보 지정
- 배포 및 스토리지 유형 선택
- 영구, SSD
- 영구, HDD
- 스크래치, SSD
- 스토리지 단위당 처리량, 용량 선택
- VPC 및 VPC 보안 그룹 선택
- 암호화 수준 설정
Storage Gateway
Hybrid Cloud
- AWS는 하이브리드 클라우드를 권장한다.
- 일부 인프라는 AWS 클라우드에 있고 나머지는 on-premise에 두는 방식
- 사용 이유
- 클라우드 마이그레이션이 오래 걸린다.
- 보안 또는 규정 준수 요건이 있는 경우
- 전략에 따라 엘라스틱 워크로드에만 클라우드를 적용
- S3는 독점 스토리지 기술로 NFS 규정 준수 파일 시스템인 EFS와 다르다.
- S3 스토리지에 있는 데이터를 on-premise에 두려면 AWS Storage Gateway를 사용한다.
AWS Storage Cloud Native Options
- Block
- Amazon EBS
- EC2 Instance Store
- File
- Odject
AWS Storage Gateway
- On-premise와 클라우드 데이터 간의 가교 역할을 한다.
- Use case
- 재해 복구 목적으로 on-premise 데이터를 클라우드로 백업
- 백업 및 복구 목적으로 클라우드 마이그레이션 혹은 온프레미스에서 클라우드 간 스토리지 확장
- 콜드 데이터는 클라우드에 웜 데이터는 on-premise에 둔다.
- 대부분의 데이터를 AWS에 저장하고 파일 액세스 지연 시간을 줄이기 위해 storage gateway를 on-premise의 캐시로 사용
- 유형
- S3 File Gateway
- FSx File Gateway
- Volume Gateway
- Tape Gateway
S3 File Gateway
- S3 Glacier를 제외한 모든 클래스를 연결할 수 있다.
- 사용 절차
- 애플리케이션 서버가 동작 중인 데이터센터에 S3 File Gateway를 생성
- 애플리케이션 서버와 S3 File Gateway간 프로토콜은 NFS나 SMB를 사용하도록 설정
- S3 File Gateway는 NFS나 SMB 프로토콜을 HTTPS 요청으로 변환시켜 S3로 전송
- 애플리케이션 서버에서 보기에는 일반적인 파일 공유 액세스로 보이지만 실제로는 Amazon S3를 사용하는 것이다.
- 데이터를 아카이브 하기 위해서는 AWS에서 수명 주기 정책을 활용하여 Glacier로 객체를 이동시킨다.
- S3 버킷의 데이터는 NFS나 SMB 프로토콜을 사용해서 액세스 가능
- 사용된 데이터는 신속한 액세스를 위해 file gateway에 캐시된다.
- 전체 데이터가 아닌 최근에 사용한 데이터만 있다.
- 버킷에 액세스하기 위해 각 file gateway마다 IAM 역할을 생성
- Windows 파일 시스템 네이티브인 SMB 프로토콜을 사용하는 경우 사용자 인증을 위해 AD와 통합해야한다.
FSx File Gateway
- FSx for Windows File Server에 네이티브 액세스가 가능하다.
- 사용절차 - FSx for Windows File System이 Amazon FSx 파일 시스템에 배포되어 있고 회사 데이터 센터의 SMB 클라이언트가 액세스 하려는 경우
- FSx for Windows File System에 액세스하려는 경우 File Gateway를 생성하지 않아도 되지만 로컬 캐시를 확보하여 더 빠른 액세스가 가능하기 때문
- SMB, NTFS, AD과 호환 가능
- 그룹 파일 공유나 on-premise를 연결할 홈 디렉토리로 사용 가능
Volume Gateway
- 블록 스토리지로 S3가 백업하는 iSCSI 프로토콜을 사용
- 볼륨이 EBS 스냅샷으로 저장하여 필요에 따라 on-premise 볼륨을 복구할 수 있다.
- 유형
- Cached volume : 데이터 액세스 시 지연시간이 낮다.
- Stored volume : 전체 데이터 세트가 온프레미스에 있어 주기적인 Amazon S3 백업 진행
Tape Gateway
- 물리 테이프를 사용한 백업 프로세스를 회사가 클라우드를 활용하여 데이터를 백업할 수 있도록 한다.
- VTL - Virtual Tape Library는 백업을 Amazon S3나 Glacier에 사용
- 테이프 기반 프로세스의 기본 백업 데이터를 iSCSI 인터페이스로 백업
- 업계를 선도하는 백업 소프트웨어 벤더가 사용하는 서비스
Storage Gateway - Hardware appliance
- 모든 Gateway는 회사의 데이터 센터에 설치되어야 한다.
- 하지만 gateway를 설치할 가상 서버가 없는 경우가 종종 있는데 이 경우 AWS의 하드웨어를 사용할 수 있다. - Amazon.com에서 주문
- 장치가 작동하기 위한 CPU, 메모리, 네트워크 SSD 캐시 리소스가 필요하다.
- 소규모 데이터 센터의 일일 NFS 백업처럼 가상화가 없는 경우 상당히 유용
Transfer Family
- Amazon S3 또는 EFS의 안팎으로 데이터를 전송하려고 할 때 FTP 프로토콜을 사용하려고 할 때 사용
- 지원 프로토콜
- AWS Transfer for FTP
- AWS Transfer for FTPS - SSL을 사용하는 암호화된 전송
- AWS Transfer for SFTP - 보안 파일 전송
- 완전 관리형 인프라이며 확장성, 안정성, 가용성이 높다.
- 가격 : 시간당 프로비저닝된 엔드 포인트 비용에 전송 제품군 안팎으로 전송된 데이터의 GB당 요금
- 서비스 내에서 사용자 자격 증명을 저장 및 관리 가능
- 아래의 인증 시스템과 통합 가능
- Microsoft Active Directory
- LDAP
- Okta
- Amazon Cognito
- Custom
- Usage
- Amazon S3나 EFS의 FTP 인터페이스를 갖기 위해서 사용
- 파일 공유 및 공개 데이터셋 공유
- CRM
- ERP
DataSync
- 데이터를 동기화를 통해 대용량의 데이터를 한 곳에서 다른 곳으로 옮길 수 있다.
- On-premise나 AWS외 다른 클라우드로 데이터를 옮길 수 있다.
- 서버를 NFS, SMB, HDFS 또는 다른 프로토콜로 연결
- 옮길 위치인 on-premise나 연결할 다른 클라우드에 에이전트가 있어야 한다.
- 한 AWS 서비스에서 다른 AWS 서비스로 데이터를 옮길 때 사용
- 동기화 가능 리소스
- Amazon S3 - Glacier 포함
- Amazon EFS
- Amazon FSx
- 복제 작업은 스케줄에 따라 매 시간, 매일 혹은 매주 실행되도록 할 수 있다. - 지연이 발생할 수 있다.
- 파일 권한과 메타데이터 저장 기능
- NFS POSIX 파일 시스템
- SMB 권한을 준수
- 에이전트 하나의 테스크가 초당 10GB까지 사용 가능하며 네트워크 성능 초과를 방지하기 위해 대역폭에 제한을 걸 수 있다.
AWS 스토리지 서비스 간 동기화
- AWS DataSync를 사용하여 데이터 복사본을 만든다.
- 서로 다른 스토리지 서비스 간 메타데이터 유지
Storage Comparison
S3
- 객체 스토리지
- 구체적 API
- 대부분 AWS 서비스와 연결 가능
S3 Glacier
EBS Volume
- 한 번에 한 개의 EC2 인스턴스에만 스토리지를 연결
- io1/io2는 다중 연결 지원
Instance Storage
- EC2 인스턴스에 높은 IOPS를 가지는 고성능 물리 스토리지가 필요할 때 사용
EFS
- 인스턴스가 네트워크 파일 시스템을 필요로 할 때 사용
- 다중 가용 영역 마운트를 사용해야 하면서 POSIX 파일 시스템을 사용해야할 때 사용
FSx for Windows
- Windows 서버 파일 시스템을 필요로 하는 경우
FSx for Lustre
- 고성능 연산 Linux 파일 시스템이며 Lustre 클라이언트와 호환 가능해야하는 경우 사용
FSx for NetApp ONTAP
- 높은 OS 호환성과 네트워크 파일 시스템이 필요할 때 사용
FSx for OpenZFS
Storage Gateway
- On-premise와 AWS 간 스토리지 연결 방법
Transfer Family
- S3나 EFS외에 FTP, FTPS, SFTP 인터페이스가 필요할 때 사용
DataSync
- 온프레미스에서 AWS, AWS에서 AWS로 일정에 따라 데이터를 동기화할 때 DataSync를 사용
Snow Family
- 데이터를 옮기는데 쓸 네트워크 용량이 없어 물리적으로 대용량의 데이터를 옮겨야 할 때는 Snowcone / Snowball / Snowmobile 장치를 주문해서 온프레미스에 설치한 다음 클라우드로 이전
- Snowcone은 DataSync 에이전트가 사전 설치되어 온다
Database
- 데이터 저장은 가능하나 인덱스와 쿼리 작업을 필요로 하는 특수한 워크로드가 있다.
참고 자료
AWS Docs - AWS Snow 패밀리
AWS Docs - AWS Snowball 엣지는 무엇인가요?
AWS Docs - AWS Snowcone는 무엇인가요?
AWS 한국 블로그 - AWS Snowmobile – 엑사 바이트(Exabyte) 데이터를 몇 주 만에 클라우드로
AWS Docs - FSx for Windows File Server란 무엇입니까?
AWS Docs - Amazon FSx for Lustre란?
AWS Docs - ONTAP용 아마존 NetApp FSx란 무엇입니까?
AWS Docs - What is Amazon FSx for OpenZFS?
AWS Docs - AWS Storage Gateway 설명서
AWS Docs - AWS Transfer Family 무엇입니까?
AWS Docs - AWS DataSync란 무엇인가요?