[AWS SAA-C03] 머신 러닝

이재민·2024년 6월 20일

AWS SAA-C03

목록 보기

18/22

Rekognition

Amazon Rekognition은 기계 학습을 이용해 객체, 사람, 텍스트와 이미지와 비디오의 장면을 찾는 서비스다.
얼굴을 분석하고 비교하여 사용자 확인을 하며 이미지 내의 인물 수를 셀 수 있다.
익숙한 얼굴을 저장해 자체 데이터베이스를 생성하거나 이미지 속 인물이 궁금할 때 유명인 얼굴의 데이터베이스와 비교할 수 있다.
Amazon Rekognition의 사용 사례로는 촬영한 사진이나 비디오의 라벨링 콘텐츠 조정, 텍스트 탐지 얼굴 탐지 및 분석을 들 수 있다.
성별이나 연령 범위 얼굴에 나타나는 표정을 탐지할 수 있다.
얼굴 검색 및 확인이나 유명인 얼굴 인식에도 쓰이며 이동 경로를 따라가므로 스포츠 경기 분석에도 사용된다.
모든 연령에 적절한지 확인하는 콘텐츠 조정 기능도 있고 경주하는 이미지에서 텍스트를 탐지해 각 주자의 번호를 알 수도 있다.
얼굴 탐지 및 분석과 감정 분석도 가능하다.
보안 애플리케이션에는 얼굴 검색 및 확인 기능을 쓸 수 있다.

Transcribe

오디오를 넣으면 자동으로 텍스트로 변환한다.
자동 음성 인식(ASR)이라는 딥러닝 프로세스를 사용하여 음성을 텍스트로 매우 빠르고 정확하게 변환한다.
Redaction을 사용하여 개인 식별 정보(PII)를 자동으로 제거할 수 있다.
예를 들어 누군가의 나이, 이름, 사회보장번호가 있다면 자동으로 제거된다.
다국어 오디오를 자동으로 언어 식별할 수 있다.
Amazon Transcribe의 사용 사례는, AS 전화의 대본을 자동으로 폐쇄 자막이나 자막으로 만드는 것이다.
또한 완전히 검색 가능한 아카이브를 만들기 위해 미디어 자산에 대한 메타데이터를 만든다.

Polly

딥 러닝 기술을 사용해 텍스트를 음성으로 변환한다. 말하는 애플리케이션을 만들 수 있다.
Amazon Polly는 어휘 목록과 SSML을 활용한다.
먼저 '발음 어휘 목록'을 사용해 사용자 지정 발음을 생성할 수 있다.
어휘 목록을 업로드해서 SynthesizeSpeech 작업에 사용하면 된다.
두 번째 기능은 SSML 기능
SSML은 '음성 합성 마크업 언어'라는 뜻으로 보다 다양한 사용자 지정 음성을 만들 수 있는 기능이다.
Amazon Polly 서비스 페이지에서 텍스트를 자연스러운 음성으로 변환할 수 있다.

Amazon Translate

자연스럽고 정확한 언어 번역 기능을 제공한다. Translate를 통해 콘텐츠를 현지화할 수 있다.
즉 해외 사용자를 위한 웹사이트와 애플리케이션 등에 적용 가능하다.
또한 대량의 텍스트를 효율적으로 번역할 수 있다.

Lex & Connect

Lex를 사용하여 자동 음성 인식을 할 수 있다. 음성을 인식하는 ASR이라서 말을 텍스트로 바꿔준다.
Lex가 자연어 이해를 통해 말의 의도를 파악하고 문장을 이해할 수 있다.
Amazon Lex 기술은 챗봇 구축이나콜 센터 봇 구축에 도움을 준다.
Amazon Connect라는 가상 고객 센터가 있다. 전화를 받고 고객 응대 흐름을 생성하는 클라우드 기반 서비스다.
다른 고객 관계 시스템 혹은 관리 시스템인 CRM 및 AWS 서비스와 통합할 수 있다.
Amazon Connect는 기존 고객 센터 방식에 비해 초기 비용이 없고 비용이 약 80% 저렴하다.
정리하면 Lex는 ASR이고 Connect는 고객 센터

Comprehend

자연어를 처리하는 NLP(Natural Language Processing) 완전 관리형 서버리스 서비스.
머신 러닝을 사용하여 텍스트에서 인사이트와 관계를 도출한다.
분석 중인 텍스트가 긍정적인지 부정적인지 파악하는 감정 분석을 할 수 있다.
토큰화 및 품사를 사용하여 텍스트를 분석할 수 있고 음성을 식별한다.
텍스트 파일 모음을 주제에 따라 정리하고 주제를 식별한다.
대량의 데이터가 있으면 Comprehend가 그 데이터의 의미를 이해하려고 시도하는 것이다.
따라서 텍스트 혹은 구조화되지 않은 데이터를 이런 기능을 사용해 구조화하는 것
시험에서 NLP가 보이면 Amazon Comprehend를 떠올려야 한다.

Comprehend Medical Overview

비정형 의료 텍스트에서 유용한 정보를 탐지해서 반환해 주는 서비스
의사 소견서나 퇴원 요약서, 검사 결과서 의료 사례 기록을 발견하면 NLP, 즉 자연어 처리를 사용해 텍스트를 탐지한다.
문서와 문서 속의 보호된 개인 건강 정보(PHI)를 DetectPHI API로 탐지해낸다.
아키텍처 관점에서 보면 Amazon S3에 문서를 저장하고 Comprehend Medical API를 실행하는 거고 Kinesis Data Firehose로 실시간으로 데이터를 분석하거나 Amazon Transcribe를 사용해 음성을 텍스트로 변환한 후 텍스트 형식의 콘텐츠를 Amazon Comprehend Medical 서비스에 전달하는 것이다.
Amazon Comprehend Medical로 텍스트에서 정보를 추출해 인사이트를 얻을 수 있다는 게 핵심이다.

SageMaker

SageMaker는 완전 관리형 서비스이며 머신 러닝 모델을 구축하는 개발자와 데이터 과학자를 위한 서비스다.
SageMaker는 높은 수준의 머신 러닝 서비스로 조직의 실제 개발자와 데이터 과학자가 머신 러닝 모델을 만들고 구축하기 위해 사용한다.
라벨링과 구축, 훈련 및 조정, 적용 모두 SageMaker에서 가능하다.

Forecast

완전 관리형 서비스이며 머신 러닝을 사용하여 매우 정확한 예측을 제공한다. (데이터 자체를 확인하는 것보다 50% 더 정확)
관리형 서비스는 예측 시간을 몇 달에서 몇 시간으로 줄여준다.
예측이 필요한 것은 모두 사용 사례가 된다. 제품 수요 계획과 재무 계획 자원 계획 등

Forecast 예시

과거 시계열 데이터에 제품 특징, 가격, 할인 웹사이트 트래픽, 상점 위치 기본적으로 모델을 향상시킬 데이터를 추가한다.
그리고 Amazon S3에 이를 업로드한 뒤에 Amazon Forecast 서비스를 시작한다.
그러면 예측 모델이 생성되고 이 모델을 사용하여 미래의 비옷 판매량이 내년에 $500,000라고 예측하는 것이다.

Kendra

머신 러닝으로 제공되는 완전 관리형 문서 검색 서비스.
문서(text, pdf, HTML PowerPoint, MS Word, FAQ 등) 내에서 답변을 추출할 수 있게 도와준다.
Amazon Kendra는 이런 문서를 인덱싱하여 머신 러닝으로 작동되는 지식 인덱스를 내부적으로 구축한다.
최종 사용자 관점에서는 자연어 검색 능력이 도움이 된다.
예를 들어 사용자가 Amazon Kendra에 'IT의 지원 데스크 위치가 어디야?'라고 물으면 Kendra는 '1층입니다'라고 대답할 수 있다.
이게 가능한 이유는 Kendra가 모든 리소스를 검색하여 IT 지원 데스크의 위치가 1층임을 알 수 있기 때문
물론 일반적인 검색도 가능하다. 사용자의 상호 작용 및 피드백에서 학습하고 선호되는 검색 결과를 내놓는 증분식 학습도 가능
검색 결과를 조정할 수도 있다.
데이터의 중요성 및 새로움 또는 사용자 정의 필터를 기반으로 조정 가능하다.
시험 문제에서 문서 검색 서비스를 보게 되면 Amazon Kendra를 생각하면 된다.

Personalize

실시간 맞춤화 추천으로 애플리케이션을 구축한다.
예를 들어 맞춤화된 제품 추천 그리고 재순위화(re-ranking) 또는 맞춤화된 직접 마케팅
Amazon Personalize API를 사용하여 Amazon Personalize 서비스에 실시간 데이터를 통합할 수 있다.
맞춤화를 위해 SMS나 이메일을 보낼 수도 있다.
ML 솔루션을 구축, 훈련 및 배포할 필요가 없다. 제공되는 번들 그대로 사용하면 된다.
사용 사례는 소매 상점, 미디어 그리고 엔터테인먼트 등
시험을 대비해서는 추천 및 맞춤화된 추천을 위한 머신 러닝 서비스가 나올 때마다 Amazon Personalize를 생각하면 된다.

Textract

텍스트, 손글씨, 폼, 테이블, PDF, 이미지 또는 스캔을 한 문서의 텍스트 데이터를 추출한다. AI나 머신 러닝이 사용된다.
텍스트를 추출하는 사용 사례는 여럿 있지만 금융 서비스에서는 송장이나 재무 보고서를 처리하고 건강 보험의 경우 의료 기록과 보험 청구에 사용되고 공공 기관의 경우 세금 양식, 신분증 및 여권 등에 사용된다.

머신 러닝 요약

Rekognition으로 얼굴 탐지 및 라벨링, 유명인 인식을 수행할 수 있다.
Transcribe를 사용하면 자막을 얻을 수 있다. 오디오를 텍스트로 전환하는 기능과 같다.
반대로 Polly를 사용하면 텍스트로 오디오를 얻을 수 있다.
Translate로 번역을 할 수 있고
Lex는 챗봇과 같은 대화형 봇을 구축한다.
이를 Connect 서비스와 묶으면 클라우드 고객 센터를 만들 수 있다.
Comprehend는 자연어 처리를 하는 방법이다
SagaMaker는 개발자와 데이터 과학자를 위한 완전한 기능의 머신 러닝 서비스이다.
Forecast를 통해 정확한 예측을 할 수 있다.
Kendra는 ML 기반의 문서 검색 엔진이다.
Personalize는 고객을 위한 실시간 맞춤형 추천을 제공한다.
Textract는 텍스트와 데이터를 탐지하고 다양한 문서에서 이를 추출하는데 사용된다.

이재민

문제 해결과 개선 과제를 수행하며 성장을 추구하는 것을 좋아합니다.