머신러닝

이기태·2024년 8월 5일
0

AWS

목록 보기
45/62

Amazon Rekognition

  • 기계학습을 이용해 객체 사람, 텍스트, 이미지와 비디오의 장면을 찾는 서비스
    - 얼굴을 분석하고 비교해 사용자 확인
    - 이미지 내의 인물 수 카운팅
    - 익숙한 얼굴을 저장해 자체 DB를 생성 가능
    - 이미지 속 인물을 유명인 얼굴 DB와 비교 가능.
    - 사용사례: 사진/비디오의 라벨링
    콘텐츠 조정, 텍스트 탐지
    얼굴 탐지/분석(성별, 연령, 표정등 탐지)
    얼굴 검색 및 확인
    유명인 얼굴 인식
    스포츠 경기 분석 등에 사용
  • 컨텐츠 조정 기능(알아둬야함)
    - 이미지나 비디오에서 부적절하거나 원치 않거나 불쾌감을 주는 콘텐츠를 탐지하는 기능
    - SNS, 방송 매체, 광고 또는 전자 상거래 서비스 운용에 안전한 사용자 경험을 마련(인종차별 콘텐츠, 선정적인 콘텐츠 등)
    • 작동 방식
      - Rekognition가 이미지를 분석 후 플래그를 띄우도록 항목의 최소 신뢰도 임계값을 설정하면 된다.
      - '%'로 설정하고 퍼센티지가 낮을수록 매칭되는 콘텐츠가 많아진다.
      - 이 신뢰도(%)sms Rekognition의 신뢰도를 나타낸다.
      - 플래그가 지정된 이미지는 실제로 부적절하거나 불쾌한 요소를 담고 있다.
      - 이미지에 플래그를 지정하는 설정을 마친 다음 인적 검토가 필요할 경우 Amazon Augmented AI(A2I)를 사용하면 된다.

Amazon Transcribe

  • Amazon Transcribe: 자동으로 음성을 텍스트로 변환 (음성 -> 텍스트)
    - 오디오를 넣으면 텍스트로 변환
    - ASR(자동 음성 인식)이라는 딥러닝 프로세스를 사용해 음성을 텍스트로 변환
  • 기능
    • Redaction을 사용해 개인 식별 정보(PII)를 자동으로 제거할 수 있다.
      - 누군가의 나이, 이름, 사회보장번호가 있다면 자동으로 제거한다.
    • 다국어 오디오를 자동으로 언어 식별 가능
      프랑스어, 영어, 스페인어가 섞여있어도 모두 인식
  • 사용 사례: AS 전화의 대본을 자동으로 폐쇄 자막(?)이나 자막으로 만들기
    검색 가능한 아카이브를 만들기 위해 미디어 자산에 대한 메타 데이터 만들기

Amazon Polly

  • Polly: 딥러닝을 이용한 텍스트를 음성으로 변환
    - 음성 작동 애플리케이션을 만들 수 있다.
  • Polly는 어휘 목록 & SSML을 활용한다
    • 발음 어휘 목록
      - 사용자 지정 발음을 생성할 수 있음
      ex1) stephane의 e를 3으로 a를 4로 입력하면 polly가 문자를 하나하나 읽어 stephane이라 발음해야해 새로운 어휘 목록을 생성.
      ex2) AWS -> Amazon Web Services 로 풀어서 읽게 할 수 있음
      - 어휘 목록을 업로드해 SynthesizeSpeech 작업에 사용하면 된다.
    • SSML 기능
      - SSML: 음성 합성 마크업 언어
      - 다양한 사용자 지정 음성을 만들 수 있는 기능
      ex) 특정 단어나 구절을 강조하거나 음성학적 발음을 구현하거나, 숨소리를 넣거나 속삭이듯 말하게 하기.
      또는 뉴스 진행자 스타일로 말하게 하기 등등..
      - 평문으로 된 텍스트를 음성으로 생성할 때 속삭이듯 말하게 할 수 있다는것.

Amazon Translate

  • Translate: 언어 번역 기능
    - Translate로 콘텐츠를 현지화 가능
    즉, 해외 사용자를 위한 웹사이트, 애플리케이션에 적용
    - 대량의 텍스트를 효율적으로 번역

Amazon Lex & Connect

  • Amazon Lex: Amazon Alexa 장치를 구현하는 기술
    - Alexa: 집에 있는 작은 장치(지니 같은거)
    Alexa 내일 날씨 어때?
    - 즉, 자동 음성 인식 가능.
    - ASR로 음성 인식으로 말을 텍스트로 바꿔준다.
    - Lex는 자연어를 이해해 말의 의도를 파악하고 문장을 이해 가능
    - 사용 사례: 챗봇 구축, 콜 센터 봇 구축에 도움을 준다.

  • Amazon Connect: (콜 센터 구축) 가상 고객 센터
    - 전화를 받고 고객 응대 흐름을 생성하는 클라우드 기반 서비스
    - 다른 고객 관계 시스템 혹은 관리 시스템인 CRM 및 AWS 서비스와 통합 가능.

  • Connect의 장점
    - 기존 고객 센터 방식에 비해 초기 비용이 없다.
    비용이 약80% 저렴하다.

  • 스마트 고객 센터를 구축하는 전체 흐름
    - 일정을 예약하기 위해 전화를 건다.
    - Amazon Connect에서 지정한 번호로 통화
    - 전화 연결이 되면 Lex는 통화의 모든 정보를 스트리밍해 통화 목적을 이해한다.
    - Lex가 올바른 Lambda 함수를 호출한다.
    - Lambda가 전화를 건 사람이 내일 오후 3시에 Tom과 미팅을 원함을 이해하고, CRM으로 이동해 코드를 작성해 미팅 일정을 잡는다.

  • 즉, Lex는 ASR이고, Connect는 고객 센터이다.

Amazon Comprehend

  • Comprehend: 자연어 처리하는 NLP 서비스
    NLP(자연어 처리) - Amazon Comprehend
    - 완전 관리형 서버리스 서비스
    - 머신 러닝을 사용해 텍스트에서 인사이트와 관계를 도출
    ex) 텍스트 언어를 이해할 수 있고, 텍스트에서 주요 문구, 장소 및 사람, 브랜드, 이벤트를 추출
    그리고 분석 중인 텍스트가 긍정적인지 부정적인지 파악하는 감정 분석을 할 수 있다.
    토큰화 및 품사를 사용해 텍스트를 분석하고 음성을 식별한다.
    텍스트 파일 모음을 주제에 따라 정리하고 주제를 식별
    - 즉, 대량의 데이터를 Comprehend가 그 데이트의 의미를 이해하려고 시도하는 것.
    - 텍스트 또는 구조화되지 않은 데이터를 구조화
  • 사용 사례
    - 고객 상호 작용을 분석
    많은 고객이 이메일을 보내올 경우 고객의 긍정적 또는 부정ㅇ적 경험이 무엇인지에 대해 지원 서비스를 기반으로 전반적인 이해를 돕는다.
    이를 통해 비즈니스 인사이트를 얻고, 분석해 비즈니스를 향상
    - Comprehend가 식별하는 주제로 문서를 만들고 그룹화
    많은 문서를 하나씩 읽지않고도 그룹화 가능

Amazon Comprehend Medical

  • Amazon Comprehend Medical: 비정형 의료 텍스트에서 유용한 정보를 탐지해 반환해주는 서비스(비정형 의료 데이터 -> 정형 데이터로 변환)
    - 의사 소견서, 퇴원 요약서, 검사 결과서, 의료 사례 기록을 발견하면 NLP를 사용해 텍스트를 감지
  • 문서와 문서 속의 보호된 개인 건강 정보(PHI)를 DetectPHI PAI로 탐지해 낸다.
  • 아키텍처 관점
    - S3에 문서를 저장하고, Comprehend Medical API를 실행
    - Kinesis Data Firehose로 실시간으로 데이터를 분석하거나
    - Amazon Transcribe를 사용해 음성을 텍스트로 변환한 후 텍스트 형식의 콘텐츠를 Amazon Comprehend Medical서비스에 전달

Amazon SageMaker

  • SageMaker: 머신 러닝 모델을 구축하는 개발자와 데이터 과학자를 위한 서비스
    - 완전 관리형 서비스
    - 특정한 목적을 가진 관리형 머신러닝 서비스가 아닌 더 높은 수준의 머신 러닝 서비스
    - 개발자와 데이터 과학자가 머신 러닝 모델을 만들고 구축하기 위한 서비스
  • 머신러닝을 구축하기 위한 과정
    서버를 프로비저닝 -> 계산 수행 -> 모델 생성
    • 모델 구축
      - Certified Cloud Practitioner의 시험 점수를 예측할 모델 구축 예시
    1. 학생의 실제 점수 데이터 수집
    2. 데이터 라벨링
    3. ML(머신러닝) 모델 구축: 과거 데이터를 통해 점수 예측하는 모델
    4. 구축 후 반복 훈련 및 조정: 가중치 조정 등등...
  • SageMaker는 라벨링, 구축, 훈련및 조정 과정을 도움을 준다.
  • 또한 모델 생성 후 ML 모델 배포 이후의 새로운 데이터를 이 생성한 모델에 적용해 예측하는 이 모든 과정(라벨링,구축,훈련및 조정,적용)을 SageMaker에서 가능.

Amazon Forecast

  • Forecast: 예측을 도와주는 기능
    - 완전 관리형 서비스
    - ML울 사용해 매우 정확한 예측을 제공
    ex) 미래의 비옷 판매 예측
    - 데이터 자체를 확인하는 것보다 50% 더 정확
    - 예측 시간을 몇 달에서 몇 시간으로 줄여준다.
    - 예측이 필요한 모든 것에 사용 사례가 된다.
  • 사용 사례: 제품 수요 계획, 재무 계획, 자원 계획 등...
  • 작동 방식
    - 과거 시계열 데이터에 제품 특징, 가격, 할인, 웹사이트 트래픽, 상점 위치, 기본적으로 모델을 향상 시킬 어떤 데이터 가능.
    - 그리고 S3에 이를 업로드 후 Amazon Forecast서비스를 시작
    - 그럼 예측 모델이 생성되고 이 모델을 사용해 미래 비옷 판매량이 내년에 $500,000라 예측

Amazon Kendra

  • Kendra: 완전 관리형 문서 검색 서비스

    - 문서 내에서 답변을 추출할 수 있게 도와준다.
    - 문서: text, pdf, HTML, PowerPoint, MS Word, FAQ등
    - 이 데이터 소스를 통해 Kendra는 이 문서를 인덱싱해 머신 러닝으로 작동되는 지식 인덱스를 내부적으로 구축한다.
  • 최종 사용자 관점에선 자연어 검색 능력을 제공한다.
    ex) 사용자가 Kendra에 IT의 지우너 데스크 위치가 어디야? -> 1층입니다.
    - 이것이 가능한 이유: Kendra가 모든 리소스를 검색해 IT 지원데스크의 위치를 찾아 제공
  • 사용자의 상호 작용 및 피드백에서 학습하고, 선호되는 검색 결과를 내놓는 증분식 학습을 한다.
  • 검색 결과를 조정할 수 있다.
    ex) 데이터의 중요성 및 새로움 또는 사용자 정의 필터를 기반으로 저장 가능
  • 문서 검색 서비스 = Kendra

Amazon Personalize

  • Personalize: 실시간 맞춤화 추천으로 애플리케이션 구축
    - 맞춤화된 제품 추천, 재순위화 또는 맞춤화된 직접 마케팅
    ex) 사용자가 원예 도구를 많이 구매했다면 Personalize서비스를 기반으로 다음번 구매 제품을 추천
    - 검색한 내용, 구매 내역 및 사용자 관심 등을 기반으로 나오는 결과이다.
  • 동작

    - S3로 부터 입력 데이터를 읽는다.(사용자 상호 작용 등의 데이터)
    - Amazon Personalize API를 사용해 Amazon Personalize 서비스에 실시간 데이터를 통합한다.
    - 그리고 웹사이트, 애플리케이션 및 모바일 앱 맞춤형 API를 활용
    - 맞춤화를 위해 SMS나 이메일을 보낼 수 있다.
    - 며칠이면 이런 모델을 구축 할 수 있다.
    - ML 솔루션을 구축, 훈련 및 배포할 필요가 없다.
    제공되는 번들 그대로 사용하면 된다.
  • 사용 사례
    - 소매 상점
    - 미디어
    - 엔터테이먼트 등..
  • 추천 및 맞춤화된 추천을 위한 ML 서비스 = Personalize

Amazon Textract

  • Textract: 텍스트 추출 서비스
    - 텍스트, 손글씨, 또는 스캔한 문서의 데이터를 추출
    - 운전 면허증같은거를 Textract에 업로드하면 자동으로 분석해 결과가 데이터 파일로 제공(생일, 문서 ID등을 추출)
    - 폼과 테이블에서도 가능
    - PDF와 이미지 등을 읽을 수도 있다.
  • 사용 사례
    - 금융 서비스: 송장, 재무 보고서 처리
    - 건강 보험: 의료 기록과 보험 청구
    - 공공 기관: 세금 양식, 신분증 및 여권등에 사용

요약

  • Rekognition: 얼굴 탐지 및 라벨링, 유명인 인식
  • Transcribe: 음성을 텍스트으로 변환
  • Polly: 텍스트를 음성으로 변환
  • Translate: 번역 기능
  • Lex: 챗봇과 같은 대화형 봇 구축
  • Connect: Lex와 같이 사용해 클라우드 고객 센터를 만들 수 있음.
  • Comprehend: 자연어 처리
  • SageMaker: 개발자와 데이터 과학자를 위한 머신러닝 모델 생성 서비스
  • Forecast: 예측 서비스
  • Kendra: ML 기반의 문서 검색 엔진
  • Personalize: 고객을 위한 실시간 맞춤형 추천
  • Textract: 텍스트와 데이터를 탐지하고, 다양한 문서에서 추출

0개의 댓글

관련 채용 정보