AWS 머신러닝

Siyun·2025년 3월 12일

AWS

목록 보기
27/37

Amazon Rekognition

Amazon Rekognition은 기계 학습을 활용하여 이미지와 비디오에서 객체, 사람, 텍스트 및 장면을 분석하는 서비스이다. 이 서비스는 얼굴을 분석하고 비교하여 사용자를 확인하거나 이미지 내의 인물 수를 셀 수 있다. Rekognition을 사용하면 익숙한 얼굴을 저장해 자체 데이터베이스를 생성하거나 유명인 얼굴의 데이터베이스와 비교할 수 있다.

주요 기능 및 사용 사례:

  1. 라벨링 및 콘텐츠 조정
    이미지와 비디오의 요소를 분석하여 자동으로 라벨링할 수 있다. 예를 들어, '골든 리트리버' 또는 '개'처럼 이미지를 설명하는 라벨을 자동으로 추가한다. 또한, 텍스트 탐지 기능을 통해 이미지에서 주자의 번호 등을 식별할 수 있다. 콘텐츠 조정 기능은 모든 연령대에 적합한지 확인할 수 있다.

  2. 얼굴 탐지 및 분석
    얼굴 인식을 통해 성별, 연령 범위, 표정 등을 분석할 수 있다. 예를 들어, 웃고 있는지, 눈을 뜨고 있는지, 성별을 감지하는 기능이 있다. 얼굴 검색 및 확인, 유명인 얼굴 인식에 사용할 수 있다.

  3. 경로 추적
    스포츠 경기나 기타 활동에서 선수들의 움직임을 실시간으로 분석하고 경로를 추적할 수 있다. 이를 통해 스포츠 경기 분석에 유용하다.

  4. 부적절한 콘텐츠 탐지
    SNS, 방송 매체, 광고, 전자상거래 서비스에서 부적절하거나 불쾌감을 줄 수 있는 콘텐츠를 탐지하는 기능이다. 예를 들어, 인종 차별적인 콘텐츠나 선정적인 콘텐츠를 탐지하고 플래그를 설정할 수 있다.

부적절한 콘텐츠 탐지 작동 원리:

  • Rekognition은 이미지나 비디오를 분석한 후, 신뢰도 임계값을 설정하여 부적절한 콘텐츠를 식별한다. 설정된 신뢰도 값에 따라 매칭되는 콘텐츠가 많아지거나 적어지며, 신뢰도가 낮을수록 많은 콘텐츠가 매칭된다.
  • 부적절한 콘텐츠가 발견되면 Amazon Augmented AI(A2I)를 통해 인적 검토를 선택적으로 진행할 수 있다. A2I는 자동으로 플래그를 지정하고, 최종 인적 검토를 통해 해당 콘텐츠를 유지하거나 삭제할지 결정하는 데 도움을 준다.

사용 예시:

  • 보안 애플리케이션에서 얼굴 검색 및 확인 기능을 활용해 사진을 찍어 유명인을 인식할 수 있다.
  • 콘텐츠 조정 기능은 SNS나 방송에서 불쾌감을 줄 수 있는 콘텐츠를 필터링하고 규제를 준수할 수 있도록 돕는다.

Amazon Rekognition은 얼굴 인식, 라벨링, 텍스트 탐지, 콘텐츠 조정 등 다양한 이미지 및 비디오 분석 작업을 서버리스로 처리할 수 있어 매우 유용한 서비스이다.


Amazon Transcribe

Amazon Transcribe는 자동 음성 인식(ASR) 기술을 사용하여 오디오를 텍스트로 변환하는 서비스이다. 이 서비스는 음성을 매우 빠르고 정확하게 텍스트로 변환할 수 있으며, 여러 가지 유용한 기능을 제공한다.

주요 기능:

  1. 자동 음성 텍스트 변환
    음성 파일을 입력하면 그 내용을 텍스트로 자동 변환한다.

  2. 개인 식별 정보(PII) 삭제
    Redaction 기능을 통해 음성 텍스트에서 개인 식별 정보(PII)를 자동으로 제거한다. 예를 들어, 나이, 이름, 사회보장번호와 같은 정보는 자동으로 숨겨진다.

  3. 다국어 자동 언어 식별
    여러 언어가 섞인 음성도 인식할 수 있다. 예를 들어, 영어와 프랑스어가 섞여 있어도 Amazon Transcribe는 이를 자동으로 구분하고 정확하게 인식한다.

사용 사례:

  • 전화 대본 작성 및 자막 생성
    고객 서비스의 전화 대본을 자동으로 작성하거나, 비디오나 미디어 콘텐츠에 폐쇄 자막을 추가할 수 있다.
  • 검색 가능한 아카이브 생성
    음성을 텍스트로 변환하여 검색 가능한 아카이브를 만들 수 있다. 이 메타데이터는 미디어 자산 관리에 유용하다.

실시간 스트리밍 기능

Amazon Transcribe는 실시간 음성 스트리밍을 지원하여 음성이 들어오는 즉시 텍스트로 변환된다. 예를 들어, "안녕하세요, 저는 이 강의가 정말 좋아요"라고 말하면, 그것이 바로 텍스트로 기록된다.

PII 숨기기 기능

옵션에서 활성화하면 음성에서 나온 개인정보(PII)는 자동으로 숨겨진다. 예를 들어, "저는 31세이고 전화번호는 910747280입니다"라고 말하면, "저는 [나이]이고 전화번호는 [전화번호]입니다"와 같이 전화번호나 개인정보가 텍스트에서 숨겨지거나 삭제된다.

다국어 스트리밍 예시

Amazon Transcribe는 다국어 오디오도 자동으로 인식할 수 있다. 예를 들어, "안녕하세요" (영어)와 "Bonjour" (프랑스어)가 섞여 있어도, 각각의 언어를 정확하게 식별하여 텍스트로 변환한다.

결론

Amazon Transcribe는 음성을 텍스트로 변환하는 데 매우 유용한 도구로, 다양한 언어 인식, PII 삭제, 실시간 텍스트 변환 기능 등을 제공한다. 이 서비스는 고객 서비스, 콘텐츠 제작, 미디어 관리 등에서 중요한 역할을 한다.


Amazon Polly

Amazon Polly텍스트를 음성으로 변환하는 서비스로, 딥 러닝 기술을 사용하여 음성 작동 애플리케이션을 만들 수 있다. 이 서비스를 통해 텍스트를 자연스러운 음성으로 변환할 수 있으며, 사용자 맞춤형 음성을 생성할 수 있는 다양한 기능을 제공한다.

주요 기능:

  1. 텍스트에서 음성으로 변환
    텍스트를 입력하면, Amazon Polly가 이를 음성으로 변환하여 재생한다. 매우 자연스러운 음성을 생성할 수 있다.

  2. 발음 어휘 목록 (Pronunciation Lexicon)
    사용자 맞춤 발음을 만들 수 있는 기능이다. 예를 들어, "Stephane"을 "스테판"처럼 발음하고 싶으면 어휘 목록을 사용해 발음 스타일을 지정할 수 있다. 또한, 약어인 "AWS"를 "Amazon Web Services"로 풀어서 발음하도록 설정할 수도 있다.

  3. SSML (Speech Synthesis Markup Language)
    SSML을 사용하면 음성에 다양한 스타일을 입힐 수 있다. 예를 들어, 특정 단어나 구절을 강조하거나, 속삭이듯 말하게 하거나, 숨소리를 추가하는 등 다양한 음성 효과를 추가할 수 있다. 이를 통해 뉴스 진행자 스타일처럼 말할 수도 있다.

  4. 자연스러운 음성 합성
    신경망 엔진을 사용하여 가장 자연스럽고 인간 음성에 가까운 음성을 생성한다. 원하는 음성을 선택하고 텍스트를 입력한 후, 음성을 생성할 수 있다.

  5. 음성 제어 기능
    SSML을 사용하여 텍스트를 음성으로 변환할 때 템포나 구간을 제어할 수 있다. 예를 들어, 문장 사이에 일시적인 쉬는 시간을 설정하거나, 특정 단어를 강조하는 등의 효과를 줄 수 있다.

사용 사례 및 기능 예시:

  • 발음 어휘 목록 활용
    예를 들어, "AWS"라는 두문자어가 나오면 이를 "Amazon Web Services"로 자동 발음하도록 설정할 수 있다. 어휘 목록 파일을 업로드하여 이를 자동화할 수 있다.

  • SSML을 통한 텍스트 제어
    예를 들어, "안녕하세요 전 Joanna입니다"라는 문장을 입력하고, "break" 태그를 사용하여 3초간 템포를 조절할 수 있다. 이를 통해 문장 사이에 간격을 넣고, 더 자연스러운 음성을 만들 수 있다.

<speak> 안녕하세요 <break time="3s" /> 전 Joanna입니다.</speak>

결론

Amazon Polly는 텍스트를 자연스러운 음성으로 변환하는 서비스로, 다양한 음성 스타일과 발음을 제어할 수 있다. 이를 통해 음성 합성에 대한 세밀한 제어가 가능하며, 애플리케이션에서 음성 합성 기능을 구현하는 데 매우 유용하다.


Amazon Translate

이름 그대로 자연스럽고 정확한 언어 번역 기능을 제공한다.
Translate를 통해 콘텐츠를 현지화할 수 있다.
해외 사용자를 위한 웹사이트와 애플리케이션 등에 적용 가능하다.
또한 대량의 텍스트를 효율적으로 번역할 수 있다.


Amazon Lex & Connect

Amazon Lex음성 인식(ASR) 기술과 자연어 이해(NLU) 기술을 결합하여 사용자가 음성으로 명령을 내리거나 질문을 할 때 이를 이해하고 처리하는 서비스다. 이 기술은 Amazon Alexa와 동일한 기술을 기반으로 하고 있으며, 음성을 텍스트로 변환하고, 사용자의 의도를 파악하여 적절한 응답을 할 수 있게 도와준다.

Amazon Lex의 특징:

  1. 음성 인식(ASR)
    Amazon Lex는 음성을 텍스트로 변환하는 자동 음성 인식(ASR) 기술을 사용한다. 예를 들어, "Alexa, 내일 날씨가 어때?"라고 말하면, Lex는 이를 텍스트로 변환하여 "날씨가 화창합니다, 기온은 24도입니다"와 같이 응답할 수 있다.

  2. 자연어 이해(NLU)
    Lex는 자연어 이해를 통해 사용자가 말하는 문장의 의도를 파악할 수 있다. 즉, 단순히 텍스트를 변환하는 것이 아니라, 그 안에 포함된 의미와 목적을 분석하여 적절한 답변을 생성한다. 이는 챗봇이나 콜 센터 봇 구축에 유용하게 사용된다.

  3. 챗봇 및 고객 응대
    Amazon Lex는 챗봇과 같은 자동화된 시스템을 구축하는 데 유용하다. 또한, 콜 센터 봇을 구축하여 전화 응대 및 고객 서비스 자동화도 가능하다.

Amazon Connect와의 연계:

  • Amazon Connect는 클라우드 기반의 가상 고객 센터 서비스로, 전화를 받고 고객 응대 흐름을 생성하는 서비스다. 기존 고객 센터 시스템에 비해 초기 비용이 없고, 운영 비용이 약 80% 저렴하다.
  • Lex와 Connect의 통합
    예를 들어, 고객이 전화를 걸어 일정 예약을 요청하면, Amazon Connect는 전화를 받고, 연결된 Lex는 음성을 텍스트로 변환하고 고객의 요청을 이해한다. 그런 다음, Lex는 해당 요청에 맞는 Lambda 함수를 호출하여 예약을 처리하고, CRM 시스템을 통해 예약을 완료한다. 이 과정은 자동화된 고객 서비스 흐름을 구성하는데 중요한 역할을 한다.

정리:

  • Amazon Lex음성 인식과 자연어 이해를 사용하여 사용자의 음성을 텍스트로 변환하고, 그 의도를 이해하여 적절한 응답을 처리하는 서비스다.
  • Amazon Connect클라우드 기반 고객 센터 서비스로, 고객 응대 및 서비스 흐름을 자동화하며, Lex와 통합하여 음성 기반 고객 서비스를 자동으로 처리할 수 있다.

이렇게 LexConnect를 결합하면 스마트한 고객 서비스 시스템을 구축할 수 있다.


Amazon Comprehend

Amazon Comprehend자연어 처리(NLP) 서비스로, 텍스트에서 유용한 정보를 추출하고 의미를 분석하는 데 사용된다. 이 서비스는 머신 러닝을 활용하여 비구조화된 텍스트 데이터를 구조화된 형태로 변환하고, 중요한 인사이트를 도출한다.

Amazon Comprehend의 주요 기능:

  1. 언어 감지
    Comprehend는 텍스트가 어떤 언어로 작성되었는지를 자동으로 감지할 수 있다. 예를 들어, 영어, 한국어, 일본어 등의 언어를 식별할 수 있다.

  2. 감정 분석
    텍스트에서 긍정적인지 부정적인지 파악할 수 있다. 고객 리뷰나 소셜 미디어 게시물에서 고객의 감정을 추출해 비즈니스의 긍정적 또는 부정적 피드백을 분석할 수 있다.

  3. 엔터티 추출
    Comprehend는 텍스트에서 사람, 장소, 날짜, 브랜드, 이벤트 등의 주요 엔터티(개체)를 식별한다. 예를 들어, 텍스트에서 "서울에서 열린 2025년 월드컵"이라고 하면, '서울', '2025년', '월드컵' 같은 주요 요소를 추출한다.

  4. 주제 모델링
    여러 문서의 주제를 식별하여 관련된 문서들을 그룹화할 수 있다. 대량의 문서를 효율적으로 분류하고, 각 문서가 어떤 주제에 속하는지 파악할 수 있다.

  5. 토큰화 및 품사 분석
    텍스트를 단어 단위로 나누고(토큰화), 각 단어의 품사를 분석하여 더 깊이 있는 의미 분석을 할 수 있다. 또한 음성을 식별한다.

  6. 텍스트 분석
    Comprehend는 비즈니스 인사이트를 도출하기 위해, 예를 들어 고객의 이메일 또는 리뷰 데이터를 분석하여 긍정적/부정적 의견을 식별하고 지원 서비스 향상에 기여할 수 있다.

사용 사례:

  • 고객 상호작용 분석
    고객이 보낸 이메일이나 피드백에서 긍정적, 부정적 경험을 분석하여 고객 만족도를 파악하거나, 고객의 문제를 해결하는 데 유용하게 활용할 수 있다.

  • 대량 데이터 분석
    텍스트 데이터를 대량으로 다룰 때, Comprehend는 문서 내에서 주제를 추출하고, 관련 문서들을 자동으로 그룹화할 수 있어 매우 효율적이다.

정리:

Amazon Comprehend는 자연어 처리(NLP)를 기반으로 한 서버리스 서비스로, 텍스트 데이터에서 주요 정보를 추출하고 의미를 분석할 수 있다. 이를 통해 비즈니스 인사이트를 도출하고, 고객 경험 분석이나 대량 데이터 분석에 유용하게 사용될 수 있다.


Amazon Comprehend Medical

Amazon Comprehend Medical비정형 의료 텍스트에서 유용한 정보를 탐지하여 반환하는 서비스이다. 이 서비스는 의사 소견서, 퇴원 요약서, 검사 결과서, 의료 사례 기록 등에서 자연어 처리(NLP)를 사용하여 텍스트를 분석한다.

Amazon Comprehend Medical의 주요 기능:

  1. PHI(Protected Health Information) 탐지
    DetectPHI API를 사용하여 문서에서 보호된 개인 건강 정보를 자동으로 탐지한다.

  2. 의료 데이터 분석
    의료 문서에서 환자의 나이, 수술 정보, 처방 약의 성분명, 복용량, 복용 방법 등을 체계적으로 추출하여 분석할 수 있다.

  3. 아키텍처

    • Amazon S3에 문서를 저장하고 Comprehend Medical API를 실행하여 데이터를 분석한다.
    • Kinesis Data Firehose를 사용하여 실시간으로 데이터를 분석할 수 있다.
    • Amazon Transcribe를 사용하여 음성을 텍스트로 변환하고, 이를 Comprehend Medical 서비스로 전달하여 텍스트 형식으로 분석한다.

작동 원리:

Amazon Comprehend Medical 콘솔에서 텍스트를 입력하면, 엔티티 탭에서 분석된 결과를 확인할 수 있다. 예를 들어, 의사 소견서를 입력하면 환자의 나이나 수술 날짜 등의 중요한 정보가 체계적으로 추출된다. 또한, 처방 약의 성분명과 복용량, 복용 방법과 빈도도 정확하게 파악할 수 있다.

핵심:

Amazon Comprehend Medical은 비정형화된 의료 데이터를 기계 학습을 사용하여 정형화할 수 있게 도와주며, 의료 텍스트에서 유용한 정보를 추출하여 인사이트를 얻는 데 유용한 도구이다.

Amazon Comprehend Medical은 영어(미국 영어) 텍스트만 분석할 수 있다.


Amazon SageMaker

SageMaker완전 관리형 머신 러닝 서비스로, 개발자데이터 과학자머신 러닝 모델을 구축하는 데 사용된다. 다른 관리형 서비스들이 특정 목적을 가진 기능을 제공하는 반면, SageMaker는 복잡하고 고급 머신 러닝 모델을 구축하는 과정을 지원한다.

SageMaker의 주요 기능:

  1. 모델 구축 과정 지원
    SageMaker는 머신 러닝 모델을 구축하는 모든 단계를 지원한다. 이 과정은 데이터 수집부터 모델 훈련 및 조정까지 포함된다.

  2. 복잡한 작업 처리
    모델 구축은 서버 프로비저닝, 계산 수행 등 복잡한 작업이 필요하지만, SageMaker는 이를 완전 관리형 서비스로 처리해준다.

  3. 라벨링과 데이터 준비
    SageMaker는 데이터 라벨링 작업을 지원한다. 예를 들어, 학생들의 시험 점수와 관련된 데이터를 수집하고, 해당 데이터를 라벨링한 후 모델 구축에 사용한다.

  4. 모델 훈련 및 조정
    구축된 모델은 훈련과 조정 과정을 통해 점차 개선된다. SageMaker는 이 과정에서 데이터를 효율적으로 학습하고 예측 정확도를 높인다.

  5. 모델 배포
    훈련된 모델은 배포되어 실제 데이터를 기반으로 예측을 한다. 예를 들어, 새로운 학생이 입력되면, 해당 학생의 데이터를 모델에 적용해 예측 점수를 도출한다.

SageMaker 사용 예시:

시험 점수를 예측하는 모델을 구축한다고 가정하면:
1. 학생들의 IT 경력, 강의 수, 연습 시험 횟수 등의 데이터를 수집한다.
2. 이 데이터를 라벨링하여 모델 훈련에 사용한다.
3. 훈련된 모델은 새로운 학생 데이터에 대해 시험 점수 예측을 한다.

정리:

SageMaker는 머신 러닝 모델을 구축하고, 훈련하며, 실제 환경에서 사용할 수 있도록 배포하는 과정완전 관리형으로 지원하는 서비스이다. 머신 러닝 모델을 구축하려면 복잡한 과정이 필요하지만, SageMaker는 이 모든 단계를 간소화하고, 사용자가 모델을 쉽게 개발하고 적용할 수 있게 돕는다.


Amazon Forecast

Amazon Forecast완전 관리형 서비스로, 머신 러닝을 사용해 예측을 돕는 기능이다. 이를 통해 정확한 예측을 제공하며, 예를 들면 미래의 비옷 판매량을 예측하는 데 사용된다.

핵심 기능:

  1. 정확한 예측 제공
    예를 들어, 과거 데이터를 기반으로 비옷 판매량을 예측하면, 50% 더 정확한 예측을 제공한다.

  2. 예측 시간 단축
    과거에는 예측에 몇 달이 걸렸다면, Amazon Forecast를 사용하면 몇 시간 만에 예측을 완료할 수 있다.

  3. 다양한 사용 사례
    예측이 필요한 모든 분야에서 사용된다. 예를 들어, 제품 수요 계획, 재무 계획, 자원 계획 등에 활용된다.

작동 원리:

  1. 데이터 수집
    과거의 시계열 데이터제품 특징, 가격, 할인, 웹사이트 트래픽, 상점 위치 등 추가적인 데이터를 결합한다.

  2. 데이터 업로드 및 예측 시작
    이 데이터를 Amazon S3에 업로드하고, Amazon Forecast 서비스를 시작한다.

  3. 모델 생성 및 예측
    예측 모델이 생성되고, 이를 사용해 미래의 비옷 판매량 등 다양한 예측을 할 수 있다. 예를 들어, 내년의 비옷 판매량$500,000으로 예측하는 식이다.

정리:

Amazon Forecast머신 러닝 기반 예측 서비스로, 예측을 빠르고 정확하게 할 수 있게 돕는다. 과거 데이터를 기반으로 다양한 요소를 추가하여 예측 모델을 만들고, 이를 통해 미래의 판매량, 자원 계획 등을 정확히 예측할 수 있다.


Amazon Kendra

Amazon Kendra머신 러닝을 활용한 완전 관리형 문서 검색 서비스로, 다양한 형식의 문서에서 정보를 추출하여 사용자가 필요한 답변을 찾을 수 있도록 돕는 서비스이다.

핵심 기능:

  1. 문서 형식 지원
    Kendra는 텍스트, PDF, HTML, PowerPoint, MS Word, FAQ 등 다양한 문서 형식을 지원한다.

  2. 지식 인덱스 구축
    문서 내의 내용을 인덱싱하여, 머신 러닝 기반으로 지식 인덱스를 구축한다.

  3. 자연어 검색
    사용자가 자연어로 질문을 하면, 예를 들어 "IT의 지원 데스크 위치가 어디야?"라고 묻는 경우, Kendra는 '1층입니다'라고 정확하게 답할 수 있다. 이는 Kendra가 모든 리소스를 검색하고 필요한 정보를 추출하기 때문이다.

  4. 증분식 학습
    사용자의 상호작용 및 피드백을 통해 학습하며, 선호되는 검색 결과를 제공한다.

  5. 검색 결과 조정
    데이터의 중요성, 새로움, 사용자 정의 필터 등을 기준으로 검색 결과를 조정할 수 있다.

정리:

Amazon Kendra자연어 기반의 문서 검색 서비스로, 다양한 문서 형식에서 필요한 정보를 추출하고, 사용자가 질문한 내용에 대해 정확한 답을 제공할 수 있다. 또한, 사용자의 상호작용을 통해 지속적으로 개선되며, 결과의 중요도나 사용자 맞춤 설정을 통해 효율적인 검색 기능을 제공한다.


Amazon Personalize

Amazon Personalize실시간 맞춤화 추천 서비스로, 사용자에게 적합한 제품을 추천하거나 맞춤형 마케팅을 제공하는 데 도움을 준다. 이를 통해 애플리케이션에서 개인화된 경험을 제공할 수 있다.

핵심 기능:

  1. 맞춤화된 제품 추천
    사용자가 이전에 구매한 제품을 바탕으로 다음번 구매 제품을 추천한다. 예를 들어, 사용자가 원예 도구를 자주 구매했다면, 다음 구매할 가능성이 높은 제품을 추천한다.

  2. 재순위화 (Re-ranking)
    사용자의 행동에 따라 추천 상품의 순서를 재조정하는 기능이다. 예를 들어, 사용자가 관심을 보인 특정 제품에 따라 다른 상품들의 순위를 변경할 수 있다.

  3. 맞춤화된 직접 마케팅
    사용자 구매 내역, 관심사 등을 기반으로 맞춤형 이메일이나 SMS를 통해 마케팅을 할 수 있다.

  4. 실시간 데이터 통합
    Amazon Personalize API를 사용해 실시간으로 데이터를 통합하고, 이를 바탕으로 추천 모델을 개선할 수 있다. 웹사이트, 애플리케이션, 모바일 앱에서도 쉽게 맞춤형 추천을 제공할 수 있다.

  5. 빠른 구축
    몇 달이 아니라 며칠 만에 모델을 구축할 수 있으며, ML 솔루션을 별도로 구축하거나 훈련할 필요 없이 제공되는 모델을 사용할 수 있다.

사용 사례:

  • 소매 상점: 고객의 이전 구매 내역을 바탕으로 맞춤형 제품을 추천.
  • 미디어: 사용자가 선호하는 콘텐츠를 기반으로 개인화된 콘텐츠 추천.
  • 엔터테인먼트: 사용자의 취향에 맞는 영화, 음악 등 추천.

정리:

Amazon Personalize는 사용자 행동 데이터를 기반으로 맞춤형 제품 추천, 재순위화, 직접 마케팅 등을 제공하며, 몇 일 만에 실시간 맞춤화 모델을 구축할 수 있게 해준다. 이를 통해 소매, 미디어, 엔터테인먼트 분야에서 개인화된 서비스를 손쉽게 구현할 수 있다.


Amazon Textract

Amazon Textract자동 텍스트 추출 서비스로, 문서에서 텍스트, 손글씨, 스캔된 데이터를 추출하는 데 AI와 머신 러닝 기술을 활용한다. 이 서비스는 다양한 문서 유형에서 데이터를 추출하여 데이터 파일 형식으로 제공한다.

핵심 기능:

  1. 텍스트 추출
    운전 면허증과 같은 문서를 업로드하면, Amazon Textract는 이를 분석하여 생일, 문서 ID 등의 중요한 데이터를 자동으로 추출한다.

  2. 폼 및 테이블 지원
    단순한 텍스트뿐만 아니라 폼과 테이블에서 데이터도 추출할 수 있다.

  3. 다양한 파일 형식 지원
    PDF, 이미지 파일에서 텍스트를 추출할 수 있다.

사용 사례:

  1. 금융 서비스: 송장, 재무 보고서 등의 문서를 자동으로 처리하여 데이터를 추출.
  2. 건강 보험: 의료 기록, 보험 청구서에서 필요한 정보를 추출.
  3. 공공 기관: 세금 양식, 신분증, 여권 등을 처리하고 필요한 데이터를 자동으로 추출.

정리:

Amazon TextractAI와 머신 러닝을 활용해 문서에서 텍스트와 데이터를 추출하는 서비스로, 다양한 문서 형식에서 데이터를 자동으로 추출하여 이를 처리하는 데 유용하다.

profile
공부 기록

0개의 댓글