Aws - Bedrock Lec

모기·2025년 9월 16일

당면한 과제

  • 할루시네이션
  • 지식재산권
  • 데이터 보안 및 개인 정보 보호
  • 편향 및 공정성
  • 해석 가능성
  • 윤리 및 의사 결정

파운데이션 모델

파이프 라인

  1. 방대한 데이터로 사전 학습
  2. FM(Foundation Model)
  3. (튜닝)
  4. 다양하게 적용하여 이용
    • 텍스트 생성, 요약, 정보 추출, 이미지 생성, 질문 답변, 코드 생성

모델 종류

  • Text-to-Text
    • 자연어 프롬프트에서 답변 텍스트 생성
  • Text-to-embeddings
    • 문서/데이터의 연관성, 컨텍스트 이해로 여러 어플리케이션에 적용될수 있도록 질문 단어/문장이 포함된 답변 문장 생성 (자연어를 벡터화함)
  • Multimodal
    • 자연어 프롬프트를 사용하여 이미지/음악/코드를 생성, 편집

모델의 학습 방법

토큰 A|puppy|is|to|dog|as|kitten|is|to|cat

[CLS]Apuppyistodogaskittenistocat
101

훈련 데이터

정의

  • AI 시스템 지식의 기반
  • 대규모로 수집된 정보
  • 텍스트, 이미지, 오디오 또는 모든 유형의 데이터로 구성

가장 효과적인 데이터

  • 품질이 높고 다양한 데이터를 사용하면 AI가 나중에 새 콘텐츠를 생성할 때 사용할 패턴, 언어, 개념을 이해하는데 도움이 됨.

ML 알고리즘

정의

  • AI 시스템의 두뇌 또는 학습 방법

작동 방식

  • AI에 처리 및 학습 방법을 알려주는 지침 세트
  • 패턴을 인식하고 이러한 패턴을 사용하여 새롭고 유사한 콘텐츠를 생성하는 방법을 학습

모델

정의

  • 훈련 데이터에 ML 알고리즘을 적용한 결과
  • AI가 새 콘텐츠를 생성하거나 예측하는데 사용

중요

  • 모델의 품질은 사용된 훈련 데이터와 ML 알고리즘에 따라 달라짐
  • 기반하여 훈련한 정보의 질에 따라 품질이 결정됨

데이터 레이블링

아마존 AI 모델

콘텐츠 생성

  • Amazon Bedrock
  • Amazon Q

애플리케이션 향상

텍스트 및 문서

  • Amazon Textract
  • Amazon Comprehend

음성

  • Amazon Polly

비전

  • Amazon Rekognition

ML 모델 개발

  • Amazon SageMaker AI

생성형 AI 사용 사례

  • 생성형 AI 애플리케이션 수명 주기
    사용 사례 정의 -> 파운데이션 모델 선택 -> 성능 개선 -> 결과 평가 -> 애플리케이션 배포

  • 생성형 AI가 적절한 솔루션인 경우

    • 콘텐츠 제작
    • 개인화
    • 자동화
    • 혁신
    • 효율성
  • 솔루션이 아닌 경우

    • 높은 정확성과 신뢰성이 매우 중요한 경우
    • 설명 가능성과 투명성이 필수인 경우
    • 문제가 잘못 정의되어 있거나 지속적으로 변화하는 경우
    • 구현 비용이 이점보다 큰 경우
    • 고품질 데이터가 부족한 경우
    • 윤리적 고려 사항으로 인해 AI 사용이 금지된 경우
  • 생성형 AI 사용 사례의 주요 기준

    • 대용량의 비정형 데이터
    • 사람이 쓴 것과 유사한 텍스트 또는 이미지 생성 필요
    • 반복적인 콘텐츠 제작 태스크
    • 대규모 개인화
    • 복잡한 정보 합성

프롬프트 엔지니어링

  • 개요
    원하는 출력을 생성하기 위해 AI 모델이 사용하는 입력을 설계하고 개선하는 작업
    모델의 동작과 응답을 안내하는 명확하고 구체적인 지침을 만드는 것이 포함됨

효과적인 프롬프트의 이점

  • 모델의 기능을 통해 최상의 결과를 얻음
  • 안전 조치를 강화함
  • 파인 튜닝 없이 분야별 지식을 제공함
  • 더 높은 품질의 출력을 얻음

프롬프팅 설계 모범 사례

  • 명확하고 간결하게 작성
  • 관련 컨텍스트를 포함
  • 특정 명령을 사용함
  • 결과 요구 사항을 명시
  • 응답 예시를 제공

프롬프트 요소

(존댓말 X, 인사 X, 감사합니다 X => 맥락에 필요한 말만 넣기)

프롬프트 구성 요소

  • 태스크, 지침, 입력, 출력, 어조와 스타일, 제약 조건

프롬프트 요소

  • 역할, 주제, 출력, 토큰, 구조, 제외 사항, 대상, 문서, 예, 길이, 형식, 경계

고급 프롬프팅 전략

프롬프팅 기법

  • 제로샷 및 퓨샷 예제
    • 모델에 제공되는 예의 수에 따라 달라지는 기초 기법. 제로샷은 기존 지식을 바탕으로 태스크 수행, 퓨샷은 모델의 이해와 출력을 안내하는 몇 가지 예를 제시
  • 도구 사용 프롬프팅 및 행동 지향적 프롬프팅
    • 특정 도구 또는 API를 사용하도록 AI에 지시함.(계산기를 사용하여 문제 해결하기)
    • AI가 특정 행동을 수행하도록 지시함.(이 데이터를 분석하고 차트 만들기)
  • 사고의 사슬(CoT), 사고의 트리(ToT)
    • CoT: 모델이 복잡한 문제를 더 작고 관리하기 쉬운 단계로 분할하도록 유도하여 추론 기능 향상
      (명령어: 단계별로 생각해.)
    • ToT: 여러 추론 경로를 동시에 탐색함으로써 이러한 개념을 확장
  • 제약 기법 - 부정적인 프롬프팅
    • 출력에서 원하지 않는 경계와 제외를 정의하여 출력에 영향을 주는 기법
      (다만 출력 결과에서 모델의 bias가 있기도 함 - ugly => 백인, 여성)
  • 파인 튜닝 - 미세 조정
    • 필터링, 순위 및 정렬, 요약, 후처리

모델 설정 및 파라미터

파라미터

  • Temperature: 모델 출력의 무작위성과 창의성 제어, 높을수록 다양하고 창의적
    Temp가 낮을수록 확률이 높은 단어에 가중치가 생김, 높을수록 확률이 낮은 단어에 가중치가 생김
  • Top P: 누적 확률을 기반으로 단어 선택을 제한, 높을수록 다양한 단어 사용
    전체 단어 풀에서 단어 확률의 합으로 후보군 선정
    (ex. 짜장: 0.4, 탕수육: 0.2, 짬뽕:0.1 => P=0.6 => 짜장, 탕수육만 후보군)
  • Top K: 가능성이 가장 높은 특정 단어 수에서만 단어 선택, 높을수록 다양한 단어 옵션
    상위 N개의 단어 중 K개를 선택함

추론 파라미터

  • Maximum Length: 토큰 제한, 과도한 출력을 방지함
  • Stop Sequence 생성 종료 신호, 다중 시퀀스 가능

책임감 있는 AI

책임감 있는 AI를 통한 비즈니스 이점

  • 신뢰 및 평판 향상, 규정 준수 개선, 위험 완화 개선, 높은 경쟁 우위, 의사 결정 향상, 제품 및 비즈니스 개선

AWS의 핵심 요소

  • 공정성, 제어 가능성, 설명 가능성, 안전성, 투명성, 거버넌스, 개인 정보 보호 및 보안, 진실성 및 견고성

부적정 프롬프트

  • 프롬프트 인젝션, 탈옥, 프롬프트 유출, 프롬프트 중독, 소셜 엔지니어링
profile
안녕

0개의 댓글