Aws - Bedrock Lec

모기·2025년 9월 16일

lecture

당면한 과제

할루시네이션
지식재산권
데이터 보안 및 개인 정보 보호
편향 및 공정성
해석 가능성
윤리 및 의사 결정

파운데이션 모델

파이프 라인

방대한 데이터로 사전 학습
FM(Foundation Model)
(튜닝)
다양하게 적용하여 이용
- 텍스트 생성, 요약, 정보 추출, 이미지 생성, 질문 답변, 코드 생성

모델 종류

Text-to-Text
- 자연어 프롬프트에서 답변 텍스트 생성
Text-to-embeddings
- 문서/데이터의 연관성, 컨텍스트 이해로 여러 어플리케이션에 적용될수 있도록 질문 단어/문장이 포함된 답변 문장 생성 (자연어를 벡터화함)
Multimodal
- 자연어 프롬프트를 사용하여 이미지/음악/코드를 생성, 편집

모델의 학습 방법

토큰 A|puppy|is|to|dog|as|kitten|is|to|cat

[CLS]	A	puppy	is	to	dog	as	kitten	is	to	cat
101

훈련 데이터

정의

AI 시스템 지식의 기반
대규모로 수집된 정보
텍스트, 이미지, 오디오 또는 모든 유형의 데이터로 구성

가장 효과적인 데이터

품질이 높고 다양한 데이터를 사용하면 AI가 나중에 새 콘텐츠를 생성할 때 사용할 패턴, 언어, 개념을 이해하는데 도움이 됨.

ML 알고리즘

정의

AI 시스템의 두뇌 또는 학습 방법

작동 방식

AI에 처리 및 학습 방법을 알려주는 지침 세트
패턴을 인식하고 이러한 패턴을 사용하여 새롭고 유사한 콘텐츠를 생성하는 방법을 학습

모델

정의

훈련 데이터에 ML 알고리즘을 적용한 결과
AI가 새 콘텐츠를 생성하거나 예측하는데 사용

중요

모델의 품질은 사용된 훈련 데이터와 ML 알고리즘에 따라 달라짐
기반하여 훈련한 정보의 질에 따라 품질이 결정됨

데이터 레이블링

아마존 AI 모델

콘텐츠 생성

Amazon Bedrock
Amazon Q

애플리케이션 향상

텍스트 및 문서

Amazon Textract
Amazon Comprehend

음성

Amazon Polly

비전

Amazon Rekognition

ML 모델 개발

Amazon SageMaker AI

생성형 AI 사용 사례

생성형 AI 애플리케이션 수명 주기
사용 사례 정의 -> 파운데이션 모델 선택 -> 성능 개선 -> 결과 평가 -> 애플리케이션 배포
생성형 AI가 적절한 솔루션인 경우
- 콘텐츠 제작
- 개인화
- 자동화
- 혁신
- 효율성
솔루션이 아닌 경우
- 높은 정확성과 신뢰성이 매우 중요한 경우
- 설명 가능성과 투명성이 필수인 경우
- 문제가 잘못 정의되어 있거나 지속적으로 변화하는 경우
- 구현 비용이 이점보다 큰 경우
- 고품질 데이터가 부족한 경우
- 윤리적 고려 사항으로 인해 AI 사용이 금지된 경우
생성형 AI 사용 사례의 주요 기준
- 대용량의 비정형 데이터
- 사람이 쓴 것과 유사한 텍스트 또는 이미지 생성 필요
- 반복적인 콘텐츠 제작 태스크
- 대규모 개인화
- 복잡한 정보 합성

프롬프트 엔지니어링

개요
원하는 출력을 생성하기 위해 AI 모델이 사용하는 입력을 설계하고 개선하는 작업
모델의 동작과 응답을 안내하는 명확하고 구체적인 지침을 만드는 것이 포함됨

효과적인 프롬프트의 이점

모델의 기능을 통해 최상의 결과를 얻음
안전 조치를 강화함
파인 튜닝 없이 분야별 지식을 제공함
더 높은 품질의 출력을 얻음

프롬프팅 설계 모범 사례

명확하고 간결하게 작성
관련 컨텍스트를 포함
특정 명령을 사용함
결과 요구 사항을 명시
응답 예시를 제공

프롬프트 요소

(존댓말 X, 인사 X, 감사합니다 X => 맥락에 필요한 말만 넣기)

프롬프트 구성 요소

태스크, 지침, 입력, 출력, 어조와 스타일, 제약 조건

프롬프트 요소

역할, 주제, 출력, 토큰, 구조, 제외 사항, 대상, 문서, 예, 길이, 형식, 경계

고급 프롬프팅 전략

프롬프팅 기법

제로샷 및 퓨샷 예제
- 모델에 제공되는 예의 수에 따라 달라지는 기초 기법. 제로샷은 기존 지식을 바탕으로 태스크 수행, 퓨샷은 모델의 이해와 출력을 안내하는 몇 가지 예를 제시
도구 사용 프롬프팅 및 행동 지향적 프롬프팅
- 특정 도구 또는 API를 사용하도록 AI에 지시함.(계산기를 사용하여 문제 해결하기)
- AI가 특정 행동을 수행하도록 지시함.(이 데이터를 분석하고 차트 만들기)
사고의 사슬(CoT), 사고의 트리(ToT)
- CoT: 모델이 복잡한 문제를 더 작고 관리하기 쉬운 단계로 분할하도록 유도하여 추론 기능 향상
  (명령어: 단계별로 생각해.)
- ToT: 여러 추론 경로를 동시에 탐색함으로써 이러한 개념을 확장
제약 기법 - 부정적인 프롬프팅
- 출력에서 원하지 않는 경계와 제외를 정의하여 출력에 영향을 주는 기법
  (다만 출력 결과에서 모델의 bias가 있기도 함 - ugly => 백인, 여성)
파인 튜닝 - 미세 조정
- 필터링, 순위 및 정렬, 요약, 후처리

모델 설정 및 파라미터

파라미터

Temperature: 모델 출력의 무작위성과 창의성 제어, 높을수록 다양하고 창의적
Temp가 낮을수록 확률이 높은 단어에 가중치가 생김, 높을수록 확률이 낮은 단어에 가중치가 생김
Top P: 누적 확률을 기반으로 단어 선택을 제한, 높을수록 다양한 단어 사용
전체 단어 풀에서 단어 확률의 합으로 후보군 선정
(ex. 짜장: 0.4, 탕수육: 0.2, 짬뽕:0.1 => P=0.6 => 짜장, 탕수육만 후보군)
Top K: 가능성이 가장 높은 특정 단어 수에서만 단어 선택, 높을수록 다양한 단어 옵션
상위 N개의 단어 중 K개를 선택함

추론 파라미터

Maximum Length: 토큰 제한, 과도한 출력을 방지함
Stop Sequence 생성 종료 신호, 다중 시퀀스 가능

책임감 있는 AI

책임감 있는 AI를 통한 비즈니스 이점

신뢰 및 평판 향상, 규정 준수 개선, 위험 완화 개선, 높은 경쟁 우위, 의사 결정 향상, 제품 및 비즈니스 개선

AWS의 핵심 요소

공정성, 제어 가능성, 설명 가능성, 안전성, 투명성, 거버넌스, 개인 정보 보호 및 보안, 진실성 및 견고성

부적정 프롬프트

프롬프트 인젝션, 탈옥, 프롬프트 유출, 프롬프트 중독, 소셜 엔지니어링

모기

안녕

이전 포스트

Gps와 Rendering 사이의 간극 고찰

다음 포스트

Aws - Bedrock Lec

당면한 과제

파운데이션 모델

파이프 라인

모델 종류

모델의 학습 방법

훈련 데이터

ML 알고리즘

모델

데이터 레이블링

아마존 AI 모델

콘텐츠 생성

애플리케이션 향상

텍스트 및 문서

음성

비전

ML 모델 개발

생성형 AI 사용 사례

프롬프트 엔지니어링

효과적인 프롬프트의 이점

프롬프팅 설계 모범 사례

프롬프트 요소

프롬프트 구성 요소

프롬프트 요소

고급 프롬프팅 전략

프롬프팅 기법

모델 설정 및 파라미터

파라미터

추론 파라미터

책임감 있는 AI

책임감 있는 AI를 통한 비즈니스 이점

AWS의 핵심 요소

부적정 프롬프트

Gps와 Rendering 사이의 간극 고찰

Web_Server_Template as 비빔밥

0개의 댓글