당면한 과제
- 할루시네이션
- 지식재산권
- 데이터 보안 및 개인 정보 보호
- 편향 및 공정성
- 해석 가능성
- 윤리 및 의사 결정
파운데이션 모델
파이프 라인
- 방대한 데이터로 사전 학습
- FM(Foundation Model)
- (튜닝)
- 다양하게 적용하여 이용
- 텍스트 생성, 요약, 정보 추출, 이미지 생성, 질문 답변, 코드 생성
모델 종류
- Text-to-Text
- Text-to-embeddings
- 문서/데이터의 연관성, 컨텍스트 이해로 여러 어플리케이션에 적용될수 있도록 질문 단어/문장이 포함된 답변 문장 생성 (자연어를 벡터화함)
- Multimodal
- 자연어 프롬프트를 사용하여 이미지/음악/코드를 생성, 편집
모델의 학습 방법
토큰 A|puppy|is|to|dog|as|kitten|is|to|cat
| [CLS] | A | puppy | is | to | dog | as | kitten | is | to | cat |
|---|
| 101 | | | | | | | | | | |
훈련 데이터
정의
- AI 시스템 지식의 기반
- 대규모로 수집된 정보
- 텍스트, 이미지, 오디오 또는 모든 유형의 데이터로 구성
가장 효과적인 데이터
- 품질이 높고 다양한 데이터를 사용하면 AI가 나중에 새 콘텐츠를 생성할 때 사용할 패턴, 언어, 개념을 이해하는데 도움이 됨.
ML 알고리즘
정의
작동 방식
- AI에 처리 및 학습 방법을 알려주는 지침 세트
- 패턴을 인식하고 이러한 패턴을 사용하여 새롭고 유사한 콘텐츠를 생성하는 방법을 학습
모델
정의
- 훈련 데이터에 ML 알고리즘을 적용한 결과
- AI가 새 콘텐츠를 생성하거나 예측하는데 사용
중요
- 모델의 품질은 사용된 훈련 데이터와 ML 알고리즘에 따라 달라짐
- 기반하여 훈련한 정보의 질에 따라 품질이 결정됨
데이터 레이블링
아마존 AI 모델
콘텐츠 생성
애플리케이션 향상
텍스트 및 문서
- Amazon Textract
- Amazon Comprehend
음성
비전
ML 모델 개발
생성형 AI 사용 사례
프롬프트 엔지니어링
- 개요
원하는 출력을 생성하기 위해 AI 모델이 사용하는 입력을 설계하고 개선하는 작업
모델의 동작과 응답을 안내하는 명확하고 구체적인 지침을 만드는 것이 포함됨
효과적인 프롬프트의 이점
- 모델의 기능을 통해 최상의 결과를 얻음
- 안전 조치를 강화함
- 파인 튜닝 없이 분야별 지식을 제공함
- 더 높은 품질의 출력을 얻음
프롬프팅 설계 모범 사례
- 명확하고 간결하게 작성
- 관련 컨텍스트를 포함
- 특정 명령을 사용함
- 결과 요구 사항을 명시
- 응답 예시를 제공
프롬프트 요소
(존댓말 X, 인사 X, 감사합니다 X => 맥락에 필요한 말만 넣기)
프롬프트 구성 요소
- 태스크, 지침, 입력, 출력, 어조와 스타일, 제약 조건
프롬프트 요소
- 역할, 주제, 출력, 토큰, 구조, 제외 사항, 대상, 문서, 예, 길이, 형식, 경계
고급 프롬프팅 전략
프롬프팅 기법
- 제로샷 및 퓨샷 예제
- 모델에 제공되는 예의 수에 따라 달라지는 기초 기법. 제로샷은 기존 지식을 바탕으로 태스크 수행, 퓨샷은 모델의 이해와 출력을 안내하는 몇 가지 예를 제시
- 도구 사용 프롬프팅 및 행동 지향적 프롬프팅
- 특정 도구 또는 API를 사용하도록 AI에 지시함.(계산기를 사용하여 문제 해결하기)
- AI가 특정 행동을 수행하도록 지시함.(이 데이터를 분석하고 차트 만들기)
- 사고의 사슬(CoT), 사고의 트리(ToT)
- CoT: 모델이 복잡한 문제를 더 작고 관리하기 쉬운 단계로 분할하도록 유도하여 추론 기능 향상
(명령어: 단계별로 생각해.)
- ToT: 여러 추론 경로를 동시에 탐색함으로써 이러한 개념을 확장
- 제약 기법 - 부정적인 프롬프팅
- 출력에서 원하지 않는 경계와 제외를 정의하여 출력에 영향을 주는 기법
(다만 출력 결과에서 모델의 bias가 있기도 함 - ugly => 백인, 여성)
- 파인 튜닝 - 미세 조정
모델 설정 및 파라미터
파라미터
- Temperature: 모델 출력의 무작위성과 창의성 제어, 높을수록 다양하고 창의적
Temp가 낮을수록 확률이 높은 단어에 가중치가 생김, 높을수록 확률이 낮은 단어에 가중치가 생김
- Top P: 누적 확률을 기반으로 단어 선택을 제한, 높을수록 다양한 단어 사용
전체 단어 풀에서 단어 확률의 합으로 후보군 선정
(ex. 짜장: 0.4, 탕수육: 0.2, 짬뽕:0.1 => P=0.6 => 짜장, 탕수육만 후보군)
- Top K: 가능성이 가장 높은 특정 단어 수에서만 단어 선택, 높을수록 다양한 단어 옵션
상위 N개의 단어 중 K개를 선택함
추론 파라미터
- Maximum Length: 토큰 제한, 과도한 출력을 방지함
- Stop Sequence 생성 종료 신호, 다중 시퀀스 가능
책임감 있는 AI
책임감 있는 AI를 통한 비즈니스 이점
- 신뢰 및 평판 향상, 규정 준수 개선, 위험 완화 개선, 높은 경쟁 우위, 의사 결정 향상, 제품 및 비즈니스 개선
AWS의 핵심 요소
- 공정성, 제어 가능성, 설명 가능성, 안전성, 투명성, 거버넌스, 개인 정보 보호 및 보안, 진실성 및 견고성
부적정 프롬프트
- 프롬프트 인젝션, 탈옥, 프롬프트 유출, 프롬프트 중독, 소셜 엔지니어링