김수진 강사님
Azure OpenAI 시작
생성 AI와 GPT
생성 AI는 인공지능이 다양한 형태의 콘텐츠를 생성하는 기술로, 텍스트, 이미지, 코드 등 여러 유형의 데이터를 다룰 수 있다. 이 기술은 딥러닝과 자연어 처리(NLP) 모델을 기반으로 한다.
GPT(Generative Pre-trained Transformer)는 이러한 생성 AI 기술 중에서 특히 텍스트 생성에 특화된 모델이다.
- 학습 데이터: GPT는 인터넷에서 수집한 방대한 텍스트 데이터를 기반으로 학습하여 언어 패턴을 이해하고 재생산한다.
- 활용 분야: 챗봇, 문서 요약, 번역, 콘텐츠 작문, 검색 엔진 등 다양한 분야에서 적용 가능하다.
- 기술적 기반: 딥러닝(Deep Learning)과 트랜스포머 아키텍처를 활용하며, 이를 통해 문맥을 고려한 텍스트 생성을 수행한다.
생성형 AI 모델의 유형
GPT 계열 모델
텍스트와 코드 생성을 주로 다룬다.
- GPT-4 모델
- 최신 버전으로 자연어 이해와 생성, 코드 생성 및 완성 작업에 뛰어나다.
- 복잡한 작업을 처리할 수 있는 강력한 기능을 제공한다.
- GPT-3.5 모델
- 자연어와 코드 생성 작업에 적합하며 GPT-4에 비해 경량화된 옵션.
- GPT-35-turbo 모델
- 대화형 상호작용에 최적화된 모델로 챗봇 구현에 주로 사용된다.
Embeddings 모델
텍스트 데이터를 숫자 벡터로 변환하여 언어 분석 작업에 유용하다.
- 문서 검색, 유사도 계산, 분류 등의 작업에서 활용된다.
DALL.E 모델
텍스트 프롬프트를 기반으로 이미지를 생성하는 모델.
매개변수
최대 토큰(Max Tokens)
생성되는 응답의 길이 제어.
- 값이 높으면 긴 응답을 생성할 수 있다.
- 값이 낮으면 응답이 짧아진다.
온도 (Temperature)
응답의 창의성과 무작위성 제어.
- 0.0 ~ 1.1 (높은 값일수록 창의적이고 임의적인 응답)
- 낮은 값일수록 정교하고 예측 가능한 응답.
상위 P (Top P)
토큰 선택의 확률 분포를 제어한다.
- 0.0 ~ 1.0 (1.0은 모든 가능한 토큰을 고려)
- 낮을수록 더 높은 확률의 토큰만 선택.
- 온도는 무작위성을 전반으로 제어하지만, 상위 P는 특정 상위 비율 내에서 선택 과정을 제한한다.
반복 패널티 (Frequency Penalty)
동일한 단어나 문장이 반복되는 것을 억제.
- 0.0 ~ 1.0 (값이 높을수록 반복이 줄어듦).
존재 패널티 (Presence Penalty)
특정 토큰이 처음으로 사용될 가능성을 높인다.
Azure OpenAI 웹통합
REST API
- REST (Representational State Transfer) 는 웹 서비스 간 데이터를 교환하기 위한 아키텍처 스타일이다.
- 주로 HTTP 프로토콜을 사용하여 클라이언트와 서버 간의 상호작용을 정의한다.
주요 구성 요소
- HTTP 요청(Request): 클라이언트가 서버로 보내는 메시지.
- HTTP 응답(Response): 서버가 클라이언트에 보내는 메시지.
REST API 요청 구조
- 시작 줄(Start Line): 요청 메서드, URL 경로, HTTP 버전 포함.
- 헤더(Headers): 추가 정보를 제공하는 키-값 쌍.
- 본문(Body)
- 요청의 실제 데이터를 포함.
- JSON, XML 등의 형식으로 데이터를 전송.
Azure OpenAI와 REST API
- Azure OpenAI에서는 REST API를 사용하여 모델에 요청을 보내고 응답을 처리한다.
- ChatCompletion 엔드포인트를 사용하면 메시지 기록과 함께 대화 요청을 보낼 수 있다.
- 응답은 JSON 형식으로 반환되며, 생성형 텍스트, 사용된 토큰 수, 응답 이유 등이 포함된다.
Personal Insight
말도 많고 탈도 많았던 오늘의 수업,,
조금은 따라가기가 버거웠던 것 같다.. ㅠㅠ
블로그에 쓸 수 있는 내용이 없다.
복습..해야지.