[3/28] TIL - 알고리즘 문제 연습 (Hash, Greedy, Sort), 특강 (ChatGPT 활용하기)

웹상에서 존재하는 문서들이 모델의 훈련 데이터가 된다. 품질이 중요하기 때문에 위키피디아와 같은 공인된 문서를 사용한다.
이를 코드에도 적용 가능하며 이 경우 Github이 훈련용 데이터가 된다. Unsupervised Learning(정답이 없는 학습) 에 사용된다.
context window의 크기에 따라 모델의 메모리를 결정, context window 가 4이면 3개의 토큰을 보고 1개의 토큰 예측을 훈련한다.
워드 임베딩(Word Embedding) : 단어를 그대로 사용할 수 없기 때문에 이를 숫자로 변환한 후 (One-Hot encoding) 다시 N차원 공간의 벡터로 변환한다. 데이터의 크기를 줄이고 단어간의 유사도를 측정 가능하게 된다.

<모델 사용 (추론/예측)>

LLM 서빙에 들어가는 비용은 상상을 초월하며 이는 LLM의 큰 문제이다 (Carbon Footprint 이슈) 따라서 많은 회사들이 자체 하드웨어 개발 중이거나 예정 중이다. (반도체가 다시 중요)

<LLM의 문제점>

훈련 비용 뿐만 아니라 큰 서빙 비용
데이터 주권 문제
일자리 등 사회 안정성에 문제를 일으킴

GPT (Generative Pre-trained Transformer)

OpenAI에서 만든 초거대 언어 모델로 Word Completion, Code Completion 모델을 제공한다.

ChatGPT

GPT를 챗봇의 형태로 Fine-Tunig한 프로그램. RLHF (Reinforcement Learning from Human Feedback)이라는 방법으로 학습.

<ChatGPT 4.0>

Code Interpreter 기능 추가됨 (코드를 작성하고 Jupyter Notebook에서 실행 가능, 샘플 데이터를 업로드하고 관련해서 다양한 질문 가능)
이미지 업로드 가능

<GPTs (커스텀 챗봇)>

특정 목적에 맞는 ChatGPT의 맞춤형 버전. 자신이 활용하고자 하는 분야의 정보를 GPT Builder를 통해 학습시켜 보다 전문적인 챗봇을 구성 가능하다.

나만의 GPT 만들기

<방법>

~~직접 구현 (사실상 불가)~~
~~기존 LLM Fine Tuning (쉽지 않음)~~
Fine Tuning : 기존 모델위에 새로운 레이어를 얹어 다른 용도의 데이터로 훈련하는 것 (EX) ChatGPT). GPT는 이를 API로 지원함.
LLM을 그대로 사용하되 컨텍스트 정보를 프롬프트의 일부로 보내기

RAG (Retrieval Augmented Generation)
EX) ChatGPT4라면 GPTs 사용

ChatGPT 활용법

모든 일/업무에 사용해보기

검색하거나 주변에 물어보던 모든 일에 ChatGPT를 사용해보기 (질문을 잘해야함, Prompt)
계속해서 물어봐서 정답 도출해보기

좋은 프롬프트 형식

Act as a Role, Task, in a Format using a Tone
The main objective is to Objective, don't use Restriction

💦 공부하며 어려웠던 내용

GPT 관련 특강을 듣고난 후 해당 강의에 포함되어 있던 내용들을 따로 찾아보는데 너무 어려운 개념들이 많아서 앞으로 열심히 해야겠다는 생각이 들었습니다.

Sangwon Jwa

이전 포스트

[3/27] TIL - 큐(Queue), 트리(Tree), 힙(Heap)

다음 포스트

[3/28] TIL - 알고리즘 문제 연습 (Hash, Greedy, Sort), 특강 (ChatGPT 활용하기)

데브코스 TIL

📖 학습 주제

✏️ 주요 메모 사항 소개

해시(Hash) 문제 풀이 : 완주하지 못한 선수

탐욕법 (Greedy) 알고리즘 문제 풀이

체육복

큰 수 만들기

정렬 문제 : 가장 큰 수

특강 : ChatGPT 활용하기

LLM (Large Language Model)

<모델 훈련>

<모델 사용 (추론/예측)>

<LLM의 문제점>

GPT (Generative Pre-trained Transformer)

ChatGPT

<ChatGPT 4.0>

<GPTs (커스텀 챗봇)>

나만의 GPT 만들기

<방법>

ChatGPT 활용법

좋은 프롬프트 형식

💦 공부하며 어려웠던 내용

[3/27] TIL - 큐(Queue), 트리(Tree), 힙(Heap)

[3/29] TIL - 알고리즘 문제 연습 (Heap, Dynamic Programming, DFS/BFS), 특강 : 코딩테스트와 면접

0개의 댓글