1.Gen AI (생성형 AI)
인공지능, 머신러닝, 딥러닝
- 인공지능 : 인간이 하는 일을 대신 해주는 시스템을 만드는 컴퓨터 과학
- 머신러닝 : 인공지능의 일부
- 딥러닝 : 머신러닝의 일부
- 이미지/비디오/오디오 등의 복잡한 데이터 처리에 강점
Gen AI
- 학습된 컨텐츠 바탕으로 새로운 컨텐츠를 만드는 딥러닝 기술
- 입력 컨텐츠의 내용을 학습한 모델이 만들어짐 (ex: GPT)
- 프롬포트를 바탕으로 대답을 예측하던지 새로운 컨텐츠를 생성
딥러닝과 Gen AI와 LLM의 관계
- Generative AI는 딥러닝의 일부
- LLM(Large Language Model)은 GenAI의 일부
딥러닝 모델 타입
- Discriminative
- 분류/예측을 하는 것으로 레이블이 존재하는 데이터에 적용
- 피처들과 레이블간의 관계 학습
- ex)개 or 고앙ㅇ이 분류
- Generative
- 훈련된 데이터와 비슷하지만 새로운 데이터를 생성
- 훈련된 데이터의 통계적 특성을 이해
- 비지도학습에 해당
- ex)개 이미지 생성
Gen AI모델과 일반 ML모델의 동작방식
- 일반 ML모델에서 y(라벨, 타깃)는 보통 숫자, 카테고리, 확률 등이 됨
- Gen AI모델에서는 y(라벨, 타깃)는 보통 자연어 문장, 이미지, 오디오 등이 됨
Gen AI의 파운데이션 모델_1
- 광범위한 데이터 세트에 대해 학습된 대규모 머신 러닝 모델의 한 유형
- 이미 일반적인 지식이 학습되어 있음 (Pre-trained)
- Unsupervised Learning (혹은 Self Supervised Learning)
- 대용량 데이터로 학습하기에 엄청난 시간과 돈, 인력이 필요
- 트랜스포머 모델 아키텍처를 사용 (Attention is All You Need)
Gen AI의 파운데이션 모델_2
- 특별한 학습 없이 다양한 작업에 적용 가능 ➡️ 그래서 "파운데이션"이라고 부름
- 파운데이션 모델들의 특징
- GPT-3, GPT-4
- BERT
- T5
- DALL-E
- 등등
Gen AI의 파운데이션 모델과 파인튜닝
- 파운데이션 모델을 파인튜닝(Fine-Tuning)의 형태로 특정 지식 학습 시킴
Gen AI모델
- Generative Language Models
- 훈련 데이터로 제공된 문장들로부터 언어 패턴을 학습한 모델
- 문장의 일부를 입력으로 받으면 다음 단어를 예측
- Generative Image Models
- Diffusion과 같은 기술을 사용해서 새로운 이미지를 만드는 모델
➡️ 프롬포트를 입력으로 받아서 이미지 생성
➡️ 이미지를 입력으로 받아서 여기에 특정 노이즈를 추가하여 이미지를 변환
Gen AI 모델의 헛소리/환각 (Hallucinations)
- 모델이 부정확하거나, 무의미하거나, 완전히 조작된 정보를 생성하는 경우
- 사실 확인(Fact-Checking)이 항상 필요함
- 발생이유
- 훈련 데이터의 불충분
- 훈련 데이터의 최신성 부족
- 훈련 데이터의 품질 이슈
- 모델에게 충분한 컨텍스트가 주어지지 않음 ➡️ 프롬포트 디자인이 중요해짐
Gen AI 사용시 해야할 일과 하지 말아야 할 일
- 잘 사용하는 방법
- 블로그 또는 웹사이트를 위한 독창적인 콘텐츠 생성
- 예술 작품을 위한 영감 창출
- 빠른 프로토타입 및 목업 만들기
- 파일 변환 및 이미지 업스케일링과 같은 단순 작업 수행
- 업무 어시스턴트로 사용 (코딩, 마테딩 등등)
- 잘못 사용하는 방법
- 시험이나 숙제 부정행위를 위해 AI 사용
- AI가 말하는 모든 것을 그대로 받아들이기 (항상 사실 확인)
- AI를 사용하여 다른 아티스트의 작품 표절 (저작권 침해 문제)
Gen AI 기타 문제점_1
- Miscrosoft, GitHub, OpenAI
- 라이선스 코드를 무단으로 재사용한 혐의로 코드 생성 AI인 Copilot에 대한 집단 소송 직면
- 너무 빠른 변화로 인해 법제가 따라가지 못하고 있음
- AI아트 툴 소송
- Midjourney는 웹 스크랩한 이미지로 모델을 학습시켜 아티스트의 권리 침해 혐의로 소송중
- Getty Image vs Stability AI
- Getty Image는 Stability AI가 자사 이미지를 무단 사용하여 모델을 훈련했다는 이유로 소송 제기
Gen AI 기타 문제점_2
- 국가마다 다른 입장
- 영국은 미국의 입장과 달리 텍스트 및 데이터 마이닝을 위한 콘텐츠 사용을 허용하는데 보다 적극적
- 사칭을 통한 사기와 가짜뉴스 생성
- 노동 시장에 주는 잠재적인 악영향
- 많은 수의 스타트업 도산
- Stackoverflow같은 경우 트래픽 감소로 28%인력해고
2.ChatGPT 발전 살펴보기
- Open AI에서 만든 초거대 언어 모델
- 훈련과 예측에 전용 하드웨어 사용
- LLM : Large Language Model
- 처음에는 두가지 모델 제공
- Word Completion : 한국어를 포함한 다양한 언어 지원
- Code Completion
- 참고로 네이버의 초거대 언어 모델은 Word completion만 지원
ChatGPT 소개
- GPT를 챗봇의 형태로 Fine-Tuning
- RLHF : Reinforcement Learning from Human Feedback
- GPT의 지식을 챗봇의 형태로 활용 가능 - Prompts 엔지니어링 탄생
- 용도
- 질문에 대한 답변
- 정보 추출
- 번역
- 대화생성
- 글쓰기 지원
- 코드 생성 및 리뷰
- 등등
파인튜닝 (Fine Tuning)
- 이미 만들어진 모델 (Pre-trained Model)위에 새로운 레이어를 얹히고 다른 용도의 데이터로 훈련하는 것
- GPT는 이를 API로 지원함
- 기본 언어 모델 위에 나만의 모델 생성 (버티컬 전용 모델)
ChatGPT 훈련
- RLHF : Reinforcement Learning from Human Feedback
- 사람 피드백 기반으로 대화하는 인공지능 모델 학습 (GPT 모델을 Fine-tuning)
- 강화학습 기법을 활용해 ChatGPT 학습
좋은 프롬포트란?
- Act as a Role, Task, in a Format using a Tone. The main objective is to Objective, don't use Restriction
- 사용하면 좋은 다른 표현들
- Let's think step by step (단계별로 생각하고 알려달라고 하기)
- Thank you for your hard work (칭찬 많이 하기)
ChatGPT4.0
- 유료 (월 20$)
- Code Interpreter 추가
- 코드를 작성하고 Jupyter Notebook에서 실행 가능
- 샘플 데이터를 업로드하고 관련해서 다양한 질문 가능
- 인터넷을 통해 연결하고 일부 정보를 검색
- 이미지 업로드 지원
ChatGPT4의 주요 특징
- 새로운 AI모델 사용
- 8배 더 큰 단어 컨텍스트 지원
- 최신 정보를 얻기 위한 인터넷 서핑 지원
- 플러그인 지원
- 언어지원이 더 개선되었고 답변도 더 좋아짐
- 코딩과 관계된 부분 기능 개선
- Code Interpreter 지원(데이터 분석 가능)
- 멀티모달 지원 (이미지와 텍스트)
ChatGPT4.0 플러그임
- ChatGPT 플러그인 기능 추가
- ex)여행 리서치에 끝나는 것이 아니라 이를 여행 관련 예약으로 연결해주는 것
- 플러그인 사용/개발시 별도 등록 필요
GPT 4 Turbo
- 멀티모달 기능 API에 추가
- 고품질 Text-to-Speech와 Dalle-3지원
- 코카콜라가 이를 이용해서 Diwali카드 만들기 캠페인 시작
- 이미지를 API 입력으로 지원
- "Be My Eyes"는 이를 이용해 시각장애인을 위한 서비스 생성
- Speech-to-Text Whisper v3 오픈소스 릴리스
- Custom Models(실험버전)
- LLM모델 생성 서비스 제공. Open AI 인력이 모델 생성을 도와줌
- Copyright Shield(ChatGPT Enterprise & API)
- 가격 인하
GPTs : 에이전트 기능 구현(커스텀 챗봇)
- GPTs는 특정 목적에 맞는 ChatGPT의 맞춤형 버전
- GPT Builder기능이 제공됨 ➡️ No Code 솔루션(채팅으로 빌딩)
- Instructinos, Expanded Knowledge, Actions로 구성됨
GPTs Store
- 내가 만든 GPT를 외부로 퍼블리시하거나 개인용으로 사용 가능
- Enterprise GPT라면 회사 내에서만 사용 가능
- Revenue Sharing 제공
- API로도 제공
Assistant API : Assistant Agent
- Threading(긴 대화를 기록)
- Retrieval
- 어시스턴트에게 더 많은 정보 제공(파일 업로드)
- Code Interpreter
- 어시스턴트가 업무 수행 중 필요하면 코드 작성해서 해결
- Function Calling
- JSON 출력 모드 지원과 다수의 함수 호출 동시 수행
- TTS와 STT 사용 가능
- 필요한 정보를 인터넷에서 리얼타임으로 읽어옴
3.Gen AI 적용 케이스
Case Study : Quizlet
- Open AI의 ChatGPTfh rncnrehls Q-Chat이라는 AI개인튜터 제공
- 다양한 토픽에 대해 일대일 채팅을 통한 학습 가능
Case Study : Duolingo
- 듀오링고는 GPT-4로 두 가지 새 기능을 구현 (프리미엄 기능)
- RolePlay : AI대화 파트너
- Explain my Answer : 실수 할 때 문ㄴ법 규칙 세분화하여 설명
Case Study : Morgan Stanley
- 자산 관리와 관련된 방대한 내부 데이터 검색용 챗봇 개발을 위해 GPT-4 도입
- 내부 직원용 챗봇으로 PDF 등의 다양한 포맷으로 구성된 데이터 검색 수행
Case Study : Viable
- Viable은 GPT-4를 사용하여 CS 티켓과 같은 자연어 데이터 분석 수행
- OpenAI의 LLM을 파인튜닝하여 비정형 데이터 분석용 모델 생성
- Viavle은 AI모델 개발을 위해 거의 3년동안 OpenAI와 긴밀히 협력함
Case Study : Buzzfeed
- 버즈피드와 ChatGPT의 협업
- 퀴즈생성 : 즉석에서 퀴즈 컨텐츠 생성을 위해 ChatGPT 사용
- 레시피 추천 : 음식 브랜드인 Tasty의 레시피를 추천해주는 챗봇
이 글에서 소개된 내용은 프로그래머스 데이터분석1기에서 진행된 한기용 강사님의 온라인 강의를 참조하여 작성되었습니다.