텍스트를 입력으로 받아 적절한 출력을 산출하는 모델
LLM 발전 현황
- InstrucGPT/ChatGPT 출현 이후 활발히 연구 및 적용
- 학습 방법론 관련 연구:
Corpus정제, Instruction Tunning 등- 활용 연구:
의료/법률 도메인 적용, 서비스 적용 디자인- 최적화 연구:
추론 속도/메모리 사용량 최적화, 입력 문장 길이 확장 등
Statistical LM
Neural LM
딥러닝 기술을 자연어 처리 분야에 적용
단어의 의미를 고정된 크기의 벡터에 표현함 (Word2Vec 등)
Pretrained LM
사전 학습된 언어 모델 개발 및 활용
생성형 이미지 모델은 특정 데이터의 분포를 기반으로 새로운 이미지를 생성하는 모델
생성형 이미지 모델의 학습 목표는 특정 데이터를 생성할 확률인 likelihood를 최대화 하는 것
GAN
판별자와 생성자를 적대적으로 학습하는 모델 구조
Autoencoder, AEAE:VAE:VQ-VAE:Flow-based models
입력 이미지를 함수 f를 통해 잠재 공간으로 변환하고 역함수 f-1 를 통해 이미지를 복원하는 구조
함수f: 연속적, 미분가능, 역변환이 가능한 함수
변수 변환(change of variable)을 기반으로 구성되어 있는 구조
Diffusion models생성형 이미지 모델 분야
- Style transfer
이미지의 스타일을 다른 이미지에 적용하는 방법- Inpainting
이미지의 손상된 부분이나 누락된 ㅜ분을 복원하거나 채우는 방법- Image editing
이미지를 변경하거나 개선하는 방법- Super-resolution
저해상도 이미지를 고해상도 이미지로 변환하는 방법
Multi-modeal 생성형 이미지 모델
- Text-to-Image
텍스트를 입력으로 사용하여 이미지를 생성- Text-to-Video
텍스트를 입력으로 사용하여 비디오를 생성- Image-to-Video
이미지와 prompot를 사용하여 비디오를 생성