pre-training / fine-tuning / transfer learning / prompt-tuning

FSA·2023년 4월 25일

딥러닝 기초

목록 보기

2/44

Pre-training

먼저 큰 데이터셋에서 모델을 사전 학습시키는 과정을 말합니다.
일반적으로 pre-training에는 대량의 데이터셋이 필요하며, 이를 통해 모델은 데이터의 패턴과 특징을 파악하고 일반적인 지식을 학습합니다.
이러한 사전 학습을 통해 모델은 새로운 작업에 대해 더 잘 일반화할 수 있습니다.

Fine-tuning

사전 학습된 모델을 새로운 작업에 맞게 조정하는 과정을 말합니다.
이를 통해 모델은 특정 작업에 대한 추가 학습을 수행하고 해당 작업에 대한 최적의 성능을 얻을 수 있습니다.
Fine-tuning은 일반적으로 pre-training에서 생성된 모델을 새로운 작업에 맞게 수정하는 방식으로 이루어집니다.
이를 위해 추가 데이터와 작업에 따른 적절한 손실 함수를 사용합니다.
예를 들어, 이미지 분류 작업을 위해 pre-training된 모델은 fine-tuning 단계에서 새로운 데이터셋에서 이미지와 레이블을 사용하여 적합한 가중치를 찾아내는 방식으로 학습됩니다.
미리 학습된(pre-trained) 모델을 새로운 태스크(task)에 맞게 fine-tuning하여 사용하는 방법입니다.
Fine-tuning은 기존의 학습된 모델의 일부 레이어를 새로운 데이터에 맞게 학습시키는 것으로, 일반적으로 적은 양의 데이터로도 높은 성능을 얻을 수 있습니다.
예를 들어, 이미지 분류 문제에서 ImageNet 데이터셋에서 학습된 모델의 일부 레이어를, 새로운 데이터셋에 맞게 재학습시키는 것이 대표적인 예입니다.

Transfer-learning

미리 학습된(pre-trained) 모델의 일부 또는 전체 레이어를 새로운 태스크(task)에 맞게 재사용하여 사용하는 방법입니다.
Transfer learning은 한 도메인에서 학습된 모델을 다른 도메인에서도 사용할 수 있도록 하는 기술로, 학습 데이터가 부족한 경우에도 높은 성능을 얻을 수 있습니다.
예를 들어, 이미지 분류 문제에서 ImageNet 데이터셋에서 학습된 모델을, 자율주행 자동차에서 도로의 상황을 인식하는 데에 활용하는 것이 대표적인 예입니다.

Fine-tuning VS Transfer-learning

Fine-tuning과 Transfer learning의 차이점은 학습된 모델의 사용 방법입니다.
Fine-tuning은 학습된 모델의 일부 또는 전체 레이어를 새로운 데이터셋에 맞게 학습시키는 방법으로, 새로운 데이터셋에서 사용됩니다.
반면에 Transfer learning은 학습된 모델의 일부 또는 전체 레이어를 새로운 도메인에서 활용하는 방법으로, 기존 학습된 모델을 다른 도메인에서도 활용할 수 있습니다.

prompt-tuning

Prompt tuning은 자연어 처리 모델을 빠르게 조정하고 수정하는 방법 중 하나
Prompt tuning은 사전 훈련된 모델에서 특정 작업에 대해 매우 높은 성능을 달성하기 위해 prompt를 사용하여 모델을 미세 조정하는 것
Prompt는 모델에 대한 작업 지시를 의미
- 모델에게 수행할 작업을 정확하게 지시하고 입력 데이터와 출력 결과를 결합하는 방법을 지정
Prompt tuning은 prompt를 사용하여 모델의 출력을 조정하고, 목표 작업에 맞게 미세 조정합니다. 이를 통해 모델은 해당 작업에 대해 더 높은 성능을 발휘할 수 있습니다.
Prompt tuning은 학습 데이터가 적은 상황에서 특히 유용합니다.
대규모 데이터셋이 없거나 대상 작업에 대한 데이터가 부족한 경우, prompt tuning을 사용하여 모델을 최적화할 수 있습니다.
또한, prompt tuning은 빠른 시간 내에 모델을 수정하고 특정 작업에 대한 성능을 향상시킬 수 있어서 실용적입니다.
최근에는 GPT-3와 같은 대규모 모델을 사용하여 prompt tuning의 효과를 크게 높였습니다.
이러한 모델은 다양한 작업에 대해 높은 일반화 성능을 발휘하고, prompt tuning을 사용하여 더욱 정교하게 조정될 수 있습니다.
예시 1
- BERT 모델에서 prompt tuning을 수행하는 경우, 특정 작업을 수행하기 위해 해당 작업과 관련된 prompt 또는 토큰 시퀀스를 추가로 학습시키는 것입니다.
- 예를 들어, 질문 답변 작업을 수행하는 경우, 질문과 답변의 토큰 시퀀스를 모델 입력으로 사용하여 해당 작업을 학습시키는 것입니다.
- 이렇게 하면 모델이 해당 작업을 수행하는 데 필요한 정보를 더 잘 이해하고 이를 반영하여 더 나은 결과를 생성할 수 있습니다.
예시 2
- 또 다른 예로는 GPT-3 모델에서 prompt tuning을 수행하는 경우, 원하는 작업에 대한 질문 또는 명령문과 함께 모델에 입력을 제공하는 것입니다.
- 예를 들어, "Translate the following sentence into French: 'I love you'"와 같은 질문 또는 명령문을 추가하여 번역 작업을 수행하도록 모델을 튜닝할 수 있습니다.
- 이렇게 하면 모델이 특정 작업을 수행하는 데 필요한 지시 사항을 더 잘 이해하고 이를 반영하여 더 나은 결과를 생성할 수 있습니다.

FSA

모든 의사 결정 과정을 지나칠 정도로 모두 기록하고, 나중에 스스로 피드백 하는 것

pre-training / fine-tuning / transfer learning / prompt-tuning

딥러닝 기초

Pre-training

Fine-tuning

Transfer-learning

Fine-tuning VS Transfer-learning

prompt-tuning

modality / multi-modal / VQA

BERT

0개의 댓글

관련 채용 정보