NLP Day 7, 9/14 Tue

이호영·2021년 9월 17일

AI Tech NLP boostcamp

Self-supervised Pre-trained Models

Recent Trends

Masked Language Model

Pre-training Tasks in BERT

Masked Language Model

Next Sentence Prediction

Boostcamp AI Tech 2기

목록 보기

24/32

Self-supervised Pre-trained Models

Recent Trends

Transformer model, self-attention block
Deeply stacked Transformer models via self-supervised learning, transfer learning, ex) GPT-1, BERT

GPT-1

special token
자연어의 다양한 task를 해결할 통합적인 모델
Text & Position Embedded
Self-Attention x 12
Large scale의 data로 학습된 모델로 성능이 좋다.

classification

Start-Text-Extract-Transformer-Linear

Linear 단을 제거하고 학습단에서는 learning rate를 작게 만들어서 transfer learning에 사용한다.

Entailment

Start- Premise - Delim -Hypothesis - Extract -Transformer - Linear

Delim : 특수 문자

Extract가 query처럼 사용되어서 입력 문장들로부터 필요한 정보들을 추출할 수 있어야함

Similarity

Multiple Choice

BERT

Elmo의 Bi-direction LSTM을 사용함

Masked Language Model

Motivation

기존의 LM은 한쪽 방향에서의 정보만을 사용했다. 그러나 사람은 언어를 이해할 때 양쪽 방향을 모두 살펴보고 이해함

Pre-training Tasks in BERT

Masked Language Model

Masked Language Model

마스크 비율에 따라 학습 효율이 달라지는데 논문에서는 15% 비율을 마스킹했다.

→ Fine tuning 시에는 [MASK] 라는 토큰이 없다.

80%는 mask token, 10%는 random word로 replace, 10%는 원래 단어와 동일하게 둔다.

Next Sentence Prediction

두 문장을 이으면서 SEP 토큰을 문장 사이와 문장 마지막에 넣고 CLS 토큰을 문장의 시작 부분에 놓는다.

이호영

Speech Synthesis & Voice Cloning

이전 포스트

NLP Day 6, 9/13 Mon

다음 포스트

NLP Day 8, 9/15 Wed

0개의 댓글

관련 채용 정보

코웨이

데이터 사이언티스트 머신러닝 연구원(3년이상)

스펙트럼 데이터를 머신러닝으로 분석하며 혁신적인 자동화 솔루션을 개발할 데이터 사이언티스트를 찾습니다. 2년 이상의 ML 모델 경험과 함께 신호 처리 및 화학 분야 지식을 활용해 성장할 기회를 잡으세요!

피노키오랩

[신입] VISION AI 연구/개발 분야 (팀원)

피노키오랩은 AI 모델을 활용해 지식재산권 보호 및 위조품 판별 문제를 해결하는 혁신적인 기업입니다. VISION AI 연구 및 개발 분야에서 이미지 분류를 위한 딥러닝 모델을 다룰 수 있는 기회를 제공합니다.

알세미

[인턴] Software Engineer (채용 연계형 - 6개월)

AI 기반 반도체 모델링 솔루션을 혁신하는 알세미에서 소프트웨어 엔지니어 인턴을 모집합니다. 최상위 연구원들과 함께 AI 솔루션 설계 및 개발에 참여하며, 자율적인 업무 환경에서 성장할 기회를 제공합니다.