๐ก ๊ธฐ์กด 2-Stage Learning์ ํ๊ณ๋ฅผ ์ํํ ํจ๋ฌ๋ค์ ์ ์
stage ๊ฐ์ parameter ๊ณต์ & pretrain-then-finetune โ ์๋ก ๋ค๋ฅธ ๋ชจ๋ธ์ ์ํธ ๋ณด์์ ์ผ๋ก ํ์ฉํ๋ ๋ฐฉ๋ฒ
2-Stage learning์๋ ์๋ 2๊ฐ์ง ํํ๋ก ๋๋๋ค.
๐ Refactor
โ pre-train : Input document๋ก๋ถํฐ candidate summary ์์ฑ
โก fine-tune : Base model์ ๋ค์ํ output์ผ๋ก๋ถํฐ new candidate summary ์์ฑ
Refactor๋ Base model๊ณผ Meta model์ ๋ถ๋ฆฌํ์ง ์๊ณ ๊ณตํต์ผ๋ก ์ฌ์ฉํจ์ผ๋ก์จ parameter sharing์ด ๊ฐ๋ฅํจ
๊ธฐ์กด์ 2 stage learning์ ๋ถ๋ฆฌ๋ base-meta ๋ชจ๋ธ
Refactor๋ฅผ ํตํด ํตํฉ๋ base-meta model
์๋๋ Liu et al.์ ์คํ์ ์์ฝํ ๋ด์ฉ์ด๋ค.
Baseย : ๋ฒ ์ด์ค ๋ชจ๋ธ๋ง ์ฌ์ฉํ ๊ฒฝ์ฐ
Pre-trainedย : ์ฌ์ ํ์ต๋ Refactor๋ฅผ ๋ฉํ ๋ชจ๋ธ๋ก ์ฌ์ฉํ ๊ฒฝ์ฐ
Supervisedย : Refactor๋ฅผ ๋ฉํ ๋ชจ๋ธ๋ก ์ฌ์ฉํ๋ฉฐ
ย ย ย ย ย ย ย ย ย ย ย ย ย ย ย ย ย ย ย ย ย ย ย ย ๋ฒ ์ด์ค ๋ชจ๋ธ์ output์ผ๋ก๋ง ํ์ตํ ๊ฒฝ์ฐ (์ฌ์ ํ์ต์ ๊ฑฐ์น์ง ์์ Fine-tuned)
Fine-tunedย : ์ฌ์ ํ์ต๋ Refactor์ ๋ฒ ์ด์ค ๋ชจ๋ธ์ output์ผ๋ก
ย ย ย ย ย ย ย ย ย ย ย ย ย ย ย ย ย ย ย ย ย fine-tuningํ Refactor๋ฅผ ๋ฉํ ๋ชจ๋ธ๋ก ์ฌ์ฉํ ๊ฒฝ์ฐ
โ : ๋ฒ ์ด์ค ๋ชจ๋ธ๋ณด๋ค ์ฑ๋ฅ์ด ๋ฐ์ด๋ ๊ฒฝ์ฐ
๐ก ์คํ ๊ฒฐ๊ณผ 1
Baseย : ํ๋์ ๋ฒ ์ด์ค ๋ชจ๋ธ๋ง ์ฌ์ฉํ ๊ฒฝ์ฐ
Twoย : ๋ฒ ์ด์ค ๋ชจ๋ธ์ 2๊ฐ (BART, ์ฌ์ ํ์ต๋ Refactor) ์ฌ์ฉํ ๊ฒฝ์ฐ
Threeย : ๋ฒ ์ด์ค ๋ชจ๋ธ์ 3๊ฐ (BART, ์ฌ์ ํ์ต๋ Refactor, GSum) ์ฌ์ฉํ ๊ฒฝ์ฐ
๐ก ์คํ ๊ฒฐ๊ณผ 2
โ๏ธ ์์ธ
Sentence-level combination์์ Supervised Refactor๊ฐ
Fine-tuned Refactor์ ๋น์ทํ ์ฑ๋ฅ์ ๋ณด์
pre-training data์ ๋นํด fine-tuning data๊ฐ ์๋นํ ๋ง๊ธฐ ๋๋ฌธ
Summary-level combination์์ ๋ฒ ์ด์ค ๋ชจ๋ธ์ธ GSum์ด
Pre-trained Refactor (Three) ๋ณด๋ค ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์
GSum์ด ๋ค๋ฅธ ๋ ๋ฒ ์ด์ค ๋ชจ๋ธ๋ณด๋ค ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์ด๊ธฐ ๋๋ฌธ
Base ๋ชจ๋ธ : 19๊ฐ์ Top-performing system
Meta ๋ชจ๋ธ : pre-trained Refactor
์ด ์คํ์์ Meta ๋ชจ๋ธ์ธ pretrained Refactor๋ fine-tuning ์์ด Base ๋ชจ๋ธ์ output์ ํตํด summary๋ฅผ ์ถ์ถํ์๋ค.
19๊ฐ์ ๋ชจ๋ธ์ ์กฐํฉํ๋ฉฐ multi-system stacking ์คํ์ ์ํํ์๋ค.
bin : ROUGE score ๋ฒ์
#sys : ๋ฒ ์ด์ค ๋ชจ๋ธ์ ๊ฐ์
Ours : pre-trained Refactor
x์ถ์ ๋ฒ ์ด์ค ๋ชจ๋ธ๋ก ์ฌ์ฉ๋ ์์คํ ๋ค ๊ฐ์ ์ฑ๋ฅ ์ฐจ์ด์ด๋ฉฐ, ROUGE-1 score๋ฅผ ํตํด ์ธก์ ๋์๋ค.
y์ถ์ Refactor๋ฅผ ์ฌ์ฉํ์์ ๋ Single base model์ ์ฌ์ฉํ ๊ฒฝ์ฐ ๋๋น ๋ชจ๋ธ ์ฑ๋ฅ ํฅ์๋ฅ ์ ์๋ฏธํ๋ค.
๐ก ์คํ ๊ฒฐ๊ณผ 3
๋ค๋ฅธ ๋ฐ์ดํฐ์ ์์ Re-ranking ์คํ ์ํ (on XSum, PubMed, WikiHow)
โ๏ธ ์คํ
Refactor ์ฌ์ ํ์ต์ pre-trained BART๋ฅผ ํตํด ์ํ
XSum์์๋ PEGASUS ๋ชจ๋ธ์, ๋ค๋ฅธ ๋ฐ์ดํฐ์
์๋ BART๋ฅผ ๋ฒ ์ด์ค ๋ชจ๋ธ๋ก ์ฌ์ฉ
๐ก ์คํ ๊ฒฐ๊ณผ 4
BART๋ฅผ ํตํด ์ป์ pre-training data๊ฐ PEGASUS output์ re-rankingํ๊ธฐ ์ํ Refactor๋ฅผ ํ์ต์ํค๊ธฐ์ ์ถฉ๋ถํ๊ธฐ ๋๋ฌธ.
๋ชจ๋ธ ํ๋ ์์ํฌ
:์คํ 2์ Multi System Stacking: Summary-level combination (Two)
๋ฒ ์ด์ค ๋ชจ๋ธ์ธ BART์ pre-trained Refactor๊ฐ ์์ฑํ candidate summary์ ROUGE score ์ฐจ์ด Performance Gap)์ ๋ฐ๋ฅธ ๋ฉํ ๋ชจ๋ธ์ ์ ํ๋ ์ธก์
x ์ถ์ ๋ ๋ฒ ์ด์ค ๋ชจ๋ธ์ ROUGE score ์ฐจ์ด๋ฅผ,
y์ถ์ ๋ฉํ ๋ชจ๋ธ์ ์ ํ๋๋ฅผ ์๋ฏธํ๋ค.
๐ก ์คํ ๊ฒฐ๊ณผ 5
๋ ๋ฒ ์ด์ค ๋ชจ๋ธ์ด ์๋ก ์ํธ ๋ณด์์ ์ผ๋ก ๋์ํ๊ณ ์์์ ์ ์ ์์
Performance Gap์ด ํฌ๋ค๋ ๊ฒ์ ์ด๋ ํ ๋ชจ๋ธ์ ROUGE score๊ฐ ๋ฎ๊ณ ๋ค๋ฅธ ๋ชจ๋ธ์ ROUGE score๊ฐ ๋๋ค๋ ๊ฒ์ธ๋ฐ, ์ด๋ฅผ ํตํด ๋ ๋ฒ ์ด์ค ๋ชจ๋ธ์ด ์๋ก ์ํธ ๋ณด์์ ์ผ๋ก ๋์ํ๊ณ ์์์ ์ง์ํ ์ ์๋ค.
(์ด๋ ํ ๋ชจ๋ธ์ ROUGE score๊ฐ ๊ณ์ ๋ฎ๊ณ , ๋ค๋ฅธ ๋ชจ๋ธ์ด ๋์ score๋ฅผ ๊ฐ์ง์ง ์๋ ์๊ฐํด๋ณผ ์ ์๊ฒ ์ง๋ง, ๋ ผ๋ฌธ์์ ์ ์ํ ๊ฒ์ ๋น์ทํ ์ฑ๋ฅ์ ๊ฐ์ง ๋ชจ๋ธ๋ค์ ๋ฒ ์ด์ค ๋ชจ๋ธ๋ก ์ฌ์ฉํ๋ ๊ฒ์ด๊ธฐ ๋๋ฌธ์ ์ํธ ๋ณด์์ ์ผ๋ก ๋์ํ ๊ฐ๋ฅ์ฑ์ด ๋๋ค)
๋ ผ๋ฌธ์ ์ฝ๊ณ ์ดํด๊ฐ ๊ฐ์ง ์๋ ๋ถ๋ถ์ด ์๋๋ฐ,
๋ ผ๋ฌธ์์ Base-Meta ๊ฐ Gap์ด 2 stage learning ์ฑ๋ฅ์ ์ํฅ์ ์ฃผ๋ ์ฃผ์ ์์ธ์ด๋ผ๊ณ ์ธ๊ธํ์์ผ๋ฉฐ, ์ด gap์ ์ํํ REFACTOR๋ฅผ ๋์ ํ์๋ค.
ํ์ง๋ง, ์คํ ๋ด์ฉ์ ๋ณด๋ฉด Base-Meta ๊ฐ Gap์ ํด๊ฒฐ๋์ง ์์ ๊ฒ์ผ๋ก ์ถ์ ๋๋ค.
Train-Test gap์ Fine-tuning์ ํตํด ํด์๋ ์ ์์ง๋ง, Base-Meta ๊ฐ Gap์ Parameter sharing์ ํตํด ํด์๋์ด์ผ ํ๋๋ฐ (๋ ผ๋ฌธ์์ ์ฃผ์ฅํ ๋ฐ์ ์ํ๋ฉด),
์คํ ๋ด์ฉ์ ๋ณด๋ฉด Reranking task์์๋ Refactor๋ Meta ๋ชจ๋ธ๋ก๋ง ์ฌ์ฉ๋์์ผ๋ฉฐ, Multi-stacking task์ธ ์คํ 2์์ Base ๋ชจ๋ธ๋ก ์ฌ์ฉ๋์์ง๋ง, ์ด๋ Base ๋ชจ๋ธ์ Refactor ์ธ์๋ GSum, BART๋ ์ฌ์ฉ๋์๋ค. Refactor๊ฐ ์๋ ๋ค๋ฅธ Base ๋ชจ๋ธ๊ณผ Meta ๋ชจ๋ธ์ Parameter Sharing์ด ์ด๋ค์ง์ง ์๋ ๊ฒ์ผ๋ก ๋ณด์ด๋ฉฐ, BART์ GSum์ output์ Meta ๋ชจ๋ธ์ด ์จ์ ํ ์ด์ฉํ ๊ฒ์ธ์ง ์ ์ ์๋ค.
๋ฐ๋ผ์ ๋ ผ๋ฌธ์ ์ฃผ์ contribution ์ค ํ๋์ธ Parameter Sharing์ด ๋ชจ๋ธ ์ฑ๋ฅ๊ณผ ์ฐ๊ด์ด ์๋ค๋ ์คํ์ ์๋ค.
Base-Meta๊ฐ gap์ ํด์ํ๋ Parameter sharing์ด ์ฑ๋ฅ๊ณผ ์ด๋ค ์ฐ๊ด์ด ์๋์ง ๋ฐํ๋ ์คํ์ด ์์๊ธฐ ๋๋ฌธ์,
๋
ผ๋ฌธ์ ์ ์์ด์ Yixin Liu๋ถ๊ป ์ด contribution์ ๋ํ ์ง๋ฌธ์ ๋๋ ธ๋ค.
๋
ผ๋ฌธ์ ์ ์๋ก๋ถํฐ ์ด์ ๋ํ ๋ต๋ณ์ ๋ฐ์๋ค.
Re-ranking task์ candidates๋ ์ถ์ ์์ฝ ๋ชจ๋ธ๋ก๋ถํฐ ์์ฑ๋ ์ถ์ ์์ฝ๋ฌธ์ผ๋ก ๊ตฌ์ฑํ๊ธฐ ๋๋ฌธ์ ์ถ์ถ ์์ฝ ๋ชจ๋ธ์ธ Refactor๋ฅผ Base ๋ชจ๋ธ๋ก ์ฌ์ฉํ๊ธฐ ์ ์ ํ์ง ์์๊ณ ,
Parameter sharing์ ๋
ผ๋ฌธ์์ ์ ์ํ ํ๋ ์์ํฌ์ ํน์ง ์ค ํ๋๋ก, ์ฑ๋ฅ ํฅ์๊ณผ ์ง์ ์ ์ธ ์ฐ๊ด์ ์์ผ๋, ํ๋ฒ์ ํ์ต์ผ๋ก pre-trained Meta ๋ชจ๋ธ์ ์ป๋ ๋์์ Base ๋ชจ๋ธ์ ์ป์ ์ ์๋ค๋ ์ฅ์ ์ด ์๋ค.