๐Ÿ” Neural ์‹ ๊ฒฝ๋ง ๊ฒ€์ƒ‰ ์•Œ๊ณ ๋ฆฌ์ฆ˜

๊น€์ง€์œคยท2023๋…„ 12์›” 17์ผ
0

์ •๋ณด๊ฒ€์ƒ‰

๋ชฉ๋ก ๋ณด๊ธฐ
10/11

โœ” ๋ชฉ์ 

์งˆ์˜๊ฐ€ ๋“ค์–ด์˜ค๋ฉด ์—ฐ๊ด€์„ฑ์ด ๋†’์€ ๋ฌธ์„œ๋“ค์„ ์ถœ๋ ฅํ•œ๋‹ค

โœ” ํ•ด๊ฒฐ

์งˆ์˜์™€ ๋ฌธ์„œ๋ฅผ BERT ์‹ ๊ฒฝ๋ง์— ๋„ฃ์–ด ์ ์ˆ˜๋ฅผ ๊ตฌํ•œ๋‹ค. ์ ์ˆ˜๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ๋žญํ‚น์„ ๋งค๊ธด๋‹ค.
(BERT๋Š” ๊ธฐ๊ณ„ํ•™์Šต ๋ชจ๋ธ์ด๋‹ค)

  • Transformer ๋ชจ๋ธ : query์˜ ๋‹จ์–ด๋“ค์„ ๋ถ„์„ํ•ด ์—ฐ๊ด€์„ฑ์ด ๋†’์€ ๊ฒƒ์„ ๋‹ค์Œ ์œ— ๊ณ„์ธต์œผ๋กœ ์˜ฌ๋ฆฐ๋‹ค.
  • BERT : Transformer๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๋งŒ๋“ค์–ด์กŒ์œผ๋ฉฐ, ์‚ฌ์ „์— ๋ฐ์ดํ„ฐ๋ฅผ ํ’๋ถ€ํ•˜๊ฒŒ ํ•™์Šตํ•˜๊ณ , ๊ทธ๊ฒƒ์„ ๋ฐ”ํƒ•์œผ๋กœ ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šต์‹œํ‚จ๋‹ค.



๐Ÿ” ๋ฐฉ๋ฒ•

  • ๋”ฅ๋Ÿฌ๋‹์€ ์†๋„๊ฐ€ ๋Š๋ฆฐ ๋‹จ์ ์ด ์žˆ๋‹ค. ๊ทธ๋ž˜์„œ ๋จผ์ € BM25 ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์—ฌ TOP n๊ฐœ์˜ ๋ฌธ์„œ๋ฅผ ๊ณ ๋ฅด๊ณ , TOP n๊ฐœ์— ๋”ฅ๋Ÿฌ๋‹์„ ์ ์šฉํ•œ๋‹ค.

  • ๋ฐฉ๋ฒ•1 "All-to-all Interaction"

  • Query์™€ Document๋ฅผ BERT์— ๋„ฃ์–ด ์ตœ์ ์˜ ํ•ด๋ฅผ ๊ตฌํ•œ๋‹ค.

  • ํ•˜์ง€๋งŒ Query์™€ Document๋งˆ๋‹ค ๋ชจ๋“  ๊ด€๊ณ„์„ฑ์„ ๊ตฌํ•˜๋ฉด ๊ณ„์‚ฐ์ด ๋งŽ์•„์ ธ ํšจ์œจ์ ์ด์ง€ ์•Š๋‹ค.


  • ๋ฐฉ๋ฒ•2 "Representation Similarity"

  • Query์™€ Document๋ฅผ ๋”ฐ๋กœ ํ•™์Šต์‹œํ‚จ๋‹ค.

    1. Document๋ฅผ ๋ฏธ๋ฆฌ ๊ณ„์‚ฐํ•˜์—ฌ Vector๋กœ ํ‘œํ˜„ํ•˜๊ณ 
    2. Query๊ฐ€ ์ƒˆ๋กœ ๋“ค์–ด์˜ค๋ฉด Query๋ฅผ BERT์—์„œ ๊ณ„์‚ฐํ•˜์—ฌ Vector๋ฅผ ๊ตฌํ•œ๋‹ค.
    3. ๋‘ Vector๋ฅผ ๋‚ด์  ๊ณ„์‚ฐํ•˜์—ฌ ์ ์ˆ˜๊ฐ€ ๋†’์€ ๊ฒƒ์„ ๊ณ ๋ฅผ ์ˆ˜ ์žˆ๋‹ค.
  • ๋‹จ์  : Document ์•ˆ์—๋Š” ์ˆ˜๋งŽ์€ ์†Œ์Šค๊ฐ€ ์žˆ๋Š”๋ฐ ๊ทธ๊ฒƒ์„ ํ•˜๋‚˜์˜ vector๋กœ๋งŒ ํ‘œํ˜„ํ•˜๊ธฐ์—๋Š” ๋ฌด๋ฆฌ๊ฐ€ ์žˆ๋‹ค.


  • ๋ฐฉ๋ฒ•3 "Late Interaction"

    • ColBERT ๋ชจ๋ธ

      1. Query์™€ Document๋ฅผ ๊ฐ๊ฐ BERT๋กœ ๊ฒฐ๊ณผ๋ฅผ ์‚ฐ์ถœํ•˜๊ณ , ๊ฒฐ๊ณผ๋Š” ํ–‰๋ ฌ๋กœ ๋‚˜ํƒ€๋‚ธ๋‹ค.
      2. Query, Document ํ–‰๋ ฌ์—์„œ ๊ฐ€์žฅ ์ ์ˆ˜๊ฐ€ ๋†’์€ ๊ฒƒ์„ ์„ ํƒํ•œ๋‹ค.
    • ์ง€๊ธˆ๊นŒ์ง€์˜ ๋ชจ๋ธ์ค‘์— ์ œ์ผ ์„ฑ๋Šฅ์ด ์ข‹๋‹ค.

    • ํ•˜์ง€๋งŒ ํ•™์Šต ๋„๋ฉ”์ธ์ด MS MARCO์ด๊ธฐ ๋•Œ๋ฌธ์— ๋‹ค๋ฅธ ๋„๋ฉ”์ธ์„ ์ ์šฉํ–ˆ์„ ๋•Œ๋Š” ์„ฑ๋Šฅ ๊ฐœ์„ ์ด ๊ฑฐ์˜ ์—†๋‹ค.

profile
๊พธ์ค€ํ•˜๊ฒŒ ๊ณต๋ถ€ํ•˜๊ณ  ๊ธฐ๋กํ•˜๋Š” ๊ฐœ๋ฐœ์ž

0๊ฐœ์˜ ๋Œ“๊ธ€