πŸ” Graph based IR

κΉ€μ§€μœ€Β·2023λ…„ 12μ›” 18일
0

정보검색

λͺ©λ‘ 보기
11/11

πŸ” λ¬Έμ„œλ₯Ό κ·Έλž˜ν”„λ₯Ό μ‚¬μš©ν•˜μ—¬ ν‘œν˜„

  • μ€‘μš”λ„(weight)(authority)λ₯Ό 이용

  • (μ˜ˆμ‹œ)

    • Web
      • 각 λ…Έλ“œλŠ” μ›Ή νŽ˜μ΄μ§€, edgeλŠ” 링크, λ°©ν–₯이 μžˆλŠ” κ·Έλž˜ν”„κ°€ λœλ‹€. (ꡬ글 κ²€μƒ‰μ—”μ§„μ—μ„œ μ‚¬μš©)
  • μ€‘μš”λ„λ₯Ό μ‚¬μš©ν•˜μ—¬ 더 μ€‘μš”ν•œ 정보λ₯Ό 보여쀄 수 있게됨

  • Text based IRκ³Ό 차이점 : text basedλŠ” 단어가 μ™„μ „ λ˜‘κ°™μ§€ μ•ŠμœΌλ©΄ 검색 결과둜 μ•ˆλ‚˜μ˜¬ 수 μžˆλ‹€. text에 μ˜μ‘΄ν•˜λ―€λ‘œ ν•œκ³„κ°€ μžˆλ‹€.


βœ” μš©μ–΄

  • Directed / Undirected

  • Weighted / Unweighted

  • Graph - Adjacency Matrix : κ·Έλž˜ν”„μ—μ„œ κ°€μ€‘μΉ˜κ°€ μžˆλŠ” 뢀뢄을 μΈμ ‘ν–‰λ ¬λ‘œ ν‘œν˜„

  • In_degree : ν˜„μž¬ λ…Έλ“œλ‘œ λ“€μ–΄μ˜€λŠ” edge 갯수

  • Out_degree : ν˜„λŒ€ λ…Έλ“œμ—μ„œ λ‚˜κ°€λŠ” edge 갯수

    • 쒋은 λ…Έλ“œλŠ” λ‚˜μœ λ…Έλ“œλ₯Ό λ§ν¬ν•˜μ§€ μ•Šμ„ 것이닀.
    • λ‚˜μœ λ…Έλ“œλŠ” 쒋은 λ…Έλ“œλ₯Ό 링크할 κ°€λŠ₯성이 μžˆλ‹€.
    • 이 정보λ₯Ό μ‚¬μš©ν•˜μ—¬ 쀑간 λ…Έλ“œμ˜ 정체λ₯Ό μ•Œ 수 μžˆλ‹€.




  • Linkλ₯Ό 많이 λ°›κ³  μžˆλŠ” μ›ΉνŽ˜μ΄μ§€ 일수둝 μ€‘μš”λ„(authority)κ°€ 높아진닀.
  • μ€‘μš”λ„κ°€ 높은 νŽ˜μ΄μ§€λ„ μ€‘μš”ν•˜μ§€λ§Œ, μƒˆλ‘œ λ“€μ–΄μ˜€λŠ” query와 ν•΄λ‹Ή λ¬Έμ„œκ°€ μ–Όλ§ˆλ‚˜ κ΄€λ ¨μžˆλŠ”μ§€λ„ μ€‘μš”ν•˜λ‹€.
  • 이것을 λ°˜μ˜ν•œ 것이 PageRank μ•Œκ³ λ¦¬μ¦˜μ΄λ‹€.

βœ” PageRank μ•Œκ³ λ¦¬μ¦˜ (Googleμ—μ„œ λ§Œλ“¬)

  • offline based : μ‚¬μš©μžμ˜ μ§ˆμ˜μ™€ 상관없이 미리 Link 뢄석을 함

  • online : μ‚¬μš©μžμ˜ 질의λ₯Ό μ μš©ν•œ 것. μ‚¬μš©μžκ°€ queryλ₯Ό 던질 μ‹œ, query relevanceλ₯Ό μ‚¬μš©ν•΄μ„œ κ΄€λ ¨μžˆλŠ” pageλ₯Ό 찾아냄

  • offlineκ³Ό online을 λͺ¨λ‘ ν˜Όν•©ν•˜μ—¬ μ‚¬μš©ν•œ 것이 PageRank μ•Œκ³ λ¦¬μ¦˜

  • page의 μ€‘μš”λ„ : page에 λ°©λ¬Έν•  ν™•λ₯ 

    • E(u) : 링크λ₯Ό 타고 κ°€λŠ” 것이 μ•„λ‹Œ, 쀑간에 λ‹€λ₯Έ νŽ˜μ΄μ§€λ‘œ μ ν•‘ν•˜λŠ” 경우 (random으둜 λ“€μ–΄μ˜¬ ν™•λ₯ )

    • j : νŽ˜μ΄μ§€λ‘œ λ“€μ–΄μ˜€κ³ μžˆλŠ” νŽ˜μ΄μ§€

    • PR(Vj) : Vj둜 λ“€μ–΄μ˜¬ ν™•λ₯  κ°’

    • Out(Vj) : Vjμ—μ„œ λ‚˜κ°€κ³  μžˆλŠ” link 갯수

    • μ²˜μŒμ—λŠ” λͺ¨λ“  νŽ˜μ΄μ§€λ₯Ό κ³΅ν‰ν•˜κ²Œ ν™•λ₯ μ„ λΆ€μ—¬

    • λ°˜λ³΅μ„ 톡해 각 νŽ˜μ΄μ§€μ˜ PageRank 값을 μ—…λ°μ΄νŠΈ

profile
κΎΈμ€€ν•˜κ²Œ κ³΅λΆ€ν•˜κ³  κΈ°λ‘ν•˜λŠ” 개발자

0개의 λŒ“κΈ€