1.1 웹과 그래프
1.2 구글 이전의 검색 엔진
2.1 페이지랭크의 정의: 투표 관점
2.2 페이지랭크의 정의: 임의 보행 관점
3.1 페이지랭크의 계산: 반복곱
3.2 문제점과 해결책
앞선 예시에서는 반복곱이 잘 동작하는 것을 알겠습니다 그런데...
Q1. 반복곱이 항상 수렴하는 것을 보장할 수 있나요?
Q2. 반복곱이 “합리적인” 점수로 수렴하는 것을 보장할 수 있나요?
문제 해결을 위해 순간이동(Teleport)을 도입합니다
임의 보행 관점에서, 웹을 서핑하는 웹서퍼의 행동을 다음과 같이 수정합니다
(1)과 (4)의 임의의 웹페이지는 전체 웹페이지들 중에 하나를 균일확률로 선택합니다
순간이동에 의해서 스파이더 트랩이나 막다른 정점에 갇히는 일이 없어졌습니다
𝛼를 감폭 비율(Damping Factor)이라고 부르며 값으로 보통 0.8 정도를 사용합니다
순간이동 도입은 페이지랭크 점수 계산을 다음과 같이 바꿉니다
3강 정리
1.1 그래프를 통한 정보의 전파
1.2 그래프를 통한 행동의 전파
1.3 그래프를 통한 고장의 전파
1.4 그래프를 통한 질병의 전파
2.1 언제 의사결정 기반의 전파 모형을 사용할까?
2.2 선형 임계치 모형
3.1 언제 확률적 전파 모형을 사용할까?
3.2 독립적 전파 모형
4.1 바이럴 마케팅이란?
4.2 시드 집합의 중요성
4.3 전파 최대화 문제
4.4 정점 중심성 휴리스틱
4.5 탐욕 알고리즘
탐욕 알고리즘(Greedy Algorithm) 역시 많이 사용됩니다
탐욕 알고리즘은 시드 집합의 원소, 즉 최초 전파자를 한번에 한 명씩 선택합니다
즉, 정점의 집합을 {1,2,...,|𝑉|}라고 할 경우 구체적인 단계는 다음과 같습니다
집합 {1}, {2}, ... , {|𝑉|}를 비교하여, 전파를 최대화하는 시드 집합을 찾습니다
이 때, 전파의 크기를 비교하기 위해 시뮬레이션을 반복하여 평균 값을 사용합니다 뽑힌 집합을 {𝑥} 라고 합시다
집합 {𝑥, 1}, {𝑥, 2}, ... , {𝑥, |𝑉|}를 비교하여, 전파를 최대화하는 시드 집합을 찾습니다
뽑힌 집합을 {𝑥, 𝑦} 라고 합시다
집합 {𝑥, 𝑦, 1}, {𝑥, 𝑦, 2}, ... , {𝑥, 𝑦, |𝑉|}를 비교하여, 전파를 최대화하는 시드 집합을 찾습니다 뽑힌 집합을 {𝑥, 𝑦, 𝑧} 라고 합시다
위 과정을 목표하는 크기의 시드 집합에 도달할 때까지 반복합니다
즉, 탐욕 알고리즘은 최초 전파자 간의 조합의 효과를 고려하지 않고
근시안적으로 최초 전파자를 선택하는 과정을 반복합니다
탐욕 알고리즘은 얼마나 정확한가요?
독립 전파 모형에 경우, 이론적으로 정확도가 일부 보장됩니다
항상, 즉 입력 그래프와 무관하게 다음 부등식이 성립합니다
탐욕 알고리즘으로 찾은 시드 집합의 의한 전파의 (평균) 크기 ≥ 1−1/e ≈ 0.632 (최고의 시드 집합에 의한 전파의 (평균) 크기)
다시 말해, 탐욕 알고리즘의 최저 성능은 수학적으로 보장되어 있습니다
4강 정리
이제까지 병행해왔던 일들이 하나씩 정리되고 있습니다.
물론 또 다른 일들이 하나씩 쌓이고는 있지만, 앞으로는 부스트캠프에 조금 더 집중할 수 있을 것 같습니다.
그리고 U Stage도 슬슬 끝나가고 P Stage가 점점 다가오고 있습니다.
프로젝트로 진행되는 P Stage인 만큼 기대가 되고 얼른 시작했으면 좋겠습니다.
오늘보다 더 성장한 내일의 저를 기대하며, 내일 뵙도록 하겠습니다.
읽어주셔서 감사합니다!