작성자 : 정민준
A, B는 주어진 그래프의 노드 셋입니다. 서브 그래프 개념으로 본다면 B는 A를 포함하는 더 큰 서브그래프인 셈입니다.
위의 식이 성립하는 이유는 앞서 센서가 겹쳐서 탐지하는 부분이 많다면 효율이 떨어지는 경우를 보았습니다. 이처럼 A가 B의 부분집합일 때 A에 센서를 추가하는것이 B에 추가하는것 보다 더 효율적일 수 있습니다.
탐지하는 시간의 경우를 세 가지로 나누어 봅니다.
첫번째 경우는 x 센서를 두어도 탐지하는데 가장많은 시간이 걸리기 때문에 필요가 없습니다.
두번째 경우는 A에 대해선 더 좋지만 B에는 아니라는 점입니다.
세번째 경우는 x가 A,B보다 빨리 탐지합니다.
그래서 우리가 사용하는 목적함수는 Submodular라는 것입니다.
매번마다 노드의 reward를 갱신하고 이를 선택하는 알고리즘입니다. 하지만 특정 문제에서만 해결 가능하며 시간복잡도가 느린 알고리즘입니다.
Hill-climbing은 노드 자체의 cost를 무시합니다. 그리고 이 방법을 사용하면 가진 예산을 금방 낭비할 가능성이 큽니다. 고의적으로 최선을 선택하지 못하는 상황이 발생합니다.
Network 내에서 사건이 발생했을 때, 이를 효과적으로 탐지하는 방법에 대해 공부합니다.
node
를 선택하여 Network 내에서 발생한 문제를 효율적으로 탐지하고자 합니다.이 때, 좁은 범위를 탐지하는 여러 개의 node 를 선택할 것인지, 넓은 범위를 커버할 수 있는 한 개의 node 를 선택할 것인지 등의 trade-off 를 결정하는 문제에 직면하게 됩니다.
여러 가지 경우를 고려하여 가장 큰
Reward
를 얻을 수 있는subset S
를 선택하는 것을 목표로 하며, 이 때 발생하는cost(S)
는 주어진 budget 보다 작게 되도록 합니다.Reward 는 1. detection 시간이 짧아질수록, 2. propagation node 수가 많아질수록, 3. small outbreak 일 수록 높게 설정되며, neighborhood 가 많은 node 일 수록 탐지 시간이 길어지므로 cost 가 커집니다.
Objectives for Outbreak Detection
Penalty πi(t) : detecting outbreak i at time t
시간이 흐를수록 Penalty 는 무조건 증가하므로, 빠르게 탐지하는 것을 목적으로 설정합니다. 따라서 Greedy Algorithm 을 사용을 고려합니다.
Penalty Reduction
fi(S)=πi(∞)−πi(T(S,i)) 로 목적함수를 설정합니다.
여기서 fi(S) 는
submodular
입니다.subset A⊆B 에서, 포함관계에 있는 집합이 커질수록 늘어나는 증분이 감소하는 것을 말합니다.
해당 강의 예시에서, sensor 가 겹쳐서 탐지하는 부분이 있을 때 (A), 여집합 (A−B) 에 추가하는 것 보다 교집합 (A) 에 추가하는 것이 더 효율적인 것을 볼 수 있습니다.
CELF Algorithm
지난 시간에 공부했던
Hill-climbing Algorithm
은, 매번 node 의 reward 를 갱신하고 이 때마다 선택하는 알고리즘입니다. 선택을 반복해야 하기 때문에 시간복잡도가 느리며, cost 를 무시할 수 있다는 단점이 있습니다.cost 를 무시하게 되면, reward 만 보고 선택하게 되므로 비효율적인 선택을 할 가능성이 높아집니다.
이와 같은 문제를 해결할 수 있는
benefit-cost ratio
로 최적화를 진행해 보는 것을 고려해 보게 되지만, 이 또한 cost 와 benefit 의 값에 따라 최적의 선택이 불가능하게 될 수도 있다는 단점이 있습니다.따라서
CELF Algorithm
을 통해 최적 subset 을 찾습니다.CELF = Cost-Effective Lazy Forward-selection 이며,
1. Solution S′ : benefit-cost greedy
2. Solution S′′ : unit-cost greedy
위 두 가지 방법론을 모두 고려하여
Final Solution S=argmax(f(S′),f(S′′)) 를 선택합니다.
Submodularity Property 에 의해, j>i 라면 δj≤δi (늘어나는 증분이 점점 감소) 하게 됩니다.
따라서 marginal gain 으로 재정렬 한 후, δi 의 top node 만 반복적으로 계산하는
Lazy hill-climbing
알고리즘을 통해 최적 해를 찾습니다.띵강 감사감사 함니다 ~