DGIM(Don't Go Into the Mist) 알고리즘은 데이터 스트림에서 최근 시간 동안 발생한 1의 개수를 추정하는 알고리즘이다. 이 알고리즘은 스트림 데이터의 크기가 매우 크거나 무한할 때 유용하게 사용된다.
DGIM 알고리즘은 슬라이딩 윈도우 기반으로 동작한다. 윈도우는 고정된 크기를 가지며, 스트림 데이터가 윈도우 밖으로 나가면서 가장 오래된 데이터는 버려진다. 알고리즘은 윈도우 내의 1의 개수를 유지하면서 시간에 따라 지속적으로 업데이트한다.
DGIM 알고리즘은 세 가지 규칙을 사용하여 윈도우 내의 1의 개수를 추정한다:
알고리즘은 다음과 같이 동작한다:
DGIM 알고리즘은 정확한 결과를 제공하는 것은 아니지만, 매우 적은 메모리와 계산 비용으로 1의 개수를 근사적으로 추정할 수 있다. 따라서 대규모 데이터 스트림 처리나 실시간 데이터 분석 등에 유용하게 활용될 수 있다.