A-Priori Algorithm

Heejin·2023년 5월 30일
0

A-Priori 알고리즘은 데이터 마이닝 분야에서 사용되는 알고리즘 중 하나이다. 이 알고리즘은 대규모 데이터 집합에서 빈번하게 발생하는 항목 집합을 찾는 데 사용된다.

A-Priori 알고리즘은 지지도(Support)라고 불리는 임계값을 설정하고, 이 임계값보다 높은 지지도를 가진 항목 집합을 찾는다. 지지도란 특정 항목 집합이 전체 데이터 집합에서 얼마나 자주 발생하는지를 나타내는 척도이다.

A-Priori 알고리즘의 작동 방식은 다음과 같다:

  1. 데이터 집합을 스캔하여 각 항목의 지지도를 계산한다. 이를 위해 단일 항목 집합의 발생 빈도를 카운트한다.

  2. 이후, 지지도 임계값과 비교하여 임계값보다 높은 지지도를 가진 항목 집합을 찾는다. 이러한 항목 집합은 "1-템"이라고도 한다.

  3. "1-템"을 기반으로 두 개의 항목 집합을 조합하여 "2-템"을 생성한다. 다시 한 번, "2-템"의 지지도를 계산하여 임계값과 비교한다. 임계값보다 높은 지지도를 가진 "2-템"을 찾는다.

  4. 이러한 과정을 반복하여 "3-템", "4-템" 등을 생성하고 지지도를 계산한다. 지지도가 임계값을 넘지 못하는 "n-템"은 더 이상 생성되지 않는다고 가정한다.

A-Priori 알고리즘은 후보 생성과 검증 단계를 반복하여 계산 비용을 줄이는 특징이 있다. 이를 통해 대규모 데이터 집합에서도 효율적으로 빈번한 항목 집합을 찾을 수 있다. 이 알고리즘은 장바구니 분석, 웹 로그 분석, 상품 추천 등 다양한 분야에서 활용된다.

0개의 댓글