0819

장서연·2021년 8월 19일
0

머신러닝

자연어 처리는 딥러닝 많이 사용!
lightbgm, 별도의 패키지

빅데이터

추천시스템의 유형
(a) 고객에 개별화되지 않은 추천
(b) 고객에 개별화된 추천
- 협업필터링
- 행렬분해

연관성분석?

  • 개별화되지 않은 추천시스템 유형에 해당한다
  • 장바구니 분석이라고도 불린다
  • 여러번 발생한 이벤트나 거래에서 일정한 규칙을 찾아내는 분석
  • 마케팅, 바이오 인포매틱스, 질병진단 등의 목적으로 활용

맥주를 산 사람은 기저귀를 산다? 라는 패턴이 발견!

맥주를 산 사람이 기저귀를 산다는 연관 규칙?
연관규칙을 마음대로 만들 수 있음. 초콜릿을 사면 우유를 산다?

그러나, 상상할 수 있는 모든 규칙이 다 유효하지는 않음.

연관규칙 : 지지도 (Support)

  • A와 B가 동시에 발생하는 비중이다.
  • 해당 규칙이 얼마나 의미있는 규칙인지 나타낸다

연관규칙 : 신뢰도 (Confidence)

  • A를 전제한 후 B가 발생할 확률이 얼마나 높은지를 나타냄.
  • 여기에는 선후관계가 있음
  • 먼저 맥주를 샀다는 것을 전제하고, 기저귀를 살 확률.

연관규칙 : 향상도(Lift)

향상도가 1보다 작은 규칙은 폐기 대상
향상도가 클수록 강한 연관규칙을 의미한다(최소 1이상)

0개의 댓글