[논문 리뷰] 연관규칙 분석에 기초한 POS 데이터 분석 시스템

김규리·2023년 1월 23일
0

논문 리뷰

목록 보기
1/1

요즘 회사에서 마트(유통) 데이터를 보고 있는데,
처음 접해보는 데이터기도 하고.. 양도 워낙 방대한지라
어떤 분석들이 있나 살펴보려고 논문을 찾아봤다.

연관규칙 분석에 기초한 POS 데이터 분석 시스템
이라는 논문인데, 2012년 논문이라 최신성은 좀 떨어지지만
평소 관심 있었던 추천시스템 관련 논문이라 함 읽어보기로 결정!

연관규칙 알고리즘으로 유명한 Apriori 알고리즘을 활용한 분석으로,
POS 판매데이터에서 규칙을 찾아내어 이를 의사결정에 활용할 수 있도록 가공하였다.

(p.2) 기존 판매데이터는 손익분석, 재고관리, 고객관리 등 제한적인 목적으로만 사용이 되었다. 이런 데이터는 단순 고객관리용으로만 사용되고, 고객의 구매습관을 파악하는데 거의 사용되지 않았다. 이러한 이유로 고객에게 제공되는 서비스는 판매자의 노하우에 의존할 수밖에 없었다.
만약 고객이 A라는 상품을 구입하고 A와 가장 어울리는 상품을 구입하고자 할 때 기존 상품 추천 방식은 판매자의 경험적 지식으로 상품을 추천하는 방식이다. 경험적 지식을 이용하여 상품을 추천하는 방법은 판매자의 경력에 영향을 받는다. 즉, 판매자들은 상이한 결과를 고객에게 제공할 수 있고 신입직원의 경우 고객에게 지식서비스를 제공하지 못하는 문제가 발생할 수 있다. 고객에게 양질의 서비스를 제공하기 위해 경험적 지식보다는 정형화된 서비스 제공 방법이 필요하다.

시간이 흘러 빅데이터가 당연해진 요즘,
물론 유통 데이터도 고객의 행동패턴과 니즈를 파악하기 위해 다방면에서 분석되고 있을 것이다.
하지만 데이터가 많아졌다고 해서 고객을 잘 파악하고 최적의 솔루션을 제시한다고 할 수 있을까?
논문이 게재될 당시와 지금의 유통 데이터 분석은 각각 다른 측면에서의 한계점을 지니고 있는 것 같다. 내가 요즘 가장 많이 하는 고민은 '아 데이터가 너무 많은데..' '이 중에서 도대체 어떤 테이블과 컬럼을 봐야 하는거지?' 이다.

유통 데이터로 인사이트를 얻기 위해서는 어떤 정보와 분석 기법이 필요한지, 데이터와 인프라가 부족했던 시기에는 어떤 측면에 방점을 두었을 지 집중해서 논문을 읽었다.

*전체 프로세스
POS 거래 DB에서 패턴 분석, 규칙 분석을 한 후 결과 DB에 저장하여 의사결정에 필요한 정보를 제공한다. (예나 지금이나 분석의 목적과 서비스 제공 대상의 니즈를 파악하는 것이 진짜 중요한 듯, 판매자와 경영자를 구분해서 분석 인사이트를 제공하는 점이 인상깊었음)

(p.2) 본 논문에서는 상품추천서비스에 더하여 기존에 없는 새로운 서비스 2가지를 제안한다. 첫 번째는 소멸규칙 및 새로운 규칙이며 두 번째는 상승규칙 및 하향규칙이다. 생성규칙이란 이전에 없던 규칙이 새롭게 발생되는 것을 말하고, 소멸규칙이란 이전에 존재하던 규칙이 소멸하는 것을 말한다. 이러한 정보들을 자동으로 분석해서 경영자에게 제공해 준다면 해당문제에 대한 신속한 대처가 가능할 것이다. 또한 경영자는 해당상품들에 대한 교차판매전략 구성, 기획 상품의 결정 등에 도움을 줄 수 있다.

쉽게 말하자면,

  • 생성규칙: 새로운 규칙이 생성
  • 소멸규칙: 기존 규칙이 소멸
  • 하향규칙: 규칙에 대한 신뢰도가 꾸준히 하락
  • 상승규칙: 규칙에 대한 신뢰도가 꾸준히 상승

이렇게 정리해볼 수 있을 것 같다. (맞겠지..?)
여기서 신뢰도란, X라는 상품을 사면 Y라는 상품을 사는 경우의 확률이다.
X와 Y가 함께 판매되는 비율인 지지도와 달리, 신뢰도는 오직 X와 Y의 판매만으로 구해지기 때문에 전체 거래수에 영향을 받지 않는다.

요런 식으로 치킨1을 사면 치킨2를 산다는 규칙의 신뢰도는 점점 상승하고 있으므로 상승규칙, 찜닭을 사면 치킨1을 산다는 규칙의 신뢰도는 점점 하락하고 있으므로 하향규칙으로 정의할 수 있겠다.

소멸규칙, 생성규칙도 마찬가지의 원리!
이렇게 구매패턴의 갑작스러운? 꾸준한? 변화를 지표화한다는 것에 의미가 있는 것 같다.

이를 통해 판매자는 교차판매 전략을 수립할 수 있고, 경영자는 신상품 기획 등에 활용할 수 있을 것이다. 뭔가 익숙한 분석이다.. 싶더니, 작년 취준할 때 라인 과제로 냈던 '유저 리텐션 지표'가 생각나는 것..ㅋㅋㅋ

유통이나, 모바일 서비스나 '빈도'에 대한 정보의 활용성이 꽤나 높다는 생각을 하게 된다.. 아무튼! 초반에 논문을 통해 알고자 했던 것들을 정리해보면,

Q. 유통 데이터로 인사이트를 얻기 위해서는 어떤 정보와 분석 기법이 필요한지
A. '판매 건수', '품목 간 연관성' 정보에 주목할 필요가 있다. 지금까지는 가격을 기반으로 한 판매량, 매출 등에만 너무 주목했고 개별 품목이 가지는 특징들만 분석했다. 앞으로는 판매 건수, 다른 품목과의 연관규칙 등을 위주로 분석해봐야겠다.

Q. 데이터와 인프라가 부족했던 시기에는 어떤 측면에 방점을 두었을 지
A. 역시나 고객에 대한 이해다. 지금은 더 고도화된 방법으로 상품을 추천하고, 구매 패턴을 분석하고 있지만, 이전부터 데이터를 활용하여 고객의 구매패턴을 이해하고 이를 선제적으로 대응해 니즈를 충족하려는 시도가 많았다는 생각이 든다. 앞으로는 그저 상품 구매내역, 품목 판매량에만 집착할 것이 아니라 고객의 관점에서, 구매 맥락을 파악하여 비즈니스적으로 유의미한 인사이트를 도출할 방법을 고민해야 할 것 같다.

profile
connecting the dots

0개의 댓글