[E-commerce] 별점 폐지, Opinion Extraction의 중요성

Jonas M·2021년 7월 17일
0

Interesting Industry

목록 보기
2/4
post-thumbnail

"새우튀김 갑질 재발 막아라" 별점 테러 차단 법제화 추진

방통위, 플랫폼 입점 사업자 보호방안 마련

플랫폼에 입점한 사업자들이 별점테러나 악성 리뷰로 인해 경제적/정신적 피해를 보는 사례들이 발생하고 있어 이를 방지할 수 있도록 플랫폼 업체들에게 가이드라인을 준다고 한다. 네이버쇼핑, 배민, 쿠팡 등의 플랫폼들이 이를 준수하여 대책을 마련할 것이다.

네이버의 한발 빠른 대응

네이버의 별점 리뷰 폐지.velog
네이버는 앞서 3월, 이러한 악성 사례들을 줄이기 위해 별점 리뷰를 점차 줄여나간다고 발표했다. 별점이 아닌 리뷰 속 의견들을 구름(워드클라우드) 형태로 보여주려는 것이다.

또한 최근 기사에서는 키워드 리뷰를 도입해서 주요 측면 또는 속성(aspect)들에 대한 의견을 쉽게 평가할 수 있도록 개편한다고 한다. 리뷰를 읽는 사용자들이 원하는 키워드들이 포함되어 있는지? 가 중요한 유용성 척도가 될 것이다.

커지는 자연어 이해 AI의 역할

NLP 모델의 역할이 중요해졌다. 실제 어떤 UI로 바뀔지는 모르겠지만 우리는 리뷰를 좀 더 단순하게 접하게 될 것이다. 1)너무 많은 리뷰들이 축적되고 있어서 요약적으로 분류하여 노출할 필요가 있고 2)악성리뷰들이 필터 없이 그대로 노출되는 것을 방지하기 위해, 리뷰들을 AI 모델이 한번 이해하고 형식에 대한 가공을 거쳐 노출될 수 있다. (앞서 말한 키워드 태그 구름도 마찬가지)

결국 AI 모델의 목표(악성 코멘트 필터링 & Opinion Extraction or Aspect based Sentiment Analysis)와 성능에 따라 사업자 피해를 줄일 수 있고 사용자들의 정보 습득 효용이 크게 달라질 수 있을 것이다.

Aspect Extraction(AE)와 Opinion Extraction(OE)

ABSA(Aspect-based Sentiment Analysis)의 subtask 중 AE(또는 OTE: Opinion Target Extraction)와 OE가 중요해질 것 같다. 리뷰 덩어리 속에서 어떤 키워드(aspect)가 중요할지, 그리고 그 키워드에 관한 의견(opinion)은 어떤 것들이 있을지 AI가 판단하여 보기 쉽게 노출해줘야 하기 때문이다.

파스타 식당의 리뷰에는 '면의 상태'나 '분위기'가 중요 키워드가 될 수 있는 반면, 횟집 같은 경우에는 '위생'이나 '테이블세팅' 등이 키워드가 될 수 있다. 거대한 리뷰 corpus 속에서 이러한 키워드들을 적절하게 선정하고, 각 리뷰에서 그런 키워드에 대한 의견(opinion)들을 정확하게 뽑아줄 수 있어야 겠다.

실제로 중국 연구자들이 내는 최근의 ABSA 페이퍼들은 Alibaba의 주도 과제 하에 AE와 OE에 관한 task들을 진행하는 경우가 많은 것 같다. 나도 단순히 aspect와 관련된 sentiment를 classification 하는 데에서 더 나아가 word들을 extraction 할 수 있는 모델을 만들어보려고 노력 중이다. 잘 갖춰진 데이터셋이 적고, 직접 구축하기도 어려워서 연구가 많지 않은 분야이지만, 쓰임새가 많고 개인적으로 자연어 이해 모델(NLU)을 이해하는 데에 도움이 많이 되길 바란다.

profile
Graduate School of DataScience, NLP researcher

0개의 댓글