# AspectExtraction

6개의 포스트
post-thumbnail

[Research] Word2Vec으로 쇼핑 리뷰 속 유사한 의미를 갖는 단어들을 찾아보자-2

W2V의 Skipgram 방식으로 상품군별 쇼핑리뷰 corpus를 학습시키고, aspect seed와 유사한 단어들을 추출해내는 과정

2021년 8월 23일
·
0개의 댓글
post-thumbnail

[Research] Word2Vec으로 corpus 속 유사한 의미를 갖는 단어들을 찾아보자-1

aspect seed에서 aspect words를 뽑아내기 위해 W2V skipgram을 사용한다. 여기서는 W2V 방식에 대한 설명

2021년 8월 23일
·
0개의 댓글
post-thumbnail

[Research] 리뷰에서 Aspect word가 될 만한 후보군을 통계적으로 추출해보기

Khaiii로 토크나이즈하고 TF-IDF와 유사한 형태의 함수를 커스터마이징 하여 리뷰 속 주요 단어(aspect seed)를 뽑아내는 작업을 해보았다.

2021년 8월 18일
·
0개의 댓글
post-thumbnail

[Research] Khaiii 토크나이저를 활용한 리뷰 데이터셋 구축 - 2. 전처리

한국어 리뷰로 Aspect Extraction을 위한 데이터셋을 구축하는 과정 - 전처리

2021년 8월 18일
·
0개의 댓글
post-thumbnail

[Research] Khaiii 토크나이저를 활용한 리뷰 데이터셋 구축 - 1. Pipeline 계획

Khaiii를 활용해 리뷰 Aspect Extraction 데이터셋을 직접 구축하기 위한 계획

2021년 8월 17일
·
0개의 댓글
post-thumbnail

[Research] Review에서 주요 단어를 추출하기 가장 좋은 tokenizer는 무엇일까

리뷰 데이터에서 aspect를 추출하는 task에 어떤 한국어 토크나이저가 적합할지 비교해보았다.

2021년 8월 16일
·
0개의 댓글