한글 리뷰/감성 분석용 데이터셋 목록

김소은·2025년 12월 29일

1. Naver Sentiment Movie Corpus (NSMC)

  • 네이버 영화 리뷰 + 긍정/부정 레이블
  • label: 0=부정, 1=긍정
from datasets import load_dataset

nsmc = load_dataset("e9t/nsmc")

2. KR3: Korean Restaurant Reviews with Ratings

  • 한글 식당 리뷰
  • 약 460,000개
  • label: 0=부정, 1=긍정, 2=중립
kr3 = load_dataset("leey4n/KR3")

3. POI Review Corpus (카카오맵 기반 리뷰)

  • 카카오맵 장소 리뷰(POI)
  • label: 긍정/부정 (???)

    Kaggle 또는 오픈 repo로 제공됨

profile
개발자

0개의 댓글