1. Naver Sentiment Movie Corpus (NSMC)
- 네이버 영화 리뷰 + 긍정/부정 레이블
- label: 0=부정, 1=긍정
from datasets import load_dataset
nsmc = load_dataset("e9t/nsmc")
2. KR3: Korean Restaurant Reviews with Ratings
- 한글 식당 리뷰
- 약 460,000개
- label: 0=부정, 1=긍정, 2=중립
kr3 = load_dataset("leey4n/KR3")
3. POI Review Corpus (카카오맵 기반 리뷰)
- 카카오맵 장소 리뷰(POI)
- label: 긍정/부정 (???)
Kaggle 또는 오픈 repo로 제공됨