[부스트캠프 AI Tech] 공부 정리 (D+33)

Becky's Study Lab·2023년 12월 23일
0

Boostcamp

목록 보기
33/42

Text Dataset의 EDA

label 칼럼이 있다면, Label의 개수와 종류, 분포 등을 확인

Train / Dev / Test 데이터 개수 및 비율 확인

토크나이징 결과 분석

UNK 토큰...

Data Augmentation

swap

back-translation

profile
배우고 공부하고 기록하는 것을 멈추지 않는다.

0개의 댓글