profile
Deep Dive into Development (GitHub Blog: https://nkw011.github.io/)

[NLP] 자연어처리에 사용되는 Dataset(데이터셋), Dataloader 만들기

spaCy의 Tokenizer와 torchtext을 활용하여 말뭉치를 단어 사전으로 바꾼다. 단어 사전을 활용해 데이터셋을 구성하고 학습을 위한 데이터로더를 구성하는 방법에 대해 배운다.

2022년 7월 30일
·
0개의 댓글
·