학습 데이터셋이란 인공지능이 특정 사물을 인지할 수 있도록 도와주는 여러가지 정보가 담긴 데이터셋을 의미합니다. 인공지능의 성능을 향상시키기 위해서는 양질의 데이터셋이 필요하지요. 이번 포스팅에서는 학습 데이터 관리 프로세스를 크게 7단계로 나누어보았습니다.
학습 데이터 전처리란 무엇을 말하는걸까요? 인공지능을 학습시키기 위해서는 인공지능이 이해할 수 있는 형태로 데이터를 가공해야 합니다. 조금이라도 규격에 맞지 않으면 인공지능의 정확도가 떨어질 수 있으므로 세심한 주의가 필요한 과정이지요.