부스트캠프 AI Tech 5기 12주차[NLP Data-Centric 1주차]

README·2023년 5월 30일
0

Data-Centric 강의 후기

이번 주에는 모델에 관련된 내용이 아닌 데이터에 대한 내용을 배웠다. 그동안 데이터를 가공할 때 단순히 인터넷에 나와 있는 자료들을 보며 따라 해 보는 정도로 수행을 했었는데 이번 강의에서 데이터의 중요성을 배웠으니, 앞으로는 좀 더 신중하게 가공해야 할 것 같다. 또 데이터를 다루는 과정에서 필요한 기술적 지식뿐만 아니라 저작권 관련 지식도 배울 수 있었다. 그동안 데이터를 수집할 때 저작권에 대해 깊게 고려하지 않고 수집한 경우가 많았는데 현업에 나가게 된다면 저작권 관련해서도 조심해야 할 것 같다는 생각이 들었다.

Data-Centric 프로젝트 진행

이번 프로젝트는 model을 수정하지 않고 데이터 가공만을 통해서 성능을 끌어올리는 것이 목적이다. 그동안 모델과 데이터 가공을 모두 수행해도 성능이 쉽게 오르지 않았는데 이번에는 데이터 가공만을 통해서 성능을 향상해야 한다는 것이 좀 어렵게 느껴졌다. 이번에는 데이터를 자세히 살펴볼 계획으로 프로젝트를 진행하던 중 프로젝트에 문제가 있었다는 것이 밝혀졌고 주말 동안 프로젝트가 중단되었었다. 결국 내 주말 계획은 데이터 탐색 대신 친구들과 축구 경기를 보러 가는 것으로 치환되었다. (아쉽게도 경기마저 비겼다….)

profile
INTP 개발자 지망생

0개의 댓글