최근 국가지원을 통해 인공지능 과정을 밟을 수 있게 되었다.
인공지능을 다루기 위해 거쳐야할 과정중
코드입력을 제외하고 가장 처음 배워야하는 것이 데이터를 다루는 것이다.
인공지능관련 프로젝트를 하게 될때 데이터를 다루는 것이 가장 초반과정에 존제하는 만큼 이 과정에 있어 문제가 생기면 프로젝트의 전체가 어긋날 수도 있다.
이러한 데이터를 다루는데 있어 즁요 단어인 EDA와 pre-processing에 대해서 적어보겠다.
데이터분석 과정에 대한 개념으로, 데이터를 분석하고 결과를 내는 과정에 있어서 지속적으로 해당 데이터에 대한 ‘탐색과 이해’를 기본으로 가져야 한다는 것을 의미한다.
맛있는 요리를 만드는데 '질좋은 재료'가 영향을 미치듯, 유의미한 결과를 얻기위해서는
질높은 정보가 필요하다.
이와같이 질높은 정보를 얻기위해 데이터의 목적을 이해하여 이렇게 필터링해보고 저렇게 필터링하는 과정을 거치며, 데이터를 탐색하고 이해하는 과정을 EDA라고 할 수 있다.