
데이터 중심의 인공지능 접근법과 모델 중심의 인공지능 접근법의 차이
AI 시스템은 code와 data로 이루어져 있다.
코드를 발전시키면 Moel Centric
데이터를 발전시키면 Data Centric이 될 것.
Data Centric한 접근은 실제 Model Centric한 접근보다 비용 효율적이며 실제 성능 측면에서도 Model Centric한 접근 보다 더욱 높거나 동등하다.
Data-Centric AI, 더 세부적으로는 Data-Centric NLP는 실제 자연어 처리의 문제를 다룸에 있어서 모델 그 자체의 구조를 바꾸기 보다 데이터에 집중하여 그 성능과 효율성을 끌어 올리는 활동을 의미한다.
어떤 NLP Task라고 할지라도 데이터가 없으면 할 수가 없다
즉, Data가 곧 Task를 만든다.
이후 강의에서는 Data-Centric한 접근으로 이미 있는 data를 어떻게 접근하고 증강하며 Management해나갈지를 배우도록 하겠다.