Data-Centric(1): 개요

SeongGyun Hong·2024년 10월 28일

NaverBoostCamp

목록 보기
13/64
post-thumbnail

1. 일상 속의 인공지능

  • Youtube 추천 시스템
  • Google 등의 웹 검색
  • OCR: 영수증 인식 등의 이미지 인식 처리
  • 기계번역
  • 문서 요약
  • 맞춤법 개선
  • 비디오 요약
  • Agent(가상 비서, AI스피커)
  • 얼굴 인식
  • 인공지능 게임(Alpha Go)
  • AI Fitting, AI Biology, AI Friends 등... 무궁무진...

2. Data-Centric AI

데이터 중심의 인공지능 접근법과 모델 중심의 인공지능 접근법의 차이

2.1 AI System의 구성

AI 시스템은 codedata로 이루어져 있다.
코드를 발전시키면 Moel Centric
데이터를 발전시키면 Data Centric이 될 것.

Data Centric한 접근은 실제 Model Centric한 접근보다 비용 효율적이며 실제 성능 측면에서도 Model Centric한 접근 보다 더욱 높거나 동등하다.

2.2 Data-Centric AI

Data-Centric AI, 더 세부적으로는 Data-Centric NLP는 실제 자연어 처리의 문제를 다룸에 있어서 모델 그 자체의 구조를 바꾸기 보다 데이터에 집중하여 그 성능과 효율성을 끌어 올리는 활동을 의미한다.

3. 데이터가 Task를 만든다.

어떤 NLP Task라고 할지라도 데이터가 없으면 할 수가 없다
즉, Data가 곧 Task를 만든다.
이후 강의에서는 Data-Centric한 접근으로 이미 있는 data를 어떻게 접근하고 증강하며 Management해나갈지를 배우도록 하겠다.

profile
헤매는 만큼 자기 땅이다.

0개의 댓글