AI란 Artificial Intelligence의 약자로 인공지능이라고 한다. 학습 능력, 추론 능력, 지각 능력, 자연어 이해 능력 등 지적능력을 컴퓨터 프로그래으로 구현하려는 과학기술 분야. 즉, 인간처럼 생각하고 학습하며 문제를 해결할 수 있는 기계를 만들기 위한 기술
학습(Learning) → 추론(Reasoning) → 개선(self-Improvement)
기계학습(Machine Learning)은 기계가 명시적인 프로그래민 없이 데이터를 통해 학습하고 그것을 바탕으로 에측이나 결정을 내릴 수 있도록 하는 알고리즘과 기술을 말한다.
기계학습은 말할 때 크게 세가지 종류로 나누어 설명한다.
레이블이 있는 데이터를 사용하여 모델을 학습시킨다. 정답이 있는 상태에서의 학습 방법이다.
레이블이 없는 데이터를 사용하여 모델이 직접 데이터의 패턴을 발견하도록한다.
보상과 벌칙과 함께 시행착오를 거쳐 학습하먀, 보상을 최대화하는 방향으로 학습하는 방법이다.
❓ 인공신경망(Artificial Neural Network)Machine Learning의 한 분야로 인공신경망을 기반으로 데이터에서 자동으로 패턴을 학습시키는 기술. 방대한 데이터와 높은 연산 능력을 활용해 인간의 뇌 구조를 모방한 네트워크로 동작한다.
인간의 뇌에서 영감을 받아 Neuron이 정보를 전달하고 처리하는 방식을 모방했다.
딥러닝의 기본적인 구조는 ANN으로 이루어져 있다.
Dataset은 인공지능의 Train, Validation, Test를 하는 데 사용되는 구조화된 데이터의 집합. Dataset은 머신러닝 개발에 핵심요소로 텍스트, 이미지, 음성, 동영상, 3D 등등 다양한 형태로 존재하며, 알고리즘이 패턴을 알아내고 결정을 내리며 예측을 할 수 있도록 도와준다.
AI 모델을 훈련하는데 사용되는 데이터이다. 이때 사용되는 데이터들은 라벨링 된 데이터이다. 전체 데이터 셋에 대략 70%를 차지하며 AI 모델이 다양한 패턴과 특징을 학습할 수 있도록 도와주며 보다 정확한 예측을 할 수 있도록 한다.
모델의 선능을 모니터링하고 파인튜닝 하는데 사용되는 데이터셋이다. 학습과정 중 모델이 과적합되지 않고 최적의 하이퍼파라미터를 찾기 위해 사용된다.
최종 모델의 성능을 평가하는데 사용되는 데이터이다. 이전 학습, 검증 과정에서 사용되지 않는 새로운 데이터로 구성된다.