이번 주에는 NIPA에서 제공해준 유데미 - [AICE 자격대비반] 인공지능(AI) 능력시험 AICE Basic 대비 올인원 패키지를 학습하였다.
인간처럼 학습하고 생각하여 스스로 판단하는 기술이다. 어떻게 하면 인간 처럼 학습 시킬 수 있을 까해서 등장한 개념이 머신러닝이다. 알고리즘으로 데이터를 학습하여 모델을 만든다.
경험된 빅데이터를 기반하여 수많은 변화에 대처하고 추후 발생하는 새로운 문제에 대해 해결방식도 찾아낸다.
알고리즘
어떻게 학습하고 추론해 낼 것인지 원리를 가진 영역 어떠한 알고리즘을 활용하는 거에 따라 모델의 성능 영향
데이터
많은 양질의 데이터가 중요
GPU
방대한 양의 데이터 처리를 위한 GPU
머신러닝(기계학습)은 학습 방법에 따라 지도 학습, 비지도 학습, 강화 학습으로 나뉜다.
지도 학습
정답이 정해진 데이터를 가지고 정답의 방향으로 학습한다. 따라서 대량의 데이터가 제공될수록 효율적인 학습이 가능하다.
비지도 학습
정답이 없는 데이터 집합에서 데이터의 특성을 분석하여 군집화하는 학습방법이다. 정답 데이터를 제공하지 않아도 되는 점에서 관심을 받고 있다.
강화 학습
학습 과정에서 정답을 도출할 경우 보상을 제공해 정답 가능성을 높여주는 방법이다.
입력(Feature, X)/출력(Label, Y) 데이터로 학습한다. 결과가 범주형이면 분류(classification), 결과가 수치형이면 회귀(regression)
정답이 있는 데이터들을 Training Set과 Test Set로 7:3 혹은 8:2로 나누어 학습한다. Training Set으로 학습을 하여 모델을 만들고 Test Set으로 예측 모델을 평가한다. 평가 항목에는 정확도와 오차율이 있다.
출력데이터(Label, Y, 정답) 없이 입력 데이터만 주고 패턴으로 학습한다. 동물들 사진들이 주어 졌을 때, 꼬리가 긴지 작은지, 얼룩이 어떤지 등 특성에 따라 스스로 학습해 분류한다.
특정 행동(Action을 시행하고 상벌(Rewards)에 따라 해야할 행동을 학습한다.
지도학습 | 비지도 학습 | 강화 학습 | |
---|---|---|---|
환경데이터 | labeled past data | unlabeled past data | dynamic current data |
환경피드백 | direct (정답이 있음) | none | direct(rewards) 상벌 |
응용분야 | 분류, 회귀 => 위험평가, 예측 | 군집화, 연관규칙 => 상품추천, 특이사항 탐지 | 바둑, 게임, 자율주행자동차, 드론 |
본 후기는 정보통신산업진흥원(NIPA)에서 주관하는 <AI 서비스 완성! AI+웹개발 취업캠프 - 프론트엔드&백엔드> 과정 학습/프로젝트/과제 기록으로 작성 되었습니다.