인공지능이란?
인간의 지능을 모방하여 사람이 하는 일을 컴퓨터가 할 수 있도록 하는 기술
인공지능을 구현하는 방법
동작원리
재사용
데이터
훈련 시간
결과
인공지능의 한 분야로, 컴퓨터 스스로 대용량 데이터에서 지식이나 패턴을 찾아 학습 하고 예측을 수행하는 것
즉, 컴퓨터가 학습할 수 있게 하는 알고리즘고 기술을 개발하는 분야
💡 특성 추출이란?
컴퓨터가 입력받은 데이터를 분석하여 일정한 패턴이나 규칙을 찾아내려면,
사람이 인지하는 데이터 -> 컴퓨터가 인지할 수 있는 데이터로의 변환이 필요.
이 때, 데이터별 특징을 찾아내고, 이를 토대로 데이터를 벡터로 변환하는 작업을 말함.
머신러닝의 주요 구성요소
모델의 학습 절차
1. 모델(or 가설) 선택
2. 모델 학습 및 평가
3. 평가를 바탕으로 모델 업데이트
💡 검증 데이터셋을 사용하는 이유
훈련 데이터셋으로 모델을 학습시킨 후 모델이 잘 예측하는지 그 성능을 평가하기 위해 사용
💡 모델 성능평가가 필요한 이유
1. 테스트 데이터셋에 대한 성능 가늠
2. 과적합 방지
인간의 신경망 원리를 모방한 심층 신경망 이론을 기반으로 고안된 일종의 머신러닝 방법
딥러닝의 특징
그림 설명
수상돌기 : 뉴런에서 자극을 받아들이고 이 자극을 전기적 신호 형태로 세포체와 축삭돌기에 보냄
시냅스 : 신경 세포들이 이루는 연결 부위, 한 뉴런의 축삭돌기와 다음 뉴런의 수상돌기가 만나는 부분
축삭돌기 : 다른 뉴런(수상돌기)에 신호를 전달하는 기능을 하는 뉴런의 한 부분.
축삭말단 : 전달된 전기 신호를 받아 신경 전달 물질을 시냅스 틈새로 방출
💡 Epoch란?
인공 신경망에서 전체 데이터에 대해서 순전파와 역전파가 끝난 상태
ex) 전체 데이터를 하나의 문제지에 비유한다면 문제지의 모든 문제를 끝까지 다 풀고, 정답지로 채점을 하여 문제지에 대한 공부를 한 번 끝낸 상태
💡 Batch_size란?
몇 개의 데이터 단위로 매개변수를 업데이트 하는지를 말함.
- ex) 문제지에서 몇 개씩 문제를 풀고나서 정답지를 확인하느냐의 문제. 기계 입장에서는 실제값과 예측값으로부터 오차를 계산하고 옵티마이저가 매개변수를 업데이트함.
여기서 중요한 포인트는 업데이트가 시작되는 시점 = 정답지/실제값을 확인하는 시점
딥러닝의 핵심 구성 요소
지도학습
이미지분류
- 이미지 or 비디오상의 객체를 식별하는 컴퓨터 비전 기술
- 목적에 따라 이미지분류/이미지인식/이미지분할로 나뉨
ex) CNN : 합성곱 신경망
시계열 데이터
- RNN(순환신경망) : 시간에 따른 데이터에 사용, but 역전파 과정에서 기울기 소멸 문제 발생
- LSTM : RNN의 문제점을 개선하고자 게이트 3개 추가. (망각게이트/입력게이트/출력게이트)
비지도학습
전이학습
사전학습모델을 이용하여 미세조정기법을 통해 학습시키는 방법