딥러닝 개념
Deep Neural Network
- Deep은 상대적인 개념으로 Shallow와 반대되는 개념이다.
- Deep + Shallow = Neural Network = 뇌
- Neural = Neuron의 형용사형, 신경세포(뇌세포)
How They Are Different
AI / ML / Deep Neural Network
AI (인공지능)
├── RuleBasedAI
└── MachineLearning
├── SupervisedLearning
├── UnsupervisedLearning
├── ReinforcementLearning
└── DeepLearning (머신러닝보다 사용빈도 수 매우 높음)
Big Data / AI
- Big Data
- 데이터에 치중
- 데이터를 다루고, 저장하고, 분석하는 것에 집중
- Machine Learning
- data에서 유용한 패턴을 추출하거나 intelligent program을 어떻게 만들 것이냐에 집중
Some Types Of ML Problems 1 (문제의 종류들)
ML에서 90% 이상이 Classification과 Regression으로 구성되어 있다.
Classification
- Unknown Data → Cat or Dog? ⇒ N지 선다
- 사용 분야
Voice/Face/Fingerprint/Iris/DNA/Signature recognition,
Recommendation, Spam filter, Credit card fraud detection
Regression
- Unknown Data → “수치값” 예측, ex. 고양이 몸무게 예측
- 사용 분야
Loan application analysis, Marketing, Stock market
prediction
Clustering
- 사용분야
Web-search, Document & information retrieval, Machine
translation
Dimension Reduction
Classification
- Classification 문제에서는 Labeled Data가 무조건 필수적으로 주어진다.
- 나의 프로그램에서는 labels의 경계를 찾아야한다.
- 질문이 주어지면, 나의 프로그램에서는 label을 답해야한다.
- Classification의 과정
데이터 수집 → 학습 → 추론(활용)
- Data Collect (labeled data)
- 아래와 같이 Label 작업을 해주어야 한다.
```json
(데이터, Label)
(고양이 사진1, Cat)
(강아지 사진1, Dog)
(고양이 사진2, Cat)
...
```
- Training (학습 단계)
- Deep Neural Network를 돌려서 Model을 생성한다.
- 여기서 Model은 Cat, Dog Pattern을 알고 있다. ⇒ 즉 학습되어 있다.
- 학습: Data Pattern을 모델이 외우는 것.
- Inference (추론 단계)
- Unknown Data 입력 → model이 label 을 반환 해준다. (Cat or Dog )
Regression
- Classification과 구조가 동일하다.
- 차이점은 label 데이터가 이미지 등이 아닌 값인 것.
(데이터, Label)
(고양이1 몸무게, 40kg)
(강아지1 몸무게, 30kg)
(고양이2 몸무게, 10kg)
...
- Regression 문제에서는 Labeled Data가 무조건 필수적으로 주어진다.
- (x, y) set (x: vetor, y: real number)
- Regression의 과정
데이터 수집 → 학습 → 추론(활용)
Clustering
- Unlabeled data 가 주어진다.
- 내 프로그램은 데이터를 그룹화 한다.
- 질문이 주어지면, 질문이 어느 그룹에 속하는지 답변해주어야 한다.
Dimension Reduction
- Unlabeled data 가 주어진다.
- 내 프로그램은 정보의 손실을 줄이면 차원을 축소한다.
Supervised & Unsupervised Learning (ML 기법들)
Supervised Learning
- labeled dataset이 필요한 ML 알고리즘들
- 예시: Classification, Regression
Unsupervised Learning
- labeled dataset이 필요하지 않은 ML 알고리즘들
- 예시: Clustering, Dimension Reduction