인공지능, 머신러닝, 딥러닝
이 셋은 비슷해 보이지만 우선 차이가 있다.
AI ⊃ ML ⊃ DL
AI : 인간의 학습과 추론, 이를 통해 새로운 것에 대한 추론으로 예측할 수 있다.
사람의 지능을 필요로 하는 것을 컴퓨터 같은 스마트 머신을 이용하여 대신 수행한다.ML : 기계가 학습을 하여 AI를 성취하기 위한 하나의 접근 방식이다.
프로그래밍 : 모든 상황에 대해 사람이 짜둔 것
ML의 러닝(training) : 머신이 스스로 학습을 하는 것DL : ML을 컴퓨터로 구현하기 위한 하나의 기술.
네트워크의 사이즈가 굉장히 커서 파라미터가 굉장히 방대하다. 그렇기에 훨씬 많은 데이터가 필요하고, 이를 통해 학습한다. 1000개 미만이면 거의 학습을 할 수 없다.
학습을 하는 방법에는 대표적으로 3가지가 있다.
1) 지도학습 : 라벨 즉 정답이 존재하여 이를 통해 학습하는 것 : regression, classification
2) 비지도학습 : 라벨이 없는 경우, 이를 어떻게 구분할까? 공통된 특성들을 관찰하여 군집화 clustering을 통해 구분한다.
3) 강화학습 : 실제 환경과 상호작용을 통해 학습한다. 예를 들어 샘플 data가 충분하지 않지만, 현재 상황에서 특정한 행동을 취한 후 이를 통해 얻어지는 결과를 가지고 이를 피드백으로 이용하여 예측에 활용!
ex) 매 순간마다 관절을 어떻게 움직여야 하는지 action, 현재 각도, 바닥의 상태에 이런 state에 따라, 다시말해 각 state에 따라 액션들이 반복되며 나오는 시퀀스들을 이용한다. 모든 케이스들을 지도학습으로 학습하기에는 경우의 수들이 너무 많다. 그렇기에 강화학습을 사용하는데, 액션을 계속해서 취하는 과정에서 잘 걸을 때 보상을 통해 학습시킨다. 즉, reward를 maximize시키는 쪽으로 policy를 업데이트하며 학습한다. 이렇게 계속해서 액션을 수정해갈 텐데 수정해가는 액션들, state마다 주어진 action을 policy라고 하는데 이를 계속해서 업데이트해간다.
딥러닝은 머신러닝의 한 파트 : 딥러닝이 핫해지며, 요즘은 대등한 위치
머신러닝은 feature extraction(simple data로 바꾸는 과정)을 사람이 한다. 하지만 딥러닝은 모델 자체가 알아서 해준다! 이는 단순해 보이지만 굉장히 중요한데, 굉장히 많은 데이터들이 존재한다면 이는 아주 복잡한 원인들로 인하여 특징들이 구분될 것이다. 하지만 사람이 하기에는 한계가 존재한다. 그렇기에 딥러닝을 통해 굉장히 방대하고 복잡한 데이터들의 관계를 구분할 수 있게 feature extraction을 수행하고 최종 목적에 (아래와 같은 경우는 classificaion) 사용하는 것이다! deep해질 수록 hidden layer들이 좀 더 고급화된 추상적인 특징들을 가진다.
여기서 중요한 점이 있다. 머신러닝은 사람이 논리에 맞게 중요한 feature을 정제하거나 만드는 등 이유가 있지만, 딥러닝은 input data자체가 raw data이기에 각 파라미터의 값이 왜 이렇게 구성되는지에 대한 원인이 불분명하다. 물론 각 파라미터의 값이 주어진 이유가 수학적인 원리로 이야기할 수 있지만, 그 이외의 원인들에 대해서는 어려운 것이다. 그렇기에 블랙박스라고 한다.
딥러닝의 가장 중요한 3가지
1) 빅데이터 : 4차산업혁명의 핵심 기술 중 하나. ex) 버스 노선을 새로 짓기 위해 통화량과 주거지를 이용하여 심야 노선버스 선정
2) Computer Power : CPU(central processing unit), GPU(graphics processing unit), TPU(Tensor processing unit) 이를 통해 방대한 양의 파라미터를 학습
3) 알고리즘 : DNN, CNN, RNN, GAN, DRL, ...
고려대학교 오승상 교수님 강의 : https://www.youtube.com/watch?v=dkm0RrmnH4s&list=PLvbUC2Zh5oJvByu9KL82bswYT2IKf0K1M