머신러닝과 딥러닝의 차이는 무엇일까요?
- 인공지능 ⊃머신러닝 ⊃딥러닝
- 인공지능
- 정의
- 데이터를 구문 분석하고 해당 데이터를 통해 학습한 후 정보를 바탕으로 결정을 내리기 위해 학습한 내용을 적용하는 알고리즘
- 인간의 언어 구사 능력, 물체식별 능력, 문제 해결능력, 학습능력과 논리적 추론능력, 지각능력 등을 프로그램으로 실현하는 기술
- 인공적인 기계(컴퓨터)가 인간의 지능을 흉내낸 능력을 다루도록 하는 기술
- 머신러닝
- 정의
- 컴퓨터가 스스로 주어진 데이터 패턴을 학습해 이전에 없던 새로운 데이터를 마주해도 답을 낼 수 있는 방식
- 어린아이가 경험을 반복하며 개념이나 사물의 특징을 배우고 알아가는 과정과 닮았다
- 빅데이터를 통한 학습 방법으로 머신러닝을 이용
- 목표
- 의사 결정 기준에 대한 구체적인 지침을 SW에 직접 코딩해 넣는 것이 아닌, 대량의 데이터와 알고리즘을 통해 컴퓨터 그 자체를 학습시켜 작업 수행 방법을 익히는 것
- 장점
- 규칙 기반 모델은 사용자가 직접 입력해 결과를 얻음, 정확하나 규칙이 많아지고 복잡해질 수록 효율과 정확도 감소, 규칙에 없는 새로운 데이터는 답을 낼 수 없음(오류)
- 머신러닝은 스스로 데이터를 분석해 규칙을 배우고 그 기준으로 분류 가능, 새로운 데이터가 들어오면 분석하여 분류하거나 새로운 분류기준을 만들 수 있음, 새로운 규칙이 자주 등장 할 때 머신러닝이 유리
- 딥러닝
- 인간의 뇌에서 아이디어를 얻어 온 학습방법(인공신경망에서 발전)
- 컴퓨터가 스스로 데이터 경로를 수정해 나가며 최적의 결과가 나오도록 학습하는 방식
- 알고리즘을 계층으로 구성하여 자체적으로 배우고 지능적인 결정을 내릴 수 있는 인공신경망을 만든다
- 딥러닝은 분류에 사용할 데이터를 스스로 학습할 수 있는 반면, 머신러닝은 학습 데이터를 수동으로 제공해야한다는점
- 딥러닝은 분류에 있어 중요한 Feature을 자동적으로 골라내며, 머신러닝은 수동적으로 중요한 Feature를 제공
- 머신러닝은 알고리즘을 사용하려 데이터를 구문 분석하고 해당 데이터에서 학습하며, 학습한 내용에 따라 정보에 근거한 결정을 내리며, 딥러닝은 알고리즘을 계층으로 구성하여 자체적으로 배우고 지능적인 결정을 내릴 수 있는 인공신경망을 만든다
- 훈련시간은 딥러닝이 훨씬 오래 걸린다(ResNet약 2주), 머신러닝의 경우 수초~수시간
- 반면에 테스트 시간은 딥러닝 알고리즘이 더 적은 시간 소요
- 딥러닝은 머신러닝의 하위개념. 둘다 인공지능의 카테고리에 속하지만 인간과 가장 유사한 인공지능을 구동하는 것은 딥러닝
- 딥러닝의 성능이 우수하더라도 왜 이 결과를 부여하게 되었는지 알 수 없음, 머신러닝의 경우 알고리즘이 선택된 명확한 규칙이 제공되기에 해석이 용이
과거 딥러닝이 잘 안되었던 이유는 무엇일까요?
- 과거에는 사람이 직접 모든 경우의 수를 고려해 데이터를 학습시켜야 했다.
- 지금과 비교했을 때 엄청 많은 양의 데이터는 아니었어도 사람이 감당하기에는 벅찬 양
- 인터넷 기술이 지금처럼 발달하지도 않았으며
- 컴퓨터의 성능 또한 기대 수준에 미치지 못했다
- 기본적인 신경망조차 굉장한 양의 연산을 필요로 해 초기 상용화부터 난관
- 병렬연산에 최적화된 GPU의 등장은 신경망의 연산 속도를 획기적으로 가속하며 진정한 딥러닝 기반 인공지능의 등장을 불러왔다
지도학습과 비 지도학습의 차이는 무엇일까요?
- 지도학습
- 정의
- 데이터와 라벨(정답)을 함께 학습해 규칙을 만들고, 이를 바탕으로 새로 입력된 데이터에도 같은 규칙을 적용해 결과를 내는 방식
- 목표
- 학습한 데이터의 규칙이나 패턴을 바탕으로 새로운 데이터에 대한 정확한 예측값을 내놓을 수 있게 하는 것(일반화 vs 과적합(보통 입력 데이터에 과하게 학습하여 정확도가 높으나 새로운 데이터에는 정확도가 떨어지고 오차가 커지는 문제 발생))
- 종류
- 분류(연속성이 없는 카테고리 예측): 라벨에 맞게 각 데이터를 각기 다른 집합으로 묶어내는 것, 이때의 집합을 카테고리 or 클래스라고 함
- 회귀(연속적인 값을 예측)
- 비지도학습
- 정의
- 모델을 학습시킬 때 라벨(정답) 없이 데이터만 제공하는 방식
- 정답을 미리 알려주지 않으므로, 컴퓨터가 데이터를 여러 방법으로 구조화하고 비슷한 패턴을 보이는 데이터끼리 묶어 보면서 스스로 규칙이나 데이터의 특이점을 발견해야 한다.
- 종류
- 클러스터링
- 지도 학습에 사용될 데이터에 라벨을 붙일 때 사용하는 경우
- 강화학습
- 정의
- 행동심리학에서 영감을 받아 발전한 머신러닝
- 잘하면 상 줄게 그대로 해봐 → 보상으로 모델이 스스로 효과적인 방법을 터득하도록 유도
- 에이전트(학습의 주체)가 환경과 상호작용하면서 목표를 달성하기 위해 학습하는 것을 의미
- 주어진 조건에서 문제를 해결하기 위한 여러 경우의 수를 실행하며 행동에 대한 보상을 받으면서 목표 달성을 위한 최적의 행동이 무엇인지 찾아나가는 것
- 강화학습을 푼다는 것의 정의는 미래에 얻어질 보상값들의 평균을 최대로 하는 정책 함수를 찾는 것
- 최적의 정책함수는 불확실한 미래에 얻을 수 있는 보상 함수의 기대값을 최대로 하는 행동을 고르는 것
- 강화학습으로 해결할 수 있는 문제유형
- 특정 행동에 대한 좋고 나쁨을 평가하는 보상이 주어진다
- 현재의 의사결정이 미래에 영향을 미친다
- 문제의 구조를 사전에 알 수 없다
- 종류
참고: 인공지능 모를수도 있지! (알고리마 저)