머신러닝의 분야

yoon·2021년 10월 8일
0

(*이 시리즈의 내용은 모두 '인공지능 100점을 위한 파이썬 수학' 서적의 내용을 정리한 것입니다. 사진과 같은 자료들 또한 출처가 위 책임을 밝힙니다.)

  • 일반적으로 인공지능과 머신러닝은 거의 같은 의미로 사용되고, 인공지능의 연구는 크게 3개의 분야로 나누어진다.

(1) 지도학습(Supervised Learning)

  • 학습하는 대상을 보면서 정답인지, 오답인지 신호를 주면서 학습을 시킨다.

  • 비교적 학습에 큰 어려움이 없다.

  • 학습을 위한 데이터와 그 데이터에 대한 정답 레이블이 함께 주어진다.

    MNIST 데이터에서, x는 28x28 크기의 손으로 쓴 글씨 정보를 담고 있고, 동시에 정답 레이블인 0~9 사이의 답 t를 함께 가지고 있다. 데이터 x를 가지고 0에서 9사이의 어떤 값을 가질 것인지를 추론한 다음 그것이 맞는지 정답 t를 통해 확인한다.

  • 다른 분야에 비해 상당 부분 이론이 잘 정비되어 있고, 학습률도 좋다.

(2) 비지도학습(Unsupervised Learning)

  • 정답이 없는 데이터를 가지고 학습.

이를테면 강아지 사진 1만 장과 고양이 사진 1만 장을 가지고 각각의 사진마다 dog, cat이라는 레이블이나 강아지는 0, 고양이는 1을 붙인다면 지도학습이 된다.

  • 지도학습에서는 2만 장의 정답 레이블이 적힌 데이터를 가지고 학습을 하게되지만, 정답 레이블이 없다면 정답 없이 학습을 진행하므로 비지도학습이 된다.

  • 데이터를 AI가 알아서 분류하면서 적당한 선에서 그룹을 나눈다.

(3) 강화학습(Reinforcement Learning)

  • 지도학습, 비지도학습과는 다른 종류이다.

  • 강화되는 방향으로 향하는 학습.

지도학습이나 비지도학습이 이미 존재하고 움직이지 않는 데이터에 대한 분류라면 강화학습은 변하는 환경에서 어떤 행위를 했을 때 주어지는 보상을 더 크게 얻기 위한 학습이다.

  • 강화학습으로 대표적인 알고리즘: Q-Learning과 이것이 딥러닝과 결합한 DQN(Deep Q Network)이 있다.
profile
공부하자

0개의 댓글