
머신러닝이란 애플리케이션을 수정하지 않고도 데이터를 기반으로 패턴을 학습하고 결과를 추론하는 알고리즘 기법을 통칭한다.
현실 세계에서의 매우 복잡한 조건으로 인해 기존의 소프트웨어 코드만으로는 해결하기 어려웠던 많은 문제점들을 이제 머신러닝을 이용해 해결해 나가고 있다.
특히 인간만이 가지는 인지능력만이 해결 가능하다고 여겨졌던 다양한 분야에서 머신러닝의 응용이 두드러지고 있으며 데이터 마이닝, 영상 인식, 음성 인식, 자연어 처리에서 머신러닝을 적용하면서 급속하게 발전하고 있다.
기존 컴퓨터 사이언스는 로직을 미리 만들어서 데이터를 받아 결과를 확인하는 방식
머신러닝은 특성 데이터와 결과를 넣어 로직을 머신이 학습하는 방식
- 머신러닝 모델에 문제 데이터와 정답 데이터를 반복적으로 넣어주면 입력된 데이터의 패턴을 파악하여 어떤 연산이 이루어 질지를 학습하게 된다
지도학습(Supervised Learning)
명확한 결정값이 주어진 데이터를 학습
머신러닝 모델에게 문제(feature)와 답(label)을 모두 제공
비지도학습(Un-supervised Learning)
결정값이 주어지지 않는 데이터를 학습
머신러닝 모델에게 문제(feature)만 제공
데이터 세트 분리 : 데이터를 학습 데이터, 테스트 데이터로 분리
모델 학습(fit) : 학습 데이터를 기반으로 머신러닝 알고리즘을 적용해 모델을 학습
예측 수행(predict) : 학습된 머신러닝 모델을 이용해 테스트 데이터로 예측
평가(evaluate) : 예측된 결괏값과 테스트 데이터의 실제 결괏값을 비교해 머신러닝 모델 성능을 평가
책
해당 챕터의 실습 및 예제 코드는 아래 링크의 Machine Learning 참조 해주시면 됩니다.