[Machine Learning] 머신러닝 개요

🤖 머신러닝
◽ 머신러닝 정의
- 전통적인 프로그래밍 방식
- input : 데이터, 함수, 알고리즘
- output : 제시된 알고리즘으로 데이터를 처리한 결과
- 머신러닝
- input : 데이터, 어떠한 방식으로 도출된 결과
- output : 알고리즘, 모델, 규칙
◽ 머신러닝 시스템 워크플로우
- 수집 : 머신러닝 학습에 필요한 데이터 수집
- 점검 및 탐색 : 데이터의 구조/노이즈 파악 (EDA 단계)
- 전처리 및 정제 : 머신러닝 학습에 알맞게 데이터 가공
- 모델링 및 훈련 : 적절한 머신러닝 알고리즘 선택 및 학습 진행
- 평가 : 테스트 데이터를 통해 학습 평가
- 배포 : 모델을 서비스에 적용
◽ 머신러닝 알고리즘 분류
지도 학습
- 모델에 주입하는 데이터에 특성과 정답을 같이 넣어 학습시키는 방식
- ① 분류 (Classification)
② 예측 (Regression)
비지도 학습
- 모델에 특성만 넣어 학습시키는 방식
- ① 군집 (Clustering)
② 차원축소 (Dimension Reduction)
③ 연관규칙 (Association Rule)
강화 학습
- 모델의 학습결과에 따라 보상 또는 벌점을 주어 가장 큰 보상을 받는 방향으로 학습시키는 방식
◽ 머신러닝 기본 용어
- feature
- label / target / class
- parameter
- 모델이 학습 과정에서 업데이트하는 요소
- 예 ) weight, bias
- hyper parameter
- 사용자가 직접 설정하는 파라미터
- 예 ) learning_rate, max_depth
- loss
- metric
- 평가 지표
- 모델의 성능 평가 시 사용하는 지표