머신러닝 개념
- 데이터를 기반으로 패턴을 학습하고 결과를 추론하는 알고리즘 기법 통칭
머신러닝 분류
지도학습
- 명확한 결정값이 주어진 데이터를 학습
- 분류, 회귀, 시각, 음성, 인지
비지도학습
- 결정값이 주어지지 않는 데이터를 학습
- 군집화(클러스터링), 차원 축소
머신러닝 알고리즘 유형
- 기호주의 : 결정트리 등
- 연결주의 : 신경망, 딥러닝
- 유전 알고리즘
- 베이지안 통계
- 유추주의 : KNN, 서포트 벡터 머신
머신러닝 단점
- 데이터에 너무 의존적
- 복잡한 머신러닝 알고리즘으로 인해 도출된 결과를 이해하기 어려움
- 학습 데이터에 최적의 결과를 도출하기 위해 수립된 머신러닝 모델은 실제 데이터에 적용 시, 과적합 되기 쉬움
파이썬 기반 머신러닝
장점
- 확장성, 연계, 호환성
- deep learning으로 가기 쉬움
주요 패키지
- NumPy, SciPy(배열, 선형대수, 통계)
- pandas(데이터 핸들링)
- matplotlib, seaborn(시각화)
- jupyter(대화형 툴)
- scikit-learn(머신러닝 패키지)
파이썬 기반 머신러닝을 위한 SW의 설치
anaconda 설치
Anaconda | Individual Edition
Windows 및 Mac용 Visual Studio 2019 다운로드