Machine Learning
Arthur Samuel(1959) 체커 프로그램 개발.
Definition : Field of study that gives computers the ability to learn without being explicitly programmed.(명시적으로 프로그램된 바 없이 컴퓨터가 학습할 수 있는 능력을 가지게 하는 학문)
Question
→ 학습 한 표본 수가 적을 수록 성능은 어떻게 될까? → Worse
Machine Learning Algorithms
- Supervised Learning(지도 학습) → 빠른 발전 및 실생활에서 주로 사용.
- Unsupervised Learning(비지도 학습)
- Recommender Systems(추천 시스템)
- Reinforcement Learning(강화 학습)
⇒ Practical Advice for applying Learning algorithms (기계 학습 분야에선 기계 학습을 진행하는 도구뿐만 아니라 효율적으로 기계 학습을 돌리도록 하는 방법이 중요.)
Supervised Learning
Supervised Learning
- X(input) → Y(Output) 사이의 관계를 알아내는 것.(mapping)
- 정답이 포함된 예제를 주는 것.(Learns from being given “right answers”)
Example
새로운 입력 X를 가져다가 적절한 출력 Y를 생성하도록 추정하는 모델.
Regression : Housing Price Prediction
Regression을 직선으로 가거나 곡선으로 가는 방향에 따라 예측되는 집값이 다름.
Classification : Breast cancer detection
- 0 / 1와 같이 n분법적인 Output Value.
- 불연속적인 Value.
Unsupervised Learning
Unsupervised Learning
- 라벨되어있지 않은 데이터에서 특징을 찾는 것(ex. Clustering)
Clustering
- Google News → panda + twin 등의 keyword 통한 유사 기사 찾기.
- DNA Microarray → DNA Type Divide.
- Grouping Customers
Anomaly Detection(이상 탐지)
⇒ Find unusual data(이상 데이터) points.
Dimensionality Reduction(장바구니)
⇒ Compress data using fewer numbers.