Machine Learning

남연하·2021년 3월 22일
0

Machine Learning : 데이터를 입력하여 컴퓨터를 학습시켜 원하는 결과를 도출해내는 방식

컴퓨터를 학습시키는 방식
(1) Supervised Machine Learning
(2) Unsupervised Machine Learning
나누는 기준 : input data가 label되어 있는지에 대한 여부

1. Supervised Machine Learning

  • 데이터에 라벨링이 되어 있는 경우
    (ex) 여러 고양이 이미지에 고양이라고 라벨을 달아놓고 학습시켜 나중에 컴퓨터가 고용이 사진을 보면 고양이라고 인식할 수 있게 되는 것, 스팸이라고 신고한 이메일을 차단시켜 주는 것

  • input data : training data set
    입력한 training data set을 통해 학습하게 설정한 뒤 test할 data를 입력하면 ML을 통해 결과가 도출됨.

  • Classification, Regression에 적합하다.
    Classification : output의 값이 정해진 값들 중 하나로 제한되어 있는 경우
    Regression : 그렇지 않은 경우

  • 알파고 --> Supervised Machine Learning --> 실제 바둑 두는 전략을 학습시켜 경기를 했을 때 어디에 자기 돌을 두어야 하는지에 대한 최선의 결과 도출

2. Unsupervised Machine Learning

  • 데이터 라벨 없이 컴퓨터를 학습 시키는 것
    (ex) 뉴스 내용에서 키워드를 뽑아내 비슷한 부류의 뉴스를 모으는 것, 컴퓨터가 동의어를 모으는 것, 섞여있는 과일과 야채들을 컴퓨터가 학습을 통해 종류별로 모으는 것

  • Clustering(그룹화)에 적합

3. Feature Selection

  • 모델의 분류 정확도를 향상시키기 위해, 원본 데이터에서 가장 좋은 성능을 보여줄 수 있는 데이터의 부분집합(subset)을 찾아내는 방법

(1) Filter methods : 모델에 적용하기 전에 Feature들을 걸러내는 방법, 통계적인 계산에 의해 각 Feature들을 랭킹화 한 뒤 랭킹에 따라 Data set에 그대로 남아있거나 제거 되게 된다.
(2) Wrapper methods : 가장 이상적인 Feature의 조합을 찾는 방식으로 Feature을 다르게 조합하여 모델 학습을 진행 하는 것
(3) Embedded methods : 모델의 학습 및 생성 과정에서 최적의 Feature 선택

profile
Ewha Electric

0개의 댓글