[ML] 머신러닝의 소개 (part 1)

hotmoist·2021년 9월 11일
0
post-custom-banner

✍Machine intelligence와 ML

대학교 수업에서 들은 ML course의 정리

Machine intelligence


지능적인 소프트웨어 (intelligent software)로 자동화, 사람의 말 이해, 이미지의 이해 등을 수행한다.

  • 초창기 AI
    인간이 하기엔 어렵고 컴퓨터에겐 쉬운 작업들을 수행함
    (ex : 수학적인 규칙, 검색 등...)

  • 현대적 AI
    인간이 하기엔 쉽지만 공식적으로 설명하기 어려운 일들을 수행함
    사람과 닮은/ 처럼 생각/ 처럼 생각하는 것 처럼 보임
    (ex : 인간의 말 이해, 손글씨 이해 등...)


AI의 지식 습득은...?

  • 초창기 AI
    hard-coded 된 지식으로, 인간에 의해 공식적으로 분류가 된 지식들을 AI는 습득한다.

  • 현대적 AI
    컴퓨터가 경험을 토대로 학습하고, 컴퓨터의 능력으로 데이터의 패턴들을 추출하여 정보를 습득한다.
    이것을 ML(Machine Learning) 또는 Data mining이라 칭한다.
    (두 용어는 명확히 구분할 수 있지만 범용적으로 사용한다고 한다.)


Prediction(예측)

컴퓨터 입장에서 예측은 과거의 데이터 기반으로 새로운 정보를 맞추는 것이다. 예를 들어 물체에 대한 시각적 데이터 들을 학습 시키면, 당장 지금 어떠한 물체를 주어주면 컴퓨터는 그 물체가 무엇인지 예측을 할 것이다. 따라서 컴퓨터에게는 미래를 예측하는 것과 같다.
예측은 다음과 같은 종류들이 있다.

  • visual recognition (시각 데이터 예측)
  • speech recognition (청각 데이터 예측)
  • emotion recognition (감정 데이터 예측)

정통적인 rule-based 시스템 (Traditional rule-based system)

Rule-based 시스템은 사람이 직접 rule을 입력하여 예측을 하는 시스템이다. 이것은 결과가 확정적(deterministic)이기 때문에 이러한 시스템을 사용 가능한 경우, 사용하는 편이 좋다고 한다.

Rule + input ---> [ RULE : IF...IF...IF...Then 0] ---> prediction(output)
 

Data-Driven ML 시스템

데이터 기반 머신러닝 시스템은 신생아에게 새로운 정보를 가르키는 것과 같다. 인간의 경우, 신생아가 어떤 정보를 습득하여 사용하는데 몇 달 또는 몇 년이 걸릴 수 있다. 이것은 우리가 컴퓨터에서 사용하기엔 시간이 너무 오래걸리므로, 학습 데이터 수천, 수만개를 만들어 학습시킨다.
이러한 데이터를 training data로 시스템에 input으로 들어간다. 그리고 또한 training data로 결과값인 output을 미리 학습시킨다. 이렇게 input과 output의 training data를 학습시키면 시스템에서 두 부류의 데이터의 연관성(relation)을 찾게 된다. 이것이 바로 trained model이 된다. 현대 AI에서는 이렇게 스스로 관계를 찾아나간다.

input/output (training data) --->[응애 시스템]
... A Few Educations later...
[척척박사 시스템] ---> input/output relation model(추론 모델) 구축

(이어서 part 2로 ...)

profile
No coffee, No coding
post-custom-banner

0개의 댓글