Intro of Machine Learning

MIN JI·2022년 10월 5일
0

Machine Learning

목록 보기
1/5

Machine Learning의 정의

Machine Learning 이란,
직접적인 프로그래밍 없이도 data로부터 학습하여 cognitive reasoning이 수행 가능한 컴퓨터 모델의 능력이다.
AI의 한 분야이면서 Data Science 의 한 분야이다.
컴퓨터 스스로 variables와 parameter를 조율하면서 패턴을 찾아 output을 만들어간다.

Y = f(X)
Y는 dependent variable, X는 independent variable
Machine Learning의 목표는 어떻게 X가 Y에게 영향을 미치는지를 찾아내는 것이다.

Supervised Learning

지도 학습은 독립 변수와 종속 변수 간의 알려진 관계를 decode한다.
여기에는 다양한 기능(X)과 알려진 출력 값(Y)으로 머신 샘플 데이터를 공급하는 작업이 포함된다.
입력 및 출력 값이 알려져 있다는 사실은 데이터 세트를 "labeled" 또는 "supervised"한 것으로 한정한다.

Unsupervised Learning

관찰되거나 축적된 데이터가 없을 때 사용하는 learning으로 sample data가 필요 없다.
종속 변수는 알려지지 않았거나 레이블이 지정되지 않았으며 model은 독립 변수 간의 패턴을 확인하여 새 output을 생성한다.
클러스터링 분석의 경우 유사한 data point를 그룹화하고 pattern을 일반화하는 연결을 찾아 이를 달성할 수 있다.
차원 축소의 경우, 비지도 학습의 목표는 원래 입력 데이터보다 더 적은 차원(특징)으로 output을 만드는 것이다. (범위가 벗어난 것을 찾는 것이기 때문에 오리지널 input 데이터보다 더 적은 dimension을 가지고 output에 영향을 주는 속성만 거른다.)
모델을 확인하고 검증하는 데 사용할 수 있는 알려진 output observation이 없기 때문에 비지도 학습에는 실제 output이 없으며 예측은 지도 학습보다 주관적이다.
비지도 학습은 명확한 단일 예측 목표가 없고 새로운 범주 및 하위 그룹을 발견하기 위해 탐색적 데이터 분석이 필요한 상황에서 유용하다.
예시로는 사기 거래 또는 제조 결함 포착과 같은 이상 탐지, 지도 학습 알고리즘에 데이터를 제공하기 전에 데이터 세트에서 이상치 및 복잡성을 자동으로 제거하는 것 등이 있다.

Reinforcement Learning

일반적으로 "체스 게임" 또는 "자동차 운전"과 같은 일련의 결정을 수행하는 데 사용된다.
강화 학습은 출력(y)은 알지만 입력(X)은 알 수 없기 때문에 비지도 학습의 반대이다.
output은 의도된 목표로 간주될 수 있다(예: 체스 게임에서 승리)
시행 착오를 기반으로 한 무차별 대입 기술을 사용하여 최적의 input을 찾는다.
무작위 입력 데이터는 모델에 공급되고 target output과의 관계에 따라 등급이 매겨진다.
시간이 지남에 따라 모델은 이 피드백을 활용하여 원하는 output 목표를 달성하기 위해 input 변수 선택을 점진적으로 개선한다.

0개의 댓글