머신러닝

는는·2022년 10월 27일
0

python

목록 보기
5/19

머신러닝이란?

해결하려는 문제에 따라 예측, 분류 , 군집, 알고리즘 등으로 분류된다.
예를 들면, 주가, 환율 등 경제지표 예측 은행에서 고객을 분류하여 대출을 승인하거나 거절하는 문제, 비슷한 소비패턴을 가진 고객 유형을 군집으로 묶어내는 문제 등이 있다.

머신러닝은 워낙 다양한 영역에 결쳐있고, 사용하는 알고리즘과 방법론이 무수히 많기 때문에 체계적으로 이론을 정립해 나가려면 상당한 시간과 노력이 필요하다.

*출처 https://opentutorials.org/module/4916/28942

지도학습


왼쪽 지도 학습 / 오른쪽 비지도학습

*출처 https://thebook.io/080244/part01/unit02/01/

지도학습은 정답지가 있어서 정답을 맞춰 보면서 문제를 풀어가는 학습 방법이다.

분류(범주형)

(알약)약품 분류,제품의 성능판단 시, 합격 불합격 분류 ,이상 유저 분류

분류 알고리즘은 예측하려는 대상의 속성(설명 변수)을 입력 받고, 목표 변수가 갖고 있는 카테고리(범주형) 값 중에서 어느 한 값으로 분류하여 예측한다.

회귀(수치형)

주식 예측,(마켓컬리 같은데서) 다음날 신선식품 소비 예측
가격, 매출, 주가, 환율, 수량 등 연속적인 값을 갖는 연속 변수를 예측하는데 주로 활용된다.

비지도 학습

정답지 없이 스스로 답을 찾는 학습 방법

군집화(범주형)

신용카드 부정 사용 탐지, 구매 패턴 분석등 소비자 행동특성 그룹화

관측값이 갖고 있는 여러 속성을 분석하여 서로 비슷한 특징을 갖는 관측값끼리 같은 클러스터(집단)로 묶는 알고리즘이다.

서로 완전하게 구분되는 특징을 갖기 때문에 어느 집단에도 속하지 못하는 관측값이 존재 할 수 있다.그렇기때문에, 이상값,중복값을 찾는데 활용하기도 한다.

차원축소(수치형)

저차원 표현이 고차원 원본 데이터의 의미 있는 특성을 이상적으로 원래의 차원에 가깝게 유지할 수 있도록 고차원 공간에서 저차원 공간으로 데이터를 변환 하는 것을 말합니다.

0개의 댓글