패턴 인식이란?패턴 인식은 데이터에서 규칙적인 패턴을 찾아내고 학습하는 과정핵심 질문: 패턴을 어떻게 학습할까?목표 응용 분야에 따라 학습 방법이 다름학습 방법의 분류지도 학습회귀 (Regression): 원하는 출력이 하나 이상의 연속형 변수분류 (Classifica
회귀 유래와 의미유래회귀라는 개념은 프랜시스 골턴의 실험으로 부터 유래함아주 큰 키를 가진 부모의 자식 키는 크지만 부모만큼 크지 않고 평균값으로 돌아가는 (regress) 경향을 보임정의회귀란 뒤로 돌아가다라는 뜻설명 변수로부터 반응 변수를 예측하는 통계적 기법왜
정의과결정 시스템의 해를 근사하는 회귀 분석의 표준법과결정이란?추정해야할 매개변수 개수보다 데이터 포인트가 더 많은 경우예: $n$개의 데이터 포인트와 $p$개의 특징을 가진 선형 회귀 문제에서, $n > p$이면 시스템은 과결정특징최소 제곱법은 기저함수와 관계 없이
정의: 우도 함수를 최대화하여 모델의 파라미터를 추정하는 통계적 방법목표: 우도 함수 최대화 (모델이 데이터를 관측할 확률 극대화)용도: 회귀, 분류, 확률 분포 파리미터 추정에 사용됨현실 세계의 데이터 특성데이터 노이즈실제 데이터는 본질적으로 노이즈가 많음 (측정 오
MLE vs LSMLE 는 오류 분포를 모델링하고 가능도 함수를 최대화함으로써 더 포괄적인 접근 방식 제공MLE 에서는 오차항에 정규 분포를 가정하여 추정치의 유도 및 계산이 단순화 됨LS 는 더 간단하지만 오류 분포를 모델링하지 않고 오류를 최소화하는데 중점접근 방식
로지스틱 회귀이진 분류에 사용되는 통계적 방법으로 주어진 입력이 특정 클래스에 속할 0 과 1 사이 확률을 예측수학적 모델시그모이드 함수를 사용특징이진 분류에 이상적데이터가 선형 분리 가능할때 잘 동작확률 점수를 출력하므로 임계값 기반의 의사 결정 가능구현하고 해석하기
정의모델의 예측과 실제 값을 비교하여 모델 성능을 측정목적비용을 최소화 하기. 즉 예측이 실제 값에 가능한 가깝게 하기NLL 과 크로스 엔트로피: MLE 기반 접근 방식에서 사용되는 비용함수.$-\\log L(w,b) = -\\sum{i=1}^{m} \[y_i \\lo
과적합모델이 훈련 데이터의 노이즈와 세부사항까지 너무 많이 학습높은 분산, 낮은 편차과소적합모델이 너무 단순하여 데이터의 근본적인 패턴을 포착하지 못함낮은 분산, 높은 편차트레이드 오프높은 편향, 낮은 분산: 단순한 모델은 데이터의 기본 구조를 포착하지 못할 수 있음낮
분류란 무엇인가데이터에 레이블을 할당을 목표로 하는 지도 학습분류는 의사 결정 자동화에 도움을 줌분류 유형이진 분류두 가지 클래스만 존재하는 경우다중 클래스 분류두 개 이상의 클래스가 존재하는 경우다중 레이블 분류각 인스턴스가 여러 클래스에 속할 수 있는 경우지도학습레
SVM서포트 벡터 머신 (large margin classifier)마진을 최대로 하는 결정 경계로 분류마진마진이 클수록 일반화 성능이 좋음경계에 가까울 수록 분류기는 적은 확신의 결론을 내림서포트 벡터정의: 결정 경계에 가장 가까이 있는 데이터 포인트목표: 서포트 벡