220620 AIPM과정 D071
대구 AI 스쿨 시작한지 71일차
선형 회귀 모형의 개념 (Simple linear regression
Y: 수치형 관심 변수
X: 수치형 설명 변수
수치형 관심 변수를 수치형 설명변수의 정비례로 설명하는 모형
X가 1씩 커질 때 마다 Y는 b만큼 비례해서 변화
설명변수 X와 회귀 계수를 활용해서 관심 변수 Y를 예측 가능
두개 이하의 집단에서 수치형 변수의 평균의 일치성을 판단하는 기법으로 t-검정이 활용 되며, 크게 두가지로 분류 할 수 있음
두개의 독립된 그룹간의 특정 값의 평균을 비교하기 위한 분석기법
주어진 데이터들의 특성을 고려해 그룹을 정의하고 그룹의 특징을 찾아내는 데이터 마이닝의 한 방법
클러스터란 비슷한 특성을 가진 데이터들의 집단
두개의 object 사이의 유사성을 측정하기 위해서 두 데이터 사이의 거리를 측정한다.
주어진 데이터를 K개의 클러스터로 묶는 알고리즘으로, 각 클러스터와 거리 차이의 분산을 최소화하는 방식으로 동작
K값은 Inertia value를 활용/Inertia값이 작을 수록 군집의 응집도가 높음
출처: 윤상혁 교수님 특강