[DevLog TIL] 파이썬 실습(3)

Laziest Workaholic·2022년 6월 20일
0

Digital Marketing and AI

목록 보기
3/4
post-thumbnail

220620 AIPM과정 D071
대구 AI 스쿨 시작한지 71일차

💻 Study Progress

프로그래밍 기반 데이터 분석(이론)

선형 회귀 모형의 개념 (Simple linear regression
Y: 수치형 관심 변수
X: 수치형 설명 변수
수치형 관심 변수를 수치형 설명변수의 정비례로 설명하는 모형
X가 1씩 커질 때 마다 Y는 b만큼 비례해서 변화
설명변수 X와 회귀 계수를 활용해서 관심 변수 Y를 예측 가능

t-검정의 개요

두개 이하의 집단에서 수치형 변수의 평균의 일치성을 판단하는 기법으로 t-검정이 활용 되며, 크게 두가지로 분류 할 수 있음
두개의 독립된 그룹간의 특정 값의 평균을 비교하기 위한 분석기법

클러스터 분석

주어진 데이터들의 특성을 고려해 그룹을 정의하고 그룹의 특징을 찾아내는 데이터 마이닝의 한 방법
클러스터란 비슷한 특성을 가진 데이터들의 집단

유사성을 측정하기

두개의 object 사이의 유사성을 측정하기 위해서 두 데이터 사이의 거리를 측정한다.

K-Means 클러스터링이란?

주어진 데이터를 K개의 클러스터로 묶는 알고리즘으로, 각 클러스터와 거리 차이의 분산을 최소화하는 방식으로 동작
K값은 Inertia value를 활용/Inertia값이 작을 수록 군집의 응집도가 높음

출처: 윤상혁 교수님 특강

profile
laaaaaaaaziest workaholic

0개의 댓글