데이터 시각화는 복잡한 데이터를 다양한 사람들이 이해할 수 있도록 효과적으로 전달하는 필수적인 도구이며, 꼭 필요한 기술이다.
하나의 변수(X)로 결과(Y) 예측
Y = β0 + β1X → 직선 하나로 X와 Y 관계 설명
X가 1만큼 증가할 때, Y는 평균적으로 β1 단위만큼 증가

2개 이상의 변수(X1, X2 ... Xn)로 결과(Y) 예측
Y = β0 + β1X1 + β2X2 + ... + βnXn
➡️ 다중공선성 해결 방법

문자형 변수는 숫자로 변환해야 회귀에 사용 가능
순서가 있는 범주형 변수 > 숫자 변환
ex) 옷 사이즈(S, M, L, ...), 수능 등급(1등급, 2등급, ...)
순서가 반영될 수 있게 숫자로 변환
순서가 없는 범주형 변수 > 원-핫 인코딩
ex) 지역(서울,부산,대구,대전, ...)
pd.get_dummies(df, drop_first=True)
한 개 버리는 이유
ex) 남,여 가 있을때 남자가 아니면 여자기 때문에 남 True, False 하면 남, 여
데이터가 곡선적인 경향을 보일때 사용


| 구분 | 사용 조건 | 특징 |
|---|---|---|
| 단순선형회귀 | X가 1개, Y와 선형 관계 | 간단, 직선 하나로 설명 |
| 다중선형회귀 | X가 여러 개, Y에 영향 | 복잡한 관계 설명, 다중공선성 주의 |
| 범주형 처리 | 문자형 변수 있을 때 | 숫자 or 원-핫 인코딩으로 변환 필요 |
| 다항회귀 | 비선형 곡선형 데이터 | 곡선으로 예측, 고차 과적합 조심 |
| 스플라인회귀 | 구간별로 관계 달라질 때 | 유연한 곡선, 매듭점 위치 중요 |
평균 0, 표준편차 1로 피쳐 변환 (Z-score 방식)
피처 간 비교 기준을 맞추기 위해 사용 → ML 성능 향상
(값 - 평균) / 표준편차
⚠️주의
라이브러리: StandardScaler (sklearn)
최소값 0, 최대값 1로 스케일링
피처 범위를 [0,1]로 조정해 비교 가능하도록 함
(값 - 최소값) / (최대값 - 최소값)
⚠️주의
라이브러리: MinMaxScaler (sklearn)
| 항목 | 표준화 | 정규화 |
|---|---|---|
| 원리 | 평균 0, 표준편차 1로 변환 | 최소값 0, 최대값 1로 변환 |
| 이상치 영향 | 비교적 강함 | 매우 취약 |
| 분포 유지 | 유지 (기준점 변경) | 유지 (비율로 압축) |
| 사용 시점 | 평균/표준편차 의미 있을 때 | 분포 모를 때, 절대값 중요할 때 |
| 대표 알고리즘 | KNN, PCA, SVM, 회귀 | KNN, 신경망 |
| Scaler | 특징 | 적용 상황 |
|---|---|---|
| StandardScaler | 평균 0, 표준편차 1로 표준화 | 대부분의 ML 알고리즘 기본값 |
| MinMaxScaler | 최소값 0, 최대값 1로 정규화 | 정규분포 아닌 데이터 / 신경망 모델 |
| RobustScaler | 중앙값과 IQR 기반 → 이상치에 강함 표준화계열 | 이상치 많은 데이터 전처리 |
| MaxAbsScaler | 절대 최대값 기준 [-1, 1]로 조정 (0 중심) 정규화계열 | 양수/음수 혼합된 희소 행렬 등 |
가까운 데이터포인트 기준 분류하는 알고리즘
거리를 기준으로 이상치 탐지 및 제거 가능
⚠️주의
라이브러리 : KNeighborsClassifier (sklearn)
모델 평가 지표:

SQL - 그룹별 조건에 맞는 식당 목록 출력하기
SQL - 오프라인/온라인 판매 데이터 통합하기
Python - 이상한 문자 만들기
Python - 삼총사
코드카타 70-71✅ 코드카타 41-42✅세션 3회차 복습✅ 기초강의 4-5주차✅ 스탠다드 5-6회차✅ 오늘은 꽤나 뿌듯한 하루🫡
파이썬 코드카타도 오랜만에 해냈고 기초강의 두 개 주차 듣기 성공
통계기초 5주차는 내용정리까지는 못해서 내일 복습할 겸 정리할 예정
세션이든, 녹강이든 실습 코드들 보면 솔직히 이해가 안 되지만 이건 그냥 어쩔 수 없는 것 같다 하나하나 열심히 바꿔보고, 따라 적고 할 수밖에 . .
내일은 통계 끝내고 머신러닝 시작해야쥐
고생했따리따
💿오늘의 추천곡 Johnny Stimson - Empty Apartment

팀원분이 스크럼에 추천곡을 남겨 두셔서, 아티클 스터디 하고 남는 시간에 들어봤따 lo-fi한 느낌이라 좋았음
맨날 희린님이 오늘의 한마디 챙겨 적어주셨는데, 이제 돌아가면서 추천곡 하나씩 적기로 했다 조아조아요
주말에 오랜만에 친구 만났는데 요즘 노래는 뭐 좋아하냐 물어봐서 요즘 거의 안 듣고 취향도 없어진 것 같다니까 엄청 혼났음 (ㅋㅋ) 이 기회로 오랜만에 노래 들을수 있어서 좋았다 암튼 헤드셋이나 빨랑 고쳐야징
고생했서욕~!~! 수2님의 정리덕분에 스탠다드 복습했돠 넘 고마워욧