엑셀 > 데이터의 기록과 관리가 목적
RDBMS와의 공통점
차이점
주요포인트 : 우리는 이미 엑셀로 데이터를 다루고 있다
엑셀과 RDMBS의 공통점과 차이점을 알게 되었다!
용어 | 설명 |
---|---|
변수 | 측정 가능한 대상의 속성 (예: 나이, 성별, 클릭 여부 등) |
독립변수 | 원인이 되는 변수 (설명변수) ex) 버튼 색상 |
종속변수 | 결과가 되는 변수 (반응변수) ex) 클릭 여부 |
모수 | 모집단의 대표값 (평균, 비율 등) |
"모든 까마귀는 검정색이다" 라고 말하고 싶지만,
세상 모든 까마귀를 확인할 수 없음
표본을 보고 모집단을 추론
이 과정이 통계적 실험!
어떤 목적을 가지고 데이터를 수집 → 관찰 → 결론 도출
전수조사 불가능한 현실에서, 진실에 가까운 추론 하기
가설 세우기 → 실험 설계 → 데이터 수집 → 추론 → 결론
대표적인 실험 설계 방식
1️⃣ 고객 니즈 파악
2️⃣ 최소 투자 최대 이익 창출(ROI상승)
가입률, 재방문율, CTR, CVR, ROAS, eCPM
실험이 끝난 뒤 통계적으로 의미 있는가 를 따지는 것
버릴 것을 예상하는 가설
차이 없다 (기존 그대로)
귀무가설에 대립하는 명제
차이 있다 (변화 있음)!
신뢰수준의 반대 개념
귀무가설이 맞을때 잘못 기각할 확률
= 귀무가설이 맞을 확률
*95% 신뢰도를 기준으로 한다면 (1 - 0.95)인 0.05값이 유의수준!
항목 | 검정통계량 (Z, t 등) | p-value |
---|---|---|
정의 | 귀무가설을 채택 또는 기각하기 위해 사용하는 확률변수 | 그 검정통계량이 나올 확률 값 |
역할 | 표본이 얼마나 극단적인지 수치로 표현 | 극단적인 결과가 우연히 나올 확률 |
형태 | 보통 Z값, t값, F값, χ²값 같은 수치 | 0 ~ 1 사이의 확률 값 |
활용 | 이 수치를 기반으로 p-value 계산 | p-value < 유의수준(0.05) → 대립가설 채택 |
극단적이다 = 평균에서 멀리 떨어졌다
오늘도 동진님께 감사를..^^
이름 | 키 | 몸무게 | 혈압 |
---|---|---|---|
A | 170 | 60 | 120 |
이름 | 항목 | 값 |
---|---|---|
A | 키 | 170 |
A | 몸무게 | 60 |
A | 혈압 | 120 |
함수명 | 변환 방향 | 설명 |
---|---|---|
melt() | Wide → Long | 컬럼을 행으로 녹임 |
stack() | Wide → Long | 컬럼을 인덱스로 이동 |
unstack() | Long → Wide | 인덱스를 컬럼으로 이동 |
.T (transpose) | 행 ↔ 열 | 전체 테이블 전치 |
df.T
pd.pivot_table(
df,
index='A', # 축
columns='B', # 열
values='C', # 값
aggfunc='sum' # or mean, count 등 연산방식
)
groupby
느낌인데 더 표처럼 보기 좋음sum
, mean
, count
, max
, min
, ...)데이터 프레임 재구조화 메서드1
df.melt(
id_vars=['기준 컬럼'],
value_vars=['녹일 컬럼1', '녹일 컬럼2'],
var_name='항목',
value_name='값'
)
데이터 프레임 재구조화 메서드2
df.stack(level=-1, dropna=True)
# level : stack을 수행할 인덱스 레벨 지정 > 마지막 인덱스 레벨 사용
# dropna : 스택 수행 결과에서 결측값 제거 여부
데이터 프레임 재구조화 메서드3
df.unstack(level=-1, dropna=True)
stack
의 반대동작Python - 최대공약수와 최소공배수
Python - 3진법 뒤집기
SQL - 헤비 유저가 소유한 장소
코드카타 64-65✅
코드카타 39-40✅
세션 1회차 복습✅
세션 2회차✅
기초강의 3주차❌
스탠다드 1회차✅
우수 TIL에 선정되었습니다💟
와하하 앞으로도 열심히 써야지 500포인트 너무 달고~~
수업 하루에 세 개 들으려니까 좀 힘들었다
내일 QCC 대비하려면 SQL 코드카타 좀 더 풀고 자야하는데 힘이 너무 빠져서 조금만 쉬었다가 풀어야지.. 😅
내일 QCC 만점 받아보자 파이팅‼️