2024-06-03

강대·2024년 6월 3일

안녕하세요 😇😇
다들 주말 잘 보내셨나요
진짜 6월이네용 ,,,,

부트캠프 진행하면서 이제 한 다음주,,? 다다음주 정도면
진짜 정신없이 보낼 것 같아요

벌써 두렵내요 🥲

♾️ f-string

f-string은 사실 그동안 데이터 시각화하면서 자주 쓰긴 했는데
정확히 어떻게 작용하는지 몰라서 알아봤습니다 !!

qwert = 'super'
tyty = 50
print(f"제 힘은 완전{qwert}쎄요. {tyty}만큼")

~~약간 말도 안되는 걸로 가져와봤는데요~~

f-string은 파이썬의 문자열 포맷팅 방법으로, 변수나 표현식을 문자열에 삽입됩니다
중괄호 {} 안에 변수나 표현식을 넣고,
포맷팅 옵션을 지정하여 원하는 형식으로 값을 문자열에 기재할 수 있습니다 !

그래서 위코드처럼 입력 시
제가 쓴 코드 그대로 값이 들어가 있는 걸 볼 수 있습니다

♾️ 통계학 실습 코드

위와 똑같은 f-string을 통계학 평균 강의에서 실습 코드로 보면

## 유저별 재방문 주기
revisit_freq_by_user = df.groupby("user_id").days_since_prior_order.mean()

revisit_freq_by_user_mean = revisit_freq_by_user.mean()
revisit_freq_by_user_median = revisit_freq_by_user.median()

print(f"단순 재방문 주기 평균: {revisit_freq_by_user_mean:.2f}일")
print(f"단순 재방문 주기 중앙값: {revisit_freq_by_user_median:.2f}일")

단순 재방문 주기 평균: 15.47일
단순 재방문 주기 중앙값: 14.69일


(실제 원본 일수)
15.469669692770578일
14.692307692307692일

위 코드는 평균의 평균 및 중앙값을 구해준 셈이라
원래는 정수였지만 실수로 생성이 됩니다 !

제가 처음에 만들었던 f-string 코드와는
조금 다르죠 ?!
뭔지 알아채셨나요 ?!

출력 시 맨 처음에 f를 입력해준 다음 문자열을 입력하고 끝냈었는데
이번에는 소수점과 마지막으로 f를 넣어서 총 f가 두번 들어갔어요

.2f는 소수점 둘째 자리까지 반올림하여 부동 소수점 숫자를 포맷팅하는 옵션
revisit_freq_by_user_ 변수를 소수점 둘째 자리까지 포맷팅하여 읽기 쉽게 출력

print(f"단순 재방문 주기 평균: {revisit_freq_by_user_mean:.0f}일")
print(f"단순 재방문 주기 중앙값: {revisit_freq_by_user_median}일")

단순 재방문 주기 평균: 15일
단순 재방문 주기 중앙값: 14.692307692307692일

이번엔 소수점 처리를 0으로 해봤고
소수점 포맷팅 없이 출력을 해봤어요 !

0으로 처리해주면 소수점없이 야무지게 정수로 처리해주고요
소수점 없이 포맷팅하면 ..
반올림 없이 모든 소수점까지 표기됩니다 ! ~~당연함~~

f-string으로 연산도 가능 !
~~당연함~~

♾️ 편차, 분산, 표준편차

너무 허접하지만,,
냅다 이게 데이터의 종류입니다 !

위 그래프는 둘 다 평균이 똑같습니다 !!
그치만... 뭔가,,? 다르죠?!
빨간선은 뭔가 넓은데 낮고
파란선은 짧은데 높고
근데 평균이 똑같아요

이거는
데이터가 WHERE=(어디에 존재하는가) 라고 생각됩니다

위 데이터를 가지곤 평균이 데이터의 대표가 되지 못한다고 생각되기에
저희는 분산과 편차 ‘HOW = 어떻게 존재하는가’에 대해 배우겠습니다 ~!!!

편차(deviation) : 하나의 값에서 평균을 뺀 값 = 평균으로부터 얼마나 떨어져 있는지

- A 학생의 국어점수 : 30점
- B 학생의 국어점수 : 70점
- C 학생의 국어점수 : 80점
- A, B, C 학생의 평균 국어점수 : 60점

> A 학생의 편차 : -30
> B 학생의 편차 : +10
> C 학생의 편차 : +20

분산(variance)/ 편차 제곱합의 평균
: 편차의 합이 0으로 나오는 것을 방지하기 위해 생성된 개념

- A 학생의 편차 제곱 : (-30)^2 = 900 (음수와 음수를 곱하면 양수)
- B 학생의 편차 제곱 : (+10)^2 = 100
- C 학생의 편차 제곱 : (+20)^2 = 400 

편차 제곱합 : 1400
편차 제곱합의 평균(분산) : 1400/3 = 466