2024-08-09

강대·2024년 8월 9일
post-thumbnail

안녕하세요 아주 오랜만에 돌아왔죠 ^~^


최종 프로젝트를 시작하면서
두 명이서 좌충우돌🤪이래저래🥵빙🫠글빙글🌀헤롱헤롱🌈 해서
TIL에 신경을 못 썼네요..

오늘 오후에 중간 발표회를 마쳐서
그나마 좀 여유로운 상태라 쓰러왔습니다 !!
그동안 진행했던 프로젝트 사안들 말씀드리겠습니다






♾️ 데이터셋 전처리


import pandas as pd
import numpy as np
df = pd.read_csv('/Users/8_최종프로젝트/포천시_지역화폐.csv')

# 기준년월 | 성별 | 연령대 | 지역코드 | 읍면동 코드 | 읍면동 명 | 결제건수 | 결제금액 | 카드 결제 금액 | 휴대 이용자수 | 휴대사용금액 
# 컬럼 순서 변경
new_order = ['crtr_ym', 'usage_rgn_cd', 'emd_cd', 'emd_nm', 'par_gend', 'par_ag', 'stlm_nocs', 'stlm_amt', 'card_use_amt', 'mbl_user_cnt', 'mbl_use_amt']
pi = df[new_order]
pi
>> 24105 rows × 11 columns

# 결측치 확인
pi.isnull().sum()
>>
crtr_ym         0
usage_rgn_cd    0
emd_cd          0
emd_nm          615
par_gend        1,525
par_ag          142
stlm_nocs       0
stlm_amt        0
card_use_amt    0
mbl_user_cnt    0
mbl_use_amt     0

emd_nm          615 >> pi['emd_nm'].fillna('포천시 기타', inplace=True)
par_gend        1,525 >> 결측값이 매우 적거나 범주형식
par_ag          142   >> 결측값 모두 삭제

# 1개의 row는 한 사람의 데이터가 아닌 지역화폐 가맹점 별 결제 데이터였음

# row합치기
# 데이터프레임을 기준으로 합치기
df = pi.groupby(
    ['crtr_ym', 'par_gend', 'par_ag','usage_rgn_cd', 'emd_cd' ]
).agg({
    'emd_nm' : 'first',
    'stlm_nocs': 'sum',
    'stlm_amt': 'sum',
    'card_use_amt': 'sum',
    'mbl_user_cnt': 'sum',
    'mbl_use_amt': 'sum',
}).reset_index()
>> 가맹점 결제 정보와 관련된 컬럼은 그룹화
>> 결제와 관련된 컬럼은 총합
df.info()
>>
crtr_ym           0
par_gend          0
par_ag            0
usage_rgn_cd      0
emd_cd            0
emd_nm            0
stlm_nocs         0
stlm_amt          0
card_use_amt      0
mbl_user_cnt      0
mbl_use_amt       0

# 새로운 컬럼 생성
#카드이용비율
df['card_use_ratio'] = df['card_use_amt'] / df['stlm_amt']
#휴대이용비율
df['mbl_use_ratio'] = df['mbl_use_amt'] / df['stlm_amt']
#휴대이용건당 금액
df['mbl_use_amt_per_user'] = df['mbl_use_amt'] / df['mbl_user_cnt']
#평균결제금액(건당예상금액)
df['avg_stlm_amt'] = df['stlm_amt'] / df['stlm_nocs']

최종 데이터셋 2542 rows × 15 columns





♾️ 가설검정


1️⃣ 성별로 주로 사용하는 업종이 다를 것
-- 지역화폐 데이터셋에선 업종이 나와있지 않음

2️⃣ 지역적으로 지원이 더 높은 곳은 사용률이 더 많을 것
= 정책 별로 사용률이 다를 것

인센티브 현황 참고
https://www.gmoney.or.kr/base/gmoney/insentive/index?menuLevel=2&menuNo=72


3️⃣ 30-40대 사용빈도가 높을 것

수원시 총 인구 1,197,257명
10대 - 113,383명
20대 - 175,839
30대 - 184,342
40대 - 195,012
50대 - 202,330
60대 - 146,108
- 실제인구  50대>40대>30대
- 지역화폐 사용빈도 40대>50대>30대


포천시 총 인구 143,323명
10대 - 10,499명
20대 - 16,074명 
30대 - 13,767명
40대 - 17,319명
50대 - 27,974명
60대  - 29,240명
- 실제 60대>50대>40대
- 지역화폐 사용빈도 50대>40대>60대
 
 
하남시 총 인구 329,861명
10대 - 31,773명 
20대 - 35,977명
30대 - 51,573명
40대 - 61,110명
50대 - 48,250명
60대 - 41,700명
- 실제인구 : 40대>30대>50대
- 지역화폐 사용빈도 : 40대>60대>30대

>> 가설에서 크게 벗어나는 정도는 없음

4️⃣ 마트에서 사용하는 빈도가 높을 것
-- 현재 지역화폐 데이터셋으로 서칭 불가
-- 일반 카드사 데이터는 종합소매점(대형마트/백화점)이 높음


5️⃣ 명절에 다른 기간보다 사용량이 증가할 것
-- 지역화폐 사용금액을 전월대비 비교해보면
-- 세지역 모두 8월 대비 높은 사용
-- 전월대비 높을 뿐 9월이 유독 사용량이 증가한 건 X

- 지역화폐 전월대비 사용 증가율

- 일반카드 데이터 월별 사용금액 그래프



6️⃣ 지역가맹점이 많은 지역에서 더 사용량이 많을 것
-- 지역별 지역화폐 가맹점수 확인

► 2023년 수원 지역화폐 가맹점 수 : 36,857개
► 2023년 하남 지역화폐 가맹점 수 : 9,901개
► 2023년 포천 지역화폐 가맹점 수 : 7,043개

수원 | 하남 | 포천
수원 여성 결제 금액 144,186,528,218 | 수원 남성 결제 금액 122,553,378,770
하남 여성 결제 금액 58,596,506,096 | 하남 남성 결제 금액 46,749,471,467
포천 여성 결제 금액 11,915,606,533 | 포천 남성 결제 금액 12,677,272,801

8️⃣ 지역화폐 사용률은 점차 증가하는 추세일 것
-- 경기도 전체적으론 증가하지만
-- 수원, 하남, 포천의 경우 감소하는 추세


🔟 여성 사용자가 많을 것
-- 포천 제외

포천 총 인구 143,323명
포천 남성 인구 75,837명
포천 여성 인구 67,486명
(남성 52.91%
여성 47.09%)






이렇게 발표도 마무리 되었는데요 ,,
중간 발표라도 지나니 숨통이 조금 트이네요
이번 주말은 그래도 덜 신경쓰고 쉬어야겠습니다 !!

다들 마지막 최종까지 화이팅입니다 🍀🍀🍀

profile
걍 달려

0개의 댓글