
친구가 젤 맛있었다 한 레몬 마들렌..
오늘은 정말 한일이 없는듯..
merge 테이블을 만들어야 하는데 내 컴퓨터에서 30분이 넘어가고.. 그걸 갖고 분석을 시작할텐데 일단 컬럼이 많을 뿐 아니라 튜터님 피드백을 받고 나니 더 추가되게 생겼다..
아침에 노션에 이때까지 한거 정리하고 geopandas로 지도 시각화를 하고 있는데 과연 유의미한 결과가 도출될 수 있을지 ..
최종 피처 결정도 해야하고 시각화 자료도 보충해야할 것 같은데 ~.. 모르겠다 ㅜㅜ 막막해.. 할게 많은데 뭐부터 시작해야 할지..
https://eletronicprogrammer.tistory.com/49
일단 포기하고 튜터님이 알려주신 다른 시각화 방법을 알아봤다. folium이라는 라이브러리를 사용하는 것.
# 지도 중심을 설정 (평균 위도/경도로)
center_lat = loc['latitude'].mean()
center_lon = loc['longitude'].mean()
# folium 지도 생성
m = folium.Map(location=[center_lat, center_lon], zoom_start=6)
# 위도/경도 기준 마커 추가
for idx, row in loc.iterrows():
folium.CircleMarker(
location=[row['latitude'], row['longitude']],
radius=3,
color='blue',
fill=True,
fill_color='blue',
fill_opacity=0.6
).add_to(m)
# 결과 보기
m

이렇게 지도 배경으로 전체적인 밀도를 파악할 수 있다
from folium.plugins import HeatMap
# 중심 좌표 설정 (예: 미국 중부 또는 데이터의 평균값)
center = [loc['latitude'].mean(), loc['longitude'].mean()]
# 지도 객체 생성
m = folium.Map(location=center, zoom_start=5)
# HeatMap 데이터: [lat, lon] 리스트 형태
heat_data = loc[['latitude', 'longitude']].values.tolist()
# HeatMap 추가
HeatMap(heat_data).add_to(m)
# 지도 보여주기
m

히트맵 형식으로 파악하면 이렇게 ..
이제 이걸 merge 한 데이터로 적용해야되는데..~
card 테이블도 시각화를 해봤다

고소득자와 마찬가지로 credit_limit 이 극단적인 극소수 -> 프리미엄 회원?

- 체크카드 > 신용카드 > 선불카드 순으로 사용중
- Visa, Mastercard가 전체 이용객 중 대다수
- 대다수는 마그네틱 카드 사용
- card_on_dark_web yes인 값 없음 → 제외 가능
앞으로 최종 피처 결정 -> 최종 피처 데이터 검증 -> base 모델 제작 -> 검증/확인 -> 모델링 고도화(base 모델에 비해 향상 확인) -> 마무리 분석 의 단계로 진행될 듯 한데..
일단 파생변수 생성하고 머신러닝 돌리는거 시도부터 하고 자야겠다 파이팅