[25.03.25] 본캠프 25일차 기초프로젝트_ 시각화시작+심화분석

김명서·2025년 3월 25일
2

TIL_sparta

목록 보기
46/60

기초프로젝트

시각화

Marplotlib 한글깨짐 해결법
글에 나온대로 따라했는데 !! 왜 자꾸 안돼지 !!! 했는데,, 스페이스 때문이었다..!


이 밑에 두 글을 보며 알 수 있었다. ㅠㅠ
-rf
한글폰트 설치
.
.
제작한 시각화 자료

송파구가 2022 이후 증가추세임.
내가 이보다 중요하다고 생각하고 있는것은, 앞으로이다.

서울부동산 시장 월간동향

서울부동산 시장 월간동향 (2025년 2월 28일)을 참고해보면,

한강 주변을 중심으로 국지적인 상승세는 관측되지만, 전체 아파트 시장의 매매가격
상승률은 지속적으로 축소되고 있음. 송파구가 0.26%로 최고 상승률을 보이며,
이어서 서초구 0.18%, 용산구 0.15%로 높게 나타나고, 도봉·노원구는 –0.11%의 변동률
을 보임. 아파트 평균 매매가격은 11.27억원으로 상승

또한 토허제 역시 주목해볼만한 포인트! (시사반영)

서울생활권계획

서울도시공간포털>서울생활권계획을 참고해서,
권역생활권별 발전구상안을 조사했다.

동남권: 글로벌 경쟁력 강화 및 기존 주거지의 계획적 관리 도모
etc( 이 외 내용은 노션에..)

아무튼, 이부분도 지역선택 매력도를 높여줄 수 있을 것 같다.
서울도시공간포털

의뢰인에게 줄 참고사항과 주의점



❗❗❗매매, 전세 모두 가격/거래량 변동률 → 동남권이 가장 높음.
.
.

🔻송파구를 더 뜯어보면


거래량 top 5인 잠실,가락,신천,문정,장지 로 심화분석을 진행하기로!

✔ 거래량이 많은 법정동을 후보지로 설정하는 이유

단순한 인기 지역 선정이 아니라, 실거주 목적을 고려한 ‘수요 기반 입지 분석’
간단히 정리하자면
1.수요와 시장의 반영
2.개발 및 미래 가치
3.가격 안정성과 유동성 확보

.
.
.
+참고!
시각화 정리본 seaborn

3시 회의 진행
:각자 분석 현황 피드백 + 수요일 오후 2시까지 분석 마무리 / 역할분담

심화분석

데이터 점점 필터조건 걸어서, 구체적 매물 찾기 시작.
(거의 방구석 구해줘 홈즈임)


와 .,. 가락동에 한 아파트 매물이 28개라, 평수별 가격대로 나눠서 보고싶어서 코드를 짜봤는데.. 다른 동들이랑 비교할만한 것 같아서.. 다시 다섯개 동 모두 이작업을 해줬다.
내일 오전엔 이 결과를 바탕으로 시각화를 해야할 것 같다.

# 거래량 상위 5개 법정동으로 필터링
top5_regions = ['잠실동', '가락동', '신천동', '문정동', '장지동']
df_top5_region = df_songpa_filtered[df_songpa_filtered['법정동명'].isin(top5_regions)]

# 결과 확인
print("상위 5개 법정동 데이터 행 개수:", len(df_top5_region))
print("\n법정동명 분포:")
print(df_top5_region['법정동명'].value_counts())

#잠실
df_jamsil_apart = df_top5_space[(df_top5_space['건축년도'] >= 2010) & (df_top5_space['법정동명']=='잠실동')]
df_jamsil_apart = df_jamsil_apart.drop(['취소일','신고구분','신고한 개업공인중개사 시군구명','권리구분','토지면적(m²)'], axis=1)
df_jamsil_sorted = df_jamsil_apart.sort_values(by='건물명')

df_jamsil_sorted

# 건물면적 구간 설정
bins = [0, 29.99, 39.99, 49.99, 59.99, 69.99, 86.99, float('inf')]  # 구간 경계
labels = ['0~29', '30~39', '40~49', '50~59', '60~69', '70~86', '87+']  # 구간 라벨
df_jamsil_sorted['면적구간'] = pd.cut(df_jamsil_sorted['건물면적(m²)'], bins=bins, labels=labels, include_lowest=True)

# 면적 구간별 물건금액 평균 계산
price_by_area = df_jamsil_sorted.groupby('면적구간')['물건금액(만원)'].mean().reset_index()

# 결과 출력
print("건물면적 구간별 평균 물건금액 (만원):")
print(price_by_area)

# 구간별 출력
print("\n구간별 평균 물건금액 (만원):")
print(price_by_area[price_by_area['면적구간'].isin(['30~39','40~49', '50~59', '60~69', '70~86'])])


건물명이 여러개 나오는 법정동이 분명히 존재하기에, 면적단위를 나눠, 물건금액의 평균을 비교한다면,
의뢰인에게 보다 디테일한 가격 제안을 줄 수 있을 것 같다고 생각해서 작업해봤다.

위 코드는 잠실 코드이고, 나머지 4개의 동도 진행해서
총 5개를 완성하고
여기에 나온 매물들을 직접 네이버부동산에서 위치를 찾아서, 지도에 표시해봤다!


주변 인프라 위치도 추가하면, 중요시하는 인프라 근처 매물을 선택하는 데 도움이 될 것 같다고 생각한다.


느낀점&회고

심화분석을 하다가, 송파더센트레(위례22단지),위례22단지(비발디) 미처 전처리를 하지 못한 것들을 발견할 수 있었다. 애초에 이건 법정동을 뜯어보지 않으면 알 수 없는 것 같다.. 전처리는 정말 끝이 없구나 !! ㅠ 그래도 이건 이번 프로젝트의 배울점(?)으로 의미있게 남겨두려한다...ㅠ
내일 흐름 통합 + 시각화/심화분석 마무리를 잘 해서 ..! ppt작업도 잘 시작해봐야겠다.
늦었으니 얼른 자야지 !!!

profile
경영학도의 데이터분석 성장기💥

0개의 댓글

관련 채용 정보