데이터 분석 TIL - 기초 프로젝트 주제 선정

테리·2025년 11월 20일
post-thumbnail

1. 학습 키워드

기초 프로젝트 주제선정

2. 학습 내용

초기 상황

발표날짜를 제외하면 약 1주일 이라는 짧은 기간 동안 프로젝트를 진행한다. 총 7가지의 주제 중에서 한가지를 선택하기 위해 팀원 각자가 주제에 대해 생각해보고 의견을 모았다.

5명의 팀원이 개인당 2~3개의 주제를 선택해왔는데 거의 모든 주제의 득표가 동일하여 그중 한 표라도 더 많은 서울시 부동산 실거래 데이터를 활용한 주제로 프로젝트를 진행하기로 했다.

주제 선정 이유가 명확해야 한다

이전 직무의 경험, 개인 사업, 데이터 관련 부트캠프를 통해 내가 얻게된 하나의 결론은 명확한 이유가 명확한 방향성을 제시한다는 것이다.

분석할 꺼리가 많아서? 여러가지 시각화를 해볼 수 있으니까? 그건 공부의 관점이지 분석 프로젝트의 관점이 아니다. 물론 다수결에 의한 주제 선정이었지만 다수결이기 때문에 분석을 하겠다는 것은 나중을 위해서라도 절대 좋지 않다고 생각했다.

"캠프 과정에서 분석 이유, 목표 설정, 기대효과를 제출하라고 했으니까 그냥 하는거야"

행위를 위한 행동은 우리 스스로 우리를 갉아먹는 것이라고 생각했다. 아무리 다수결에 의한 선정이라도 그럼 우리는 왜 이 주제를 분석해야 할까? 그 이유를 명확히 하는게 이후의 분석 방향에 있어 가장 중요한 요소라고 생각했기에 왜 우리가 이 단계를 명확히 정의해야 하는지 강하게 어필하며 팀원의 참여를 이끌어 냈다.

마음 한편으로는 귀찮아 하는 사람도 있을 수 있다고 생각했다. 미안한 마음도 들었다. 하지만 우리는 캠프를 수료하기 위해서가 아닌 그 이후를 바라보는 것이기에 우리 모두를 위해 귀찮은 과정을 조금 더 구체화하는 과정을 진행했다.

프로젝트 기획과 방향성

부동산 실거래 분석을 통한 투자 성향 별 고객 맞춤 매물 제안

우리가 진행하게 될 프로젝트의 러프한 기획이다. 프로젝트 주제나 방향성에 대해 얘기를 나눌때 정말 세세하게 '지역을 무슨 단위로 나눠서 볼지', '금액을 얼마 단위로 나눠서 볼지' 이러한 이야기들이 오가기도 했다.

구체적으로 투자 성향을 어떤 기준으로 나눌지 그 기준 지표를 위해 어떤 분석을 해야할지도 정해야 하지만 아직은 공백 상태로 분석을 진행할 예정이다.

우리는 현재 데이터가 어떤 경향과 추세를 보이는지 모른다. 그런 것 까지 지금 단계에서 정하는건 아니라고 판단했다. 실제 데이터를 보면 애초에 우리가 생각한 방향과 전혀 다를 수도 있기에 큰 틀에서 각 데이터를 살펴보며 분석을 진행하기로 했다.

이 과정에서 프로젝트의 방향성이 바뀔수도 있고 타겟층이 바뀔수도 있겠지만 멘토님 또한 초기 기획을 러프하게 잡고 분석을 진행하며 방향을 조율하는 것을 추천했기에 우선 지금의 방향을 유지하기로 했다.

프로젝트의 목적과 목표

이 프로젝트를 통해서 어떤 가치를 만들 수 있는가? 기대 성과는 무엇인가?

부동산 실거래 데이터를 기반으로 거래 특성과 추세를 분석함으로써 고객별 투자 성향에 따른 적합한 투자 전략을 제안합니다.

부동산 거래 데이터 분석을 통해 지역적 특성, 년도별 특성, 매물별 특성 등을 통해 서로간의 상관 관계, 인과 관계, 경향성 등을 파악할 수 있다. 이를 통해 투자 성향에 따른 매물 지역, 금액 등을 제안할 수 있고 이는 감에 의한 의사결정이 아닌 데이터 기반의 전략을 세울 수 있는 기대 성과를 가져올 수 있다.

전체적인 과정은 아래와 같이 진행될 것 같고 프로젝트가 잘 진행됐으면 좋겠다.
‘데이터 전처리(데이터 정체 및 변환) - EDA(데이터 탐색 및 시각화) - 인사이트 도출 - 투자 유형별 맞춤 전략 제안’

3. 배운점

  1. 처음부터 데이터 분석의 기획을 너무 구체적으로 잡으면 안된다. 우리가 세운 가설이나 문제점이 실제 데이터와는 다를 수 있기에 대략적인 기획을 바탕으로 접근을 하면서 그 안에서 가설과 인사이트를 통해 방향성을 잡아가는 것이 좋다는 것을 느꼈다.

0개의 댓글