[데모데이 프로젝트] 프로젝트 회고

young·2022년 11월 22일
1

회고 및 피드백

목록 보기
4/7
post-thumbnail

프로젝트 개요

주제

신생 요식업체를 위한 홍보 및 운영 방식 컨설팅

프로젝트 기간

  1. 12 ~ 11. 09

추진 배경 및 목적

  • 데잇걸즈 데모데이 프로젝트 진행
  • 핫플레이스에 요식업 창업을 하는 사람을 위한 효율적인 식당 운영, 홍보 방식 조언

프로젝트 정의

  • 신생업체에 필요한 것이 무엇인지 식당 리뷰 플랫폼의 리뷰 텍스트 분석을 통한 분석
  • 네이버 플레이스, 카카오맵, 트위터를 리뷰 플랫폼으로 선정
  • 플랫폼별 리뷰 특성과 긍부정 평가별 리뷰 특성 분석
  • 분석 결과를 기반으로 신생 업체에 대한 운영 방식, 홍보 방식 조언

분석 과정 및 결과

분석할 식당 선정

  • 서울 시내 핫플레이스로 떠오르고 있는 성수를 식당 창업 지역으로 선정
  • 식당 창업에 참고할만한 식당으로 성수 시내 유명한 식당 10개 선정

리뷰 텍스트 스크래핑

  • selenium, beautifulsoup, snscrape 모듈을 이용하여 네이버 플레이스, 카카오맵, 트위터 식당 리뷰 텍스트 스크래핑

텍스트 전처리

  • koNLPy 패키지의 okt를 이용하여 필요없는 텍스트 제거, 한국어 텍스트 토큰화

리뷰 텍스트 정서 분석

  • kcElectra 모델을 이용한 문장 정서 44개 분석
  • 식당 리뷰에 영향이 크지 않다고 생각되는 중립 정서를 제외하고 긍부정 정서로 나누어 긍부정 점수 부여

긍부정 감성별 단어 빈도 분석

  • 긍부정 리뷰에서 많이 언급된 단어 빈도 분석
  • 단어 빈도 분석 후 워드클라우드 생성

리뷰 플랫폼, 감성별 토픽 모델링

  • 플랫폼별, 긍부정 리뷰의 특징 분석을 위한 토픽 모델링 실행
  • countvectorizer로 벡터화 실시
  • LDA로 토픽 모델링 시행

산출 결과

  • 위생, 맛, 인테리어, 웨이팅과 관련한 운영 방식 조언
  • 리뷰 플랫폼 특성을 반영한 바이럴 마케팅 방식 조언

내가 기여한 것

  • 전체 분석 방법론 및 분석 구현 리드 (TL)
  • 모든 스크래핑 프로그램 구현
  • 딥러닝 모델 분석 구현 및 분석
  • 단어 빈도 분석 코드 작성
  • 토픽 모델링 코드 구현 및 모델링 시행
  • 분석 결과 해석

KPT 회고

K [현재 만족 및 이어갔음 하는 부분]

  • 프로젝트 완료 후에도 간직하고 싶은 잘했던 것 / 좋았던 것

팀 문화

  • 피드백과 수용이 빠름
  • 의사소통이 빠르고 서로에 대한 지지가 강함
  • 질문을 두려워하지 않고 각자 잘하고 못하는 부분을 파악하여 업무 분담
  • 배우는 것에 주저함이 없고 좋은 분석을 위해 배우고자 하는 열정이 높았음

분석 주제에 대한 몰입

  • 맛집이라는 주제에 대해 모든 팀원들이 열정적으로 임함
  • 구체화된 주제를 만들기 위해 지속적인 논의가 이루어짐
  • 프로젝트에 대한 열의가 높았음

구체적 성과를 위한 빠른 프로세스 변경

  • 프로젝트를 진행하면서 뾰족한 기대 성과와 인사이트를 위해 프로세스를 빠르게 변경함
  • 어떤 인사이트를 줄 것인지 지속적으로 고민하며 그에 맞는 효과적인 분석 방법을 고민하고 빠르게 방향을 변경함

기대 성과를 위한 여러 분석 방법 시도

  • 어떤 분석 방법이 가장 좋은 것인지 서로 논의하여 가장 좋은 분석 방법을 적용하는 방식으로 프로젝트 진행

P [개선이 필요한 부분]

  • 프로젝트 중 겪었던 어려움(기술, 소통, 협업, 에러 등 프로젝트 진행 관련된 그 어느것이든) / 프로젝트 완료 후에도 아쉬움으로 남는 것

주제 확정이 늦어짐

  • 프로젝트 도중 주제와 분석 방향을 완전히 바꿈으로써 프로젝트 수행 시간 감소 및 완성도 저하
  • 주제 변경 이후 주제 구체화를 위한 시간이 소요되며 분석 시간 감소

데이터 수집에 오랜 시간 소요

  • 스크래핑 과정에서 시간이 너무 많이 소요됌
  • 데이터 수집에 시간이 많이 소요되어 분석 시간이 부족하여 좋은 분석을 하기 어려워지는 결과로 이어짐

데이터 핸들링, 테크 스킬 부족

  • 텍스트 데이터 분석이 처음이기에 전처리, 분석, 분석 결과 해석 전 과정에서 여러 시간이 소요되었고 어떻게 진행하는 것이 맞는가에 대한 고민을 계속함
  • 부족한 텍스트 분석 능력으로 딥러닝 모델과 여러 어려운 분석 방식을 이용했음에도 이를 제대로 이용하고 해석하지 못함

뾰족하지 못한 인사이트

  • 분석 결과에 대한 해석 시간이 부족하여 당연하지 않은 결과 해석보다는 당연한 해석에 초점이 맞추어짐
  • 구체적이기보다는 포괄적인 결론

T [P에 대한 해결책]

  • Problem 중 해결된 사항에 대한 해결 방법 / 해결되지 않은 사항에 대한 피드백

효율적인 주제 구체화

  • 추후 프로젝트를 진행하는 경우 효율적인 프로젝트 주제 확립 및 구체화 과정을 거쳐야 할 것

지속적인 공부와 학습

  • 테크 스킬에 따라 분석 수준이 달라지므로 계속해서 테크 스킬 높이기

인사이트를 생각하며 분석 진행

  • 내가 진행중인 분석 과정을 통해 어떤 인사이트를 줄 수 있을 것인지 고민하면서 분석하기

배운 점 및 느낀 점

데이터 분석은 해석과 인사이트다

데이터 분석은 어떤 해석과 인사이트를 내리는지에 따라 달라짐을 더 철저하게 배웠음

텍스트 분석은 주관이 들어갈 수 밖에 없다

어느 정도 객관화가 되어있고 수리적 기반이 들어간 정형 데이터 분석과 다르게 텍스트 분석과 해석은 주관성이 많이 개입되어 초반에 적응하지 못했음
강사님께 지속적인 피드백을 요청하면서 결국 주관성이 개입될 수 밖에 없구나 깨달음

배워도 써먹지 못하면 소용이 없다

열심히 무언가를 찾고 적용했지만 올바른 적용 방법과 해석 방법을 알지 못해서 어렵게 공부한 분석을 제대로 써먹지 못한듯함

스크래핑과 텍스트 분석은 노가다가 전부

스크래핑 구현과 텍스트 분석 전체 과정에서 기계보다는 사람 손으로 일일히 확인하고 작업해줘야 하는 부분이 많았음

profile
한 걸음씩 쌓아가는 데이터 분석

0개의 댓글