keystrokes - Intro

Tony Lee·2023년 3월 9일
0

keystrokes

목록 보기
1/2
post-thumbnail

Inception

Keystrokes(가제)는 제 주변인의 사업에서 영감을 받아 시작하게 된 프로젝트이다. 그 분이 새로운 술 "가무치"를 출시했는데, 가무치를 다른 술들과 비교하면 어떤 데이터가 나올까? 라는 생각이 들었다.
예를들어, 대부분의 사업가는 자신이 출시한 제품의 시장조사를 편하게 하고 싶을 겁니다. 맥킨지 리포트, 트렌드 코리아, 네이버, 등 많은 Source가 있지만,

실시간이 아니라는 점이 가장 눈에 띄고 우리는 쉬운 정보 전달과 검색에 너무 익숙해졌다.

목적

어떠한 키워드를 검색 했을 때, 그 키워드의 주요 소비층, 연령대, 최근 소비 트렌드 그리고 다른 비슷한 제품과의 경쟁률을 제시해주고 싶었다. 사실 위 기능은 이미 네이버 데이터랩에 있지만, 쇼핑 데이터를 접합하지 않았고, 연관 검색어를 추천해기보단, 비교 검색어를 직접 입력하는 방식으로 제시합니다.

이를 보완하기 위하여, Naver API와 Google API를 접목시켜 추천 검색어와 비교 가능하게 하는 것이 목적이다.

Diagram

위 그림과 같이 프로세스 자체는 매우 쉽다. 유저 input (keyword, startDate, endDate, gender, device, age)을 받아서, Google Cloud Search API에 입력 후 연관검색어 리스트 추출, 그리고 그 리스트를 기반으로 Naver API에서 소비자 정보 및 검색 추이를 추출한다.

연관검색어에 Google API를 사용하는 이유는, Naver API에서 제공하지 않기 때문이다. ㅠㅠ

Visualize 파트에서는 각종 그래프를 제시할 예정이다. 개인적으로 워드 클라우드는 선호하지 않기 때문에 제공하지 않을 것.

Takeaways

from this project.

이 프로젝트를 진행하면서 API 사용에 익숙해지고, 군 생활동안 다루지 못한 pandas, numpy, matplotlib, 등 각종 라이브러리를 사용한다는 점이 좋다.

그리고 웹 구현 완성단계까지 완료하면 실제 비지니스 니즈가 생길 것 같다.

바램

  1. 데이터 엔지니어링에 맛을 보고 싶어서 Apache Spark를 사용한 ETL을 어딘가에 끼워넣고 싶지만 가능할지 모르겠다.
  2. 머신러닝 알고리즘을 검색어 추천에 하고 싶었는데 이미 구글에서 해주었고, raw data 엑세스는 없기 때문에 다른 적용점을 찾아야한다.

오늘 끝!

다음 글은 아마 코드 짜는 것으로 쓸 것 같네요 ㅎㅎ

profile
Striving to have a positive impact on the community

0개의 댓글