데이터 수집의 기록

eenimeeniminim0·2022년 4월 25일
1
post-thumbnail

"kaggle말고, 쓸만한 데이터로 proposal 준비해주세요."

청천병력 같은 교수님의 말씀...

" 교수님, kaggle만큼 좋은 데이터 저장소는 없어요...."

자, 본격적인 팀프로젝트 시즌이 왔다.
데이터 분석의 시작은 자고로 데이터를 찾는것 부터 시작이니까

데이터 수집의 기록을 적어본다.

1. 내 인생의 동반자, 카페인에서 시작하자

스세권의 파워가 어떤지 확인해보자

예전에 스타벅스 위치 데이터 파이썬 소스코드를 본 기억이 스쳐지나갔다.
'스타벅스 효과' 정말 존재할까?
역시 내가 처음이 아니다.
folium - 스타벅스와 이디야 입지 시각화

커피 신메뉴 개발을 꼭 맛잘알이 해야할까? 데이터로 분석한다면?

이라는 생각이 들었다.
기존 대형 프렌차이즈의 메뉴 성분 정보를 기반으로 연관성분석을 돌리면
우리가 상상하지 못한, 엄청난 메뉴가 탄생하지 않을까?
(물론 괴상한 메뉴가 나올 확률이 99%...)
카페 모든 메뉴 가져오기

커피와 코딩은 필수불가결의 요소이니까

이런데이터가 있는줄은 또 처음알았다.
코딩하면서 날밤을 얼마나 샜던가!
1에 가까운 상관관계를 보이지 않을까?
안보이면...어떡하지..?
코딩과 커피의 상관관계를 데이터로 시각화 해보았다

2. 제공해주는 사이트가 있다면 땡큐지

역시 개발자들의 피,땀,눈물이 어린 사이트야 말로 찐이다

네이버 트랜드만 알고 있었는데, 구글은 물론 카카오에서도 트렌드 서비스를 제공한다.
심지어 기간과 키워드 조회는 물론 csv파일로 다운로드까지...
개발자 여러분...구축을 위해 얼마나 힘쓰셨나여
감사합니다
네이버/구글/카카오 트렌드 서비스 비교 - 기능편 : 다이티 데이터 마켓 - 콘텐츠

3. 내 경력을 살리고 살리고

매출 데이터는 내 친구였으니까

전략 영업팀과 함께 일한 경력이 있는데, 매출 데이터 한번 분석해보자는 생각해 구글신에게 물어보니
나에게 대답해주었다.
서울특별시 빅데이터 캠퍼스

4. 밑장 빼기냐?

최후의 보루

만약에 아무것도 정하지 못한다면... 뭐라도 해야하지 않을까?
누구보다도
"코딩은 ctrl+c/ctrl+v에서 시작한다"
를 믿고 있다.
여기가 base line이다.
https://github.com/corazzon/OpenDataWrangling

profile
데이터와 사회과학 사이를 여행하는 히치하이커를 위한 안내서

0개의 댓글