서울빅데이터캠퍼스 방문기

Rocki_log·2022년 8월 19일
0

Project1_취향식탁

목록 보기
1/2
post-thumbnail

취향식탁 Week 1

1. 이용안내

서울빅데이터캠퍼스 홈페이지 (이하 빅캠으로 줄임)

1) 샘플데이터

  • 데이터설명서
  • 빅캠에서 활용할 수 있는 데이터의 목록과 설명이 담긴 설명서이다.
  • 데이터 목록은 총 318종이고(2022.08.19. 기준) 소비데이터, 유동인구 데이터가 많아 활용할 자료가 많다.
  • 샘플데이터로 프로젝트 활용 방안을 세우고 캠퍼스에 방문해 전체 데이터를 찾아볼 수 있고 반출 요청도 할 수 있다

2) 주요 데이터

연번구분데이터제공기관주기시간범위관리번호
1경제/금융서울시업종별내외국인 신한카드 매출데이터신한카드2017.01~2022.06B042
2경제/금융서울시민의 업종별 카드소비 패턴데이터신한카드2016.01 ~ 2022.06B063
3경제/금융서울시 15~17년 업종별 내외국인신한카드 매출데이터신한카드-2015.12 ~ 2017.11B041
4경제/금융서울시민 KCB 생활금융 통계KCB(코리아크레딧뷰로)2018.10~2021.10B044
5교통/물류서울시 CJ대한통운 택배 유형별 월 데이터CJ올리브네트웍스, 신한은행1.블록단위월별출지데이터2.블록단위월별착지데이터3.자치구단위월별출지데이터4.자치구단위월별착지데이터B073
6교통/물류서울시 자치구단위 CJ택배차량운행량 월별 통계CJ올리브네트웍스2020.01 ~ 2021.12B072
7교통/물류서울시 대중교통 및 지하철 1회권승하차 데이터서울시(스마트카드사)-B013
8교통/물류서울시 버스 30분단위 이용 통계서울시(스마트카드사)2017.01~2022.06B061
9교통/물류서울시 지하철 30분단위 이용 통계서울시(스마트카드사)2017.01~2022.06B060
11교통/물류서울시 차량등록현황 통계국토부2016.01 ~ 2022.04B057

3) 올바른 데이터셋 고르는 법

1. 사람들이 많이 쓴 데이터셋

  • 리뷰가 많을수록 참고하고 공부할 수 있는 코드가 많기에 프로젝트 진행/공부에 수월하다.

2. 연습용 미니 프로젝트는 주로 kaggle begginer series 이용해보기

ex) iris, titanic...

3.한가지 데이터셋만 가지고 프로젝트 진행은 금물 ❌ 하나의 스토리를 만들 것

ex) 인구 분포 + GDP = 인구수에 따른 GDP 성장률 예측해보기



2. 프로젝트 팀 결성

우리 팀원들은 “PLAYDATA”의 “AI BootCamp”교육 과정을 수료 중이다. 03월 14일부터 시작하여 Python, ML을 활용한 2번의 미니 프로젝트가 진행되었다. 미니 프로젝트에서 배웠던 지식을 실질적으로 활용하였기에 진짜 공부가 되었지만 다음 과목 사이에 진행했던 터라 길면 일주일, 짧으면 3일 안에 끝났다.

1) 러닝메이트

슬랙에 '러닝메이트' 채널을 개설했다. 학우들끼리 학원 외 프로젝트 결성하거나 복습 및 예습 메이트 결성의 장을 만드는 것이 주목적이었다. 채널 개설 기념으로 나는 '웹 크롤링, 주말동안 부수기' 학습메이트를 만들었고 zero님은 프로젝트 메이트를 결성하였는데 학우들의 참여를 돋우기위해 나도 참여하였다. 이것이 '취향식탁'팀의 시작이었다.

3. 프로젝트 주제 회의

아이디어를 이야기하며 희망 도메인과 주제를 종합해보았다. 모인 도메인은 물류와 트렌드였다.

  1. 장애인이동권 보장 및 소비 증진 방안

  2. 서울시 창업부지 적합성 지수 예측

  3. 물류창고 자동화

  4. MZ 세대 소비 패턴 분석 및 향후 트렌드 예측

  5. 이커멀스 회사 추이

  6. 소비패턴 변화에 따른 물류 배송 예측 및 택배 터미널 추천

4. 1주차 느낀점

활용할 수 있는 데이터는 무수히 많다. 하지만 주제와 기능을 선정하는 과정에서 계획한 프로젝트의 크기에 비해 광범위하게 잡을 수 있는 위험이 많다는 것을 알았다. 그럼 범위 설정을 어떻게 가늠할까?

1) 플로우차트


플로우 차트를 간략하게라도 짜보면 할 수 있는 것과 할 수 없는 것이 가늠이 된다.

2) 함께해서 좋은 점

  • 이게 될까?
  • 이런 데이터가 있을까?

혼자 했더라면 막혀서 돌아가거나 오래 걸릴 일을 함께 의논하며 금방 해결해나갈 수 있었다. 이래서 프로젝트를 하는구나 싶었다.

profile
Learning&Running

0개의 댓글