구현 목표 // 01 웹 서버 요청 requests 활용 get 요청 응답 내용 확인(출력 한 번) // 02 HTML 파싱 BS 활용, 추출. 반복문 or 함수 통해 구조화 // 03 데이터 수집 네이버 영화 리뷰 데이터 수집 df 로 변환 오류 여부 (결측,
캐글(kaggle) 에 있는 트럼프 대통령 트윗 자료를 분석하는 프로젝트.
✅ 요구사항 정리 // 문제 정의 문제에 대한 명확한 정의 CCTV 유동인구 추이가 편의점 상품판매에 영향을 미칠 수 있는 가설 // 데이터 수집 Open API 활용하여 데이터 수집 판다스 데이터 프레임으로 변환 오류 여부 확인 // 데이터 전처리 목표 달성에 필요한 수준 근거와 설명 // 데이터 시각화 디바이스별 유동인구 변화 월별 유동인구 변...
데이터 요소를 파악하고 시각화까지 수행해보자. 캐글 문제 시작하기🗝️
첫 번째 모델을 완성시켜보자.
피처들을 가공하여 모델의 성능을 높이는 과정이다.
prev_baseline 해결하기. prev 자료 EDA 부터 feature engineering, 모델 학습과 캐글 제출까지.
주석으로 잘 정리해뒀으니 반복해서 보자.
Bayesian Optimization 을 이용한 코드
bureau 와 bureau_bal 데이터 세트 가공, EDA, feature engineering, 모델 생성과 평가까지🤒
pos_bal, install, card_bal 가져와 EDA, FE, 모델 학습, 생성 및 평가
OOF 로 최종 개선에 들어가자