스스로 해석하는 능력을 기르고 싶어서 데이터 분석 공부를 시작한다. 부정적인 마음에 기대서 공부하기보다는,새로이 배워나가는 즐거움을 만끽하면서 6개월 간 몰입해 보자! 🌟
파이썬 bool, 버림, 올림, 내림, 반올림
pop? pop!
for문 vs. while문
함수 사용하기
파이썬 리스트 다루기
파이썬에서 파일 열고, 쓰거나 읽고, 닫는 방법
클래스 연습문제 풀기
파이썬 모듈 문제풀이, return & break
기초 수학 : 약수, 소수, 최대공약수, 최소공배수, 진법, 등차 수열, 등비 수열
파이썬 예외 처리 + 문제 풀이
기초 수학 : 계차 수열, 피보나치 수열, 팩토리얼(!), 군 수열, 순열, 조합, 확률
파이썬 튜플 다루기
파이썬 딕셔너리 다루기
리스트, 튜플, 딕셔너리 문제 풀이
EDA 시작 : 미니콘다, 주피터 노트북 세팅
MySQL 8.0 설치 방법
python - 텍스트 파일 문제 풀이
알고리즘 기초 이론 - 선형 검색, 보초법, 이진 검색, 순위, 버블 정렬, 삽입 정렬, 선택 정렬
알고리즘 기초 이론 - 최댓값, 최솟값, 최빈값, 근삿값, 평균, 재귀, 하노이의 탑, 병합 정렬, 퀵 정렬
파이썬 알고리즘 문제 풀이 : 이진 검색, 순위에 따라 정렬하기, 최빈값 구하는 클래스, 근삿값(지점과 구간), 재귀 함수
1. 데이터 확보 2. 데이터 합치고 정리하기
파이널 테스트 코드 리뷰
혼자 공부하는 파이썬 기초 부분
3. 그래프 그리기 4. 경향 파악하기 5. 경향에서 벗어난 데이터 강조하기 + matplotlib 기초
1. 데이터 읽기 - thousands 옵션 2. NaN 값이 들어있는 데이터 정리 3. 구별로 데이터 정리 - 피벗 테이블 적용 + pivot_table 기초, Python 모듈 설치, CCTV 퀴즈 오답노트
4. Google Maps에서 경찰서의 정보 얻기 5. 컬럼명 정리
6. 구별 데이터로 변경하기 7. 구별 데이터에서 발생 건수 정규화 데이터 생성 ❗ 데이터 정리 마무리 - 오류 검거 + 범죄 2 퀴즈 오답노트
seaborn 기초
Folium 기초
8. 데이터 시각화 9. 지도 시각화 10. 추가 검증 : 서울시 범죄 현황 장소별 분석
1. BeautifulSoup 기초 2. 예제 : 크롬 개발자 도구 이용하기
3. 시카고 맛집 메인 페이지 분석 4. 시카고 맛집 하위 페이지 분석 5. 시카고 맛집 데이터 지도 시각화
selenium 기초
1. 데이터 확보 2. 데이터 전처리 3. 주유 가격 시각화
EDA 학습 과제 1
1. 함수 기초 2. fbprophet 기초 3. fbprophet 적용 : 웹 유입량 데이터 분석
1. 네이버 검색 API 사용하기 2. 몰스킨 데이터 정리하기(by. naver API) 3. 시각화
1. 데이터 정리 2. 지도 시각화를 위한 지역별 ID 만들기 3. 지도 준비, 데이터프레임 병합 4. 카르토그램 시각화 5. folium 시각화
1. 성분 사전 데이터 정리 2. Target Data 수정 3. 성분 사전을 이용하여 Mapping
휘발유와 경유 가격이 셀프 주유소에서 더 저렴한가?
sql 기초
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe9 in position 0: invalid continuation byte파일의 형식이 utf-8이 아니기 때문에 발생하는 오류이다.인코딩 포맷을 찾는 모듈을 사용해서
비교 연산자, 논리 연산자
UNION, JOIN
CONCAT, ALIAS, DISTINCT, LIMIT
AWS RDS, SQL File
Python에서 MySQL 사용하기
기본키, 외래키, 집계 함수, GROUP BY, HAVING
Tableau 설치 및 기본 개념
scalar functions, subquery
repository, push, pull, branch
log, diff, merge, conflict, tag, README
스타벅스와 이디야 매장 데이터 가져오기
기초 통계학
모집단, 표본분포, 추정
국가별 인터넷 사용률 데이터
주유소 데이터 가져오기
가설검정
테스트
기본 차트, 이중축 차트, 그룹/집합/계층, 맵 차트, 워드클라우드, 달력형 히트맵, 대시보드, 스토리
퀵 테이블 계산, 계산된 필드, PRIMARY 함수, 문자열 함수
DATE 함수, LOD(Level of Detail) 표현식, 7. 태블로 작동 순서(Order of Operation)
학습 과제
What is Machine Learning?
타이타닉 생존자 예측
Scaler, Pipeline, 교차검증, 하이퍼파라미터 튜닝
모델 평가 지표, 오차 행렬, 정확도, 정밀도, 재현율, FPR, threshold, F1, ROC, AUC, 다항함수, 지수함수, 로그함수, 시그모이드, 벡터, 함수의 합성, box plot
OLS(Ordinary Linear Least Square), 잔차 평가(Residue), 결정계수 (R-Squared), Cost Function, Gradient Descent, 집값 예측
Logistic Regression, Decision Boundary, 다변수 방정식의 계수 값 확인, 정밀도와 재현율의 trade-off, 앙상블 기법
Boosting Algorithm, 여러가지 모델 적용하기, kNN(k Nearest Neighbor), GBM, XGBoost, LGBM
함수 만들기, log scale, 아웃라이어 정리, SMOTE Oversampling
tweepy, jpypel1, stopwords, 형태소 분석, WordCloud, kobill, 한국어 불용어
나이브베이즈 분류를 이용한 감성 분석, 문장 유사도 측정, count vectorize, tf-idf vectorize, 네이버 API를 이용해 유사 질문 찾기
PCA 개념, 주성분 벡터 그리기, n_components=1일 때 원본 데이터와 비교