멋쟁이 사자처럼 2주차 학습 내용 220919(월)-220921(수). #데이터사이언스 #파이썬 #Pandas #Numpy #기초개념및실습
데이터리안의 SQL 강의. 1교시(~12:00) SQL 기초 문법 실습. / 2교시(~15:30) 인프런 SQL 강의 / 3교시(~17:50) DB 기본 이론
데이터리안의 SQL 강의. 3교시(~17:50) DB 기본 이론 / 숙제 solvesql 문제 3개
0105번파일 : 추상화된 도구를 사용하여 기술통계 그래프 그리기(판다스프로파일링, 스윗비즈, 오토비즈) / 0106번 파일 : 수치형 데이터의 기술통계 (1개 수치변수 plot, 2개 이상 수치변수 plot)
범주형 데이터의 기술통계, plot
220927. FinanceDataReader/ 데이터수집 기초, 함수 설정
220928 / 0202 실습파일 - 반복문으로 데이터 수집 / 0203 실습파일 - requests, BeautifulSoup, 판다스코드로 데이터 수집, 함수 만들기 / 0204 실습파일 - ETF데이터 JSON으로 수집
SELECT문에 들어가는 조건 CASE WHEN ~ THEN~ END / 피봇 테이블/ 문제 실습
네이버 뉴스 기사 스크래핑 해보기.
0205, 0206 실습파일 / 06번 강의파일 / 서울특별시 다산콜센터의 주요 민원(자주 묻는 질문) 내용 스크래핑/ 수도코드 / try-except / 반복문으로 여러 페이지 수집/ set_index.T / get_desc함수정의
map, apply/ merger, concat, join / 리스트 컴프리헨션 / matplotlib API와 pandas API/ plotly / range slider/ 캔들차트/ OHLC / loc, iloc / 논리연산자, 비트연산자/ Unnamed0
0302 실습파일 : 주가데이터 시각화, 캔들스틱, OHLC, FAANG / 0303 실습파일 : 서울 코로나 데이터, dulicate, index, sort_index, dt accessor, 연도-월, value_counts
221007 유재명 강사님 강의 / 범주형, 연속형/ 분석도구/ 기술통계, 추론통계/ 중심 경향치/ 분위수/ range/ 편차, 분산/ 신뢰구간/ 귀무가설, 가설 검정/ 상관분석, 상관계수/ 회귀분석
0303번 - 전처리, 정규표현식, crosstab, boolean indexing으로 특정 조건 찾기, 피봇테이블, 그룹바이 / 타이타닉 과제 풀이 / 0304번- object 타입 바꾸기, 컬럼 삭제
221012 / 0304번 실습파일 : 결측치, melt, 연도월분리, 그룹바이, 피봇테이블, 히트맵, seaborn/ 0305번 실습파일 : 결측치, melt, 전처리, 정규표현식, rename, nlargest, plotly
BC카드 사용 제주관광객 소비패턴 분석(2014년 9월~2016년8월)
221013 / 0306번 실습 파일 : 의약품처방정보 샘플링 / 0307번 실습 파일 : 전처리, 분석
0307번 파일 복습 sns.barplot과 plotly의 histogram 연산, 범주형데이터와 수치형데이터/ 0308번 파일 : 데이터타입, downcast, 메모리 용량 줄이기 / 0309번 파일 : csv와 parquet / 미니프로젝트리뷰 / streamlit
-
09번 강의 파일데이터센터나 클라우드 서버를 사용하는 이유? / 왜 대시보드를 서버에 띄우는지 / 대시보드를 왜 만드는지 : 우리가 쓰는 컴퓨터도 메모리를 늘린다거나 새로 사는 경우처럼24시간 동안 가동이 되어야 한다. 계속 켜두면 발열. 안정적인 전력공급이나 네트워크
221026 0402번파일 : 의사결정나무(Decision Tree), 이상치, 랜덤포레스트, 배깅알고리즘, 부트스트랩, n_estimators / 0403번파일 : Regression, 회귀, Cross Validation, 오차, 이력서
멋쟁이 사자처럼 AI스쿨 7기, 박조은 강사님 강의✅ 0403번 실습파일n_jobs : 사용하고 있는 장비에서 CPU 코어를 몇 개 사용할 것인지. -1은 전부 다 사용하겠다.regplot : 실제값과 예측값의 차이가 잘 맞는다면, 회귀선에 맞춰서 점들이 그려질 것.
[221101] 0501번 실습파일 : 캐글 submit predictions, subplots, 정규화 / 0502번 실습파일 : 지도학습 모델, binary encoding, 성별 피처 엔지니어링, 지니 불순도, 로그, 엔트로피 / JD : 그로스해킹
[221102] 0503 실습파일 : index_col, ESC+F, 원핫인코딩, ordinal-encoding, 결측치 대체, cross_val, 캐글 / 0504 실습파일 : method, interpolate, 결정트리, 랜덤포레스트, GridSearchCV /
멋쟁이 사자처럼 AI스쿨 7기, 박조은 강사님 강의 / 221107 0504 실습파일 : 랜덤서치, 홀드아웃 validation / 0601 실습파일 : Bike Sharing Demand, RMSLE, logloss, data leakage, NDCG
221108, 0601번 실습파일 : cat.codes / 0602실습파일 : dayofweek, log취하기, expm1으로 복원, DAU, neg_root_mean_squared_error/ 피처엔지니어링 강의파일 / 0701번 실습파일 : 이상치, 희소값
221109 12번 강의파일, 0701 실습파일 : 피처스케일링, 표준화(Z-score), Min-Max, Robust, transformation, binning, 이산화(discretisation), 부스팅3대장, 오디널인코딩, 원핫인코딩, polynomial
221114. 0701 : 왜도, 첨도, 이상치, 희소값, 스케일링, 로그 변환, 지수 변환, 이산화, cut, qcut, RFM, 레이블 인코딩, 원핫인코딩, polynomial, 상관 / 0702 : 데이터타입 바꾸기, 피어슨, 피셔 / DAU, AB테스트
221115 0702 : 변수바꾸기, RMSE, extend, Kfold, r2_score, pd.Series, imputation, 수치형 범주형 데이터 전처리 / 0801 익명화 데이터, Ridge, Lasso, ElasticNet, 몰두센, ELT, ETL
221116 0801번 : 선형회귀 / 0802번, 13번 강의 파일 : 그라디언트 부스팅 트리 모델, 경사하강법, 엑스트라 트리 모델 / 0803번 : 접착어, XGBoost, lightgbm, GOSS, EFB, CatBoost
K-MOOC '실습으로 배우는 머신러닝' 김영훈 교수님 : Ch1. 개념, GPU, MSE, Linear Regression, minimize loss function, model validation
K-MOOC '실습으로 배우는 머신러닝' 김영훈 교수님 : Ch2. 머신러닝 프로세스(데이터 용어, 준비 과정, 모델링) / Ch3. 모델링(KNN, Logistic Regression)
'실습으로 배우는 머신러닝' Ch4. 경사하강법(stochastic, global minimum, momentum) / Ch5. Support Vector Machine(scaler, hard margin, soft margin)
K-MOOC '실습으로 배우는 머신러닝' 김영훈 교수님 : Ch6. Decision Tree(불순도, CART, Regression)
Ch7. Ensemble(weak learner, strong learner, bagging, random forest, out-of-bag), Ch8. 주성분분석(차원축소, 다중공선성, 공분산행렬, eigenvector, screeplot, loading plot)
Ch9. 군집화(유사도 척도, 유클리디안, 분리형 군집화, 덴드로그램, K평균군집화, centroid)
Ch10,Ch11.Neural Network(Logistic Regression, cross entropy, linear regression, activation function, hidden layer, backpropagation, epochs, batch size
13번 강의 파일 : 선형회귀, 그라디언트부스팅, XGBoost, LigtGBM, CatBoost/ 0803실습파일 : 타입변경 / 14번 강의 파일 : Confusion Matrix, Precision, Recall / 단골면접질문
정확도, F1 Score, 임계값, ROC, AUC, 스니펫, predict_proba, argmax, sampling, SMOTE, XOR, 퍼셉트론, 순전파, 역전파, 활성화함수, Sigmod, tanh, 손실함수, Softmax, Sigmoid
딥러닝유튜브영상, weight, bias, dropout, SGD, cross entropy, 시그모이드, 소프트맥스, 옵티마이저
0901번파일, 텐서플로 리그레션, 0902번파일/ loss, metric, 분류, crossentropy, normalization, pipeline, 회귀, 단일, 다중, val_loss, validation_split, Dense(1)
221205 loss, softmax 와 sigmoid 의 차이, learning_rate, DNN 과 CNN 차이, CMYK, RGB, filters, kernel_size, stride, 패딩, 피처맵, 액티베이션 맵, MaxPooling, 별명
221206 튤립 분류, 이미지 사이즈, padding valid, same, 접돌땡, Flip, Rotation, RandomZoom, 말라리아 데이터, wget, cv2, imread, subset, Datagen
221207 전이학습, 이미지 증강 주의사항, LeNet, AlexNet, ILSVRC, ZFNet, GoogLeNet, VGGNet, ResNet, SENet, include_top, RGB, 255, 크레딧잡
221212 stratify=y, validation_data, 오버피팅, 성능개선, 정규 표현식, 텍스트 분석, BOW, TF-IDF, KoNLPy, N-grams, min_df, max_df, ngram_range, max_features, analyzer
221212 BOW, 문서단어행렬, TF-IDF, CountVectorizer, max_features, 불용어, 감성분류, 142가지 데이터셋, 자연어 책 추천, 워드 클라우드
221214 KoNLPy, 형태소 분석기, 품사 태깅, Hannanum, Kkma, Komoran, Mecab, Twitter, 네이버 영화리뷰 데이터, pecab, okt, stemming, tqdm, 시퀀스, Tokenizer, oov, word_index, pad
221215 패딩, maxlen, post, 시퀀스, colah, timesteps, BackPropagation Through Time, 워드 임베딩, Bidirectional, adapt, GRUs, SimpleRNN, 토큰화, 텍스트 데이터 전처리, RNN, 시계
221219 시계열, 시계열 예시, fdr.DataReader, ohlcv, 회귀와 시계열 차이, 정규화, 윈도우, return_sequences, 오거닉, AARRR, 코호트 분석
221220 pandas background_gradient, seaborn heatmap, 중복 데이터, ARPPU, MAU, 리텐션, 코호트 빈도, unstack, RFM, 채용후기, 코드리뷰 가이드라인, 추천시스템
221221 RFM자료, RFM, qcut, 추천도서, 추천영상(PO SESSION), 3D 그래프, K-Means, DBSCAN, Elbow Method, 실루엣, Silhouette Score, 추천시스템, 벡터의 유사도, 추천도서