220919 데이터사이언스, 데이터활용사례 등 / 220920 파이썬 기초 함수, 응용문제 / 220921 판다스 0103 실습파일, 0104앤스컴콰르텟과 seaborn 까지 배우면 느낀 TIL
pandas csv파일 불러오기 에러 해결해보기. / loc, iloc와 파이썬 문자열 슬라이싱 부분 비교 / 느낌TIL
220923 SQL을 배우며/ 220924 파이썬 숙제/ 220925 SQL 복습 벨로그 정리

220926 - 기술통계, plot 조금 익숙해졌다? / 220927 - 복습 최고! 다시 for문의 늪에.. / 220928 - 함수는 어려워. 레퍼런스!
월 소득 : countplot, relplot과 lineplot, lmplot과 regplot, autoviz에서 mpg 의 값은 평균, iloc와 loc!!! 이건 두번째임, value_counts() / 수 소득 : reset_index와 set_index
1. 저작권 / 2. SQL 조금 친해진 거니 우리? / 3. 랜덤문제 풀이 시간 / 4. 다음 수업 전까지 해야 할 것
서울 다녀 오면서 미니프로젝트 이해 과정 / 나도코딩 유튜브 강의 보기 / 프로그래머스 문제 풀기(스터디) / 점프투파이썬 문제 풀기(스터디)
프로그래머스 문제 : 평균 구하기, 자릿수더하기, 자연수 뒤집어 배열로 만들기 / 오늘 하루의 TIL / 유독 힘든 날이지만 흘러가게 버티자 /
221005 기초탄탄 스터디(피보나치, 프로그래머스), 천리길 스터디(파이썬 문제, 마크다운 작성법), TIL
타이타닉 과제(데이터프레임), 행과열, 그룹방, 조건, 참고 사이트 / 1006 plotly를 배우고/ 1007 통계수업 듣고/ 1008 과제들 / 1009 과제 제출, 벨로그 정리 / 1010 벨로그 정리
과제의 힘인가. 오늘은 수업 내용을 조금 따라갈 수 있었다. / 기초탄탄 스터디 프로그래머스 문제
TIL-시각화를 하면서 익숙해진 것 같다. / 스터디 - 프로그래머스 문제, 정규표현식으로 못 푼 문제 꼭 해결해보자
221013 의약품 파생변수 만드는 것, 그래프 그리는 것 어려웠다. / 221014 SQL 완료! 복습해야하는데 못했다. 미드 1차 싱크업미팅 / 221015 미니 프로젝트 완료 / 221016 미니프로젝트 모임, 코드 리뷰, 미니프로젝트 제출 완료, 미드 주제 고민
미드 프로젝트 시작, 깃헙 프로젝트 기능이랑 아직 알아가는 중, 깃헙스터디 혼자 망해버렸다, git clone 에러 진촤... 스트레스 조절, 멘탈관리가 중요하겠구나
221020드디어 데이터셋 붙잡고 있는거에서 스트림릿으로 넘어간다.한 거random.choice해서 뽑아서 구 데이터, 동 데이터에서 시각화를 하자고 정해서, 다시 데이터를 세팅했다.melt해서 만든 Tidy dataset이랑 random.choice해서 뽑아둔 데이터
221028 TIL오늘 한 것타이타닉 과제INNOPOLIS AI SPACE-S 인공지능 세미나 - 정형 데이터를 다루는 머신러닝 문제해결 패턴 https://www.youtube.com/watch?v=b98H87BIrbo&t=140s탐색적 데이터 분석의 중요성
221030천리길 스터디 과제 중 피처 엔지니어링 부분에서 Pregnancies_high를 추가했을 때, 다시 학습과 예측을 진행한다. split_count부터 다시 안하고 X_train을 시키려니 계속 index가 없다는 오류가 떴다. 팀원이 같이 에러를 봐줘서 결국
221031~221103 Diary. TIL인지 Diary인지 늘 고민이 된다.
221104강승일 강사님 태블로 수업 2번째 시간.JD을 보면 대시보드 만드는 업무도 많이 보여서 잘 배워두면 좋을 것 같은데, 혼자 하라고 하면 전혀 감이 오질 않는다. 오늘도 20분 정도 실습시간을 줬는데, 마지막 대시보드 구현을 위해 데이터를 어떻게 처리해야 할
221105 머신러닝 알고리즘 재실행이 두렵다. / 221106 랜덤서치, 그리드서치를 조금 알 것 같은 느낌 / 예측은 X_test로!!
221107 MON /캐글의 bike sharing demand 데이터, RMSLE, 오차 , 점수가 낮아야 좋은 것 / 미니프로젝트3 그리드서치 성공
사실(Fact) : log1p와 expm1를 배웠다.느낌(Feeling) : log를 취해서 정규분포화로 바꿔주고, 다시 submit에서는 값을 되돌려줘서 적용하는 것이 흥미로웠다.교훈(Finding) : 캐글 점수 내리는 것이 재밌다. 다양하게 파라미터나 변수를 조정
피처스케일링, 인코딩을 배운 날. 천리길 스터디 부스팅 배깅 설명에서 이마 탁!
스태킹앙상블이랑 비슷한 느낌으로 스태킹을 가르쳐 주었는데, 아직 이해가 어렵다. 아래는 배깅, 부스팅, 스태킹이 보기 좋게 정리되어 있는 블로그.https://medium.com/dawn-cau/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D
221111 FRI 태블로태블로...어렵다... 중간중간 뛰어넘어가면서 강의를 들으니까 헷갈린다. 그리고 오후에 강사님이 해주는 강의는 한 번 놓치면 끝이라서 포기할까말까의 기로에 늘 왔다갔다 한다.221112 SAT다이아몬드 과제 조금 풀어보기221114 SUN다이아
목표 : 바탕화면에 캐굴캐굴스터디 폴더 생성 후 깃허브 연동\-> clone하면 캐굴캐굴스터디 폴더 내에 캐굴캐굴스터디 repository가 연동되어 폴더가 하나 더 생성이 되었다. 결국 vscode에서 브랜치 연동이 안되어서 다시 시작\-> 바탕화면에 github 폴
사실(Fact) : house prices 데이터를 가지고 머신러닝에서 사용할 수 있는 전처리 기법을 다양하게 응용해보았다.느낌(Feeling) : 쓰레드를 열어줄 때마다 익숙한 문제임에도 시간이 오래 걸린다. 빨리 익숙해지면 좋겠다.교훈(Finding) : 튜토리얼을
221115 TIL사실(Fact) : house prices 실습 파일을 완성하면서 다양한 전처리, 변환, 인코딩을 배웠다.느낌(Feeling) : 수치, 범주, X, y, train, test. 어떤 전처리를 적용할지, 어떻게 변환해야할지, 너무 헷갈린다.교훈(Fin
사실(Fact) : 선형회귀로 점수를 내보았고, 배깅 부스팅 차이와 부스팅 3대장을 배웠다.느낌(Feeling) : 공부했던 부분이 나와서 복습하기가 좋았다.교훈(Finding) : 역시 예습 복습 최고개발 실력 엄청 좋은데 소통이 안되는 개발자 vs 개발은 평범한데
PyCaret머신러닝 워크플로우 자동화데이터탐색 - 전처리 - 모델선택 - 학습+최적화+결과분석 - 배포데이터탐색pip install autoviz 로 EDA전처리(Setup)필수 파라미터data : 학습에 사용할 데이터, pandas.DataFrametarget :
으쌰 복습 발표으쌰 10팀이 미니프로젝트를 끝으로 잠시 헤어진다니. 진짜 마음 편한 팀원들이었는데 아쉽다. 하지만 마지막 으쌰 복습을 발표로 마무리하게 되서 좋다.\-> 그라디언트 부스팅에서 경사하강을 공부해서 다른 부분을 맡아서 정리했는데, 손실함수와 경사하강법, A
221118 FRI어제 태블로 테킷 강의를 처음부터 다시 듣기 시작했다. 다시 들으니 머리에 들어오는 정보가 많아서 더 좋았다.매번 수업을 놓치면 포기했는데, 처음으로 수업에서 놓친게 없어서 뿌듯했다.이번주 안에 태블로 테킷 강의 완성하고, 승일 강사님이 공유해준 유튜
아직 X, y, train, test 개념이 확립되지 않았는지, 학습을 시키고 예측을 할 때, value error가 뜨는 등의 변수가 발생하면 어느 부분을 고쳐야 할 지 찾기가 어려웠다. 마침 내일 머신러닝 복습을 할 수 있어서, 공부해보고 다시 수정하고 싶다.사용할
평가지표의 늪, cross_val_predict, cross_val_score, model, score, predict값
Cross Validation 머신러닝은 모델의 일반화 성능을 향상==테스트 오류를 최소화하는 것이 주된 목표이다. cross validation은 모델 학습 시 데이터를 train, validation, test 세트로 나누어 교차 검증하는 방법으로, validati
알고 있는 metric 설명precision은 Positive라고 예측한 값들 중 실제로 Positive인 비율을 말합니다. 정답이 아닌데 정답이라고 예측한 것이 있는지 확인하기 위한 지표로, 스팸메일과 같이 Negative 데이터를 Positive로 잘못 예측하면 큰
Neural Network = 인공신경망 = Deep learning라이브러리 : TensorFlow, PyTorch, Caffe2, theanovariable, 변수ex) X=1표에서 컬럼은 변수. ex) 온도=20, 온도=21, 온도=22원인이 되는 변수 : 독립변
221129 MON TIL사실(Fact) : confusion matrix와 평가지표, 불균형 데이터 처리, 딥러닝 기초를 배웠다.느낌(Feeling)1,2종 오류 중 뭐에 해당하는지 질문이 나올 때 답이 탁탁 안나와서 갑갑하다.샘플링 들어가면서 조금 헷갈리는데, 다시
221128 MON TIL사실(Fact) : w, b, sigmoid, softmax 등 모델을 구성하는 각종 개념들을 배웠다.느낌(Feeling) : 개념이 생소했는데, 텐서플로 예제와 pima 실습을 시작해보니 조금씩 알아가는 느낌이다.교훈(Finding) : 스터
사실(Fact) : w, b, sigmoid, softmax 등 모델을 구성하는 각종 개념들을 배웠다.느낌(Feeling) : 개념이 생소했는데, 텐서플로 예제와 pima 실습을 시작해보니 조금씩 알아가는 느낌이다.교훈(Finding) : 스터디 딥러닝 적용과 미니프로
221130 WED TIL사실(Fact) : 딥러닝 분류 모델의 예측과 평가, 회귀 모델을 실습해보았다.느낌(Feeling) : 분류를 해두니 회귀에서 어떤 차이가 있는지 확인하면서 보기가 좋았다.교훈(Finding) : 내가 실습하고 정리해둔 내용들이 어디있는지 바로
딥러닝, 딥러닝과 머신러닝 차이 / 알고 있는 Activation Function : Sigmoid / 기울기 소실 문제는 왜 발생할까?
사실(Fact) : CNN 을 시작하면서 model을 생성하는 주요 파라미터들을 익혔다.(filters, kernel_size 등)느낌(Feeling) : 오늘 하루를 들여서 꼼꼼하게 들을 수 있어서 좋았다!교훈(Finding) : 제대로 TIL 을 정리 못했으니 꼭
사실(Fact) : 전이학습을 배우고, 이미지 파일을 array로 만들어보았다.느낌(Feeling) : 전이학습이라고 해서 그냥 불러오는 쉬운 것만 할 줄 알았다. 나는 아직도 함수랑 for문이 너무 어렵다.교훈(Finding) : 공부해야겠네..!어제 잘 되던 Bac
딥러닝에서 AUC 구해보기https://stackoverflow.com/questions/48617311/how-to-use-predict-proba-for-dnnclassifier-in-tensorflowhttps://data-newbie.tisto
Q1. Convolution의 원리는 무엇인가요?CNN 은 데이터를 feature(특징, 차원)로 추출하여 패턴을 파악하는 구조입니다. Fully Connected Neural Network 와 비교하여 필터, 합성곱층, 풀링층이라는 핵심 요소로 이루어져있습니다.그 중
사실(Fact) : CNN 을 마무리하고, 텍스트 분석을 시작하였다.느낌(Feeling) : 아직 이미지 처리도 어려운데, 새 개념이라니. 연습을 더 많이 해보고 싶다 ㅜㅜ교훈(Finding) : 정규표현식 나올 때마다 열심히 안봤는데, 이제는 진짜 열심히 봐야겠다.파
221214 WED TIL사실(Fact) : 형태소 분석기나 인코딩을 사용 등 NLP와 RNN 에 필요한 전처리? 를 공부했다.느낌(Feeling) : 나 미니프로젝트 할 수 있을까...?교훈(Finding) : 길을 잃고 헤매고 있지만, 잘 버텨보자. 열일 하는 동기
221215 THU TIL사실(Fact) : RNN 을 더 자세하게 공부하기 시작(패딩, 임베딩, Bidirectional, GRUs 등)느낌(Feeling) : 목요 복습 시간이 쏠쏠했구나.. 그때 한 번 정리되는게 없으니까 혼자 다 정리해야 해서 어렵다.예전에는 처
221218 SUNQ1. Stop Words는 무엇일까요? 이것을 왜 제거해야 하나요?자연어 처리를 할 때, 많이 등장하지만 중요하지 않은 단어 또는 제외했으면 하는 단어를 전처리 해주어야 하는데, 이와 같은 단어들을 불용어(Stop_words)라고 한다.문장을 구성
221219 MON TIL사실(Fact) : 시계열 데이터 예측을 해보고, 비즈니스 데이터분석에 대해서 배웠다.느낌(Feeling) : 미니프젝을 하고 나서 시계열을 들으니까 조금 따라갈 수 있었다. 비즈니스 데이터 분석 궁금했는데, 배울 수 있어서 좋다.교훈(Find