# EDA

2020 Kaggle Machine Learning & Data Science Survey 를 이용한 EDA 연습
서베이 데이터를 이용해 하나의 스토리를 만들어내는 컴피티션이지만 EDA 연습용으로 사용해보자. pandas나 matplotlib는 힘들게 배워놔도 이렇게 계속 써주지 않으면 까먹는다..
3/04 EDA, Markdown, git, plot
AI 부트캠프 1일차Fork : branch 생성clone : 개인 pc에서 작업commit : branch에 적용pull request : master에 pull

Pandas Profiling, EDA를 위한 최고의 라이브러리 소개
문제가 정의되고, 수행할 Task가 구체화되었을 때,우리는 가장 먼저 데이터를 이리저리 살펴본다.데이터를 잘 표현해 줄 수 있는 여러가지 그래프를 그려볼 수 있고데이터를 잘 요약해 줄 수 있는 다양한 통계량들을 구해볼 수 있다.이러한 과정을 탐색적 데이터 분석(Expl

자전거 대여데이터 EDA
https://nbviewer.jupyter.org/gist/jiwoo0212/5c1325d3e252bbf2beaf8f001b1d6363
FEB 0.1.2
순환신경망(Recurrent Neural Network, RNN)순환 신경망은 시퀀스형 모델이다많은 데이터 → 확률적으로 예측 → 주어진 문제에 대한 답은 확률적으로 A 일 것이다시퀀스(Sequence)란? 데이터에 순서(번호)를 붙여 나열한 것특정 위치(~번째)의 데
MSA 서비스에서 Circuit Breaker 도입하기
이 글은 조대협 님의 글을 통해(https://bcho.tistory.com/1247) 공부한 내용을 담았습니다. MSA 에서 서비스 간 장애 전파 MSA 패턴을 도입하면서 단일 서비스 컴포넌트는 여러개로 쪼개져 서로 호출하는/호출당하는 관계를 가진다. 이런 경우 먼저 대두되는 문제는 서비스 간 장애 전파 이다. 하나의 서비스 컴포넌트에 장애가 발생하면 ...
Titanic - Machine Learning from Disaster: EDA To Prediction(DieTanic)
이번에는 <EDA To Prediction(DieTanic)>이라는 노트북을 공부해보려한다. 이 노트북은 Ashwini Swain이 3년전에 작성한 노트북으로 2021년 1월 4일 기준 128,239의 조회수와 1797개의 투표를 받은 노트북이다.

Programmers 인공지능 데브코스 - Week 3 Day 4
탐색적 데이터 분석을 통해 데이터를 통달해봅시다. with Titanic Data라이브러리 준비분석의 목적과 변수 확인데이터 전체적으로 살펴보기데이터의 개별 속성 파악하기Hint : Fare? Sibsp? Parch?함께 보면 좋은 라이브러리 documentnumpyp

탐색적 자료 분석(EDA)
탐색적 자료 분석(EDA)는 데이터 수집 시 데이터에 대해서 이해를 할 때 하는 분석이다. EDA는 다양한 차원의 관점에서 데이터를 보고 각각의 변수를 조합해 봄으로써 편견에 치우치지 않고 데이터를 있는 그대로 바라보는 분석이다.일반적인 통계 가설을 세울 때는 사람이
캐글 타이타닉으로 기초 쌓기 #5
참고한 커널을 거의 Copy한 정도이기 때문에 학습 등의 목적을 가지고 계신 분은 참고한 커널 Kaggle 공개 커널, 곽대훈님의 데이터 분석 어떻게 시작해야 하나요?로 이동해주세요.이 글은 \[캐글 타이타닉으로 기초 쌓기 특성 공학이란 특정한 기능(AI 알고리즘 적용
캐글 타이타닉으로 기초 쌓기 #4
참고한 커널을 거의 Copy한 정도이기 때문에 학습 등의 목적을 가지고 계신 분은 참고한 커널 Kaggle 공개 커널, 곽대훈님의 데이터 분석 어떻게 시작해야 하나요?로 이동해주세요.이 글은 \[캐글 타이타닉으로 기초 쌓기 이제 어떤 feature가 Survived에
캐글 타이타닉으로 기초 쌓기 #3
어제 docker의 tensorflow 이미지로 진행하다가 다 날려먹고 오늘 다시 처음부터 분석을 시작했습니다.참고한 커널을 거의 Copy한 정도이기 때문에 학습 등의 목적을 가지고 계신 분은 참고한 커널 Kaggle 공개 커널, 곽대훈님의 데이터 분석 어떻게 시작해야
캐글 타이타닉으로 기초 쌓기 #2
진행하기 앞서 Jupyter notebook을 사용하기 위해 터미널에서 다음의 명령어를 통해 학습 환경을 다운로드하였습니다.음 ... 클러스터의 wifi를 이용하니 굉장히 오래걸렸다. 한 25분 정도?