# EDA

17개의 포스트
post-thumbnail

2020 Kaggle Machine Learning & Data Science Survey 를 이용한 EDA 연습

서베이 데이터를 이용해 하나의 스토리를 만들어내는 컴피티션이지만 EDA 연습용으로 사용해보자. pandas나 matplotlib는 힘들게 배워놔도 이렇게 계속 써주지 않으면 까먹는다..

약 22시간 전
·
0개의 댓글

3/04 EDA, Markdown, git, plot

AI 부트캠프 1일차Fork : branch 생성clone : 개인 pc에서 작업commit : branch에 적용pull request : master에 pull

2021년 3월 4일
·
0개의 댓글
post-thumbnail

Pandas Profiling, EDA를 위한 최고의 라이브러리 소개

문제가 정의되고, 수행할 Task가 구체화되었을 때,우리는 가장 먼저 데이터를 이리저리 살펴본다.데이터를 잘 표현해 줄 수 있는 여러가지 그래프를 그려볼 수 있고데이터를 잘 요약해 줄 수 있는 다양한 통계량들을 구해볼 수 있다.이러한 과정을 탐색적 데이터 분석(Expl

2021년 1월 26일
·
0개의 댓글
post-thumbnail

자전거 대여데이터 EDA

https://nbviewer.jupyter.org/gist/jiwoo0212/5c1325d3e252bbf2beaf8f001b1d6363

2021년 1월 26일
·
0개의 댓글

FEB 0.1.2

순환신경망(Recurrent Neural Network, RNN)순환 신경망은 시퀀스형 모델이다많은 데이터 → 확률적으로 예측 → 주어진 문제에 대한 답은 확률적으로 A 일 것이다시퀀스(Sequence)란? 데이터에 순서(번호)를 붙여 나열한 것특정 위치(~번째)의 데

2021년 1월 22일
·
0개의 댓글

MSA 서비스에서 Circuit Breaker 도입하기

이 글은 조대협 님의 글을 통해(https://bcho.tistory.com/1247) 공부한 내용을 담았습니다. MSA 에서 서비스 간 장애 전파 MSA 패턴을 도입하면서 단일 서비스 컴포넌트는 여러개로 쪼개져 서로 호출하는/호출당하는 관계를 가진다. 이런 경우 먼저 대두되는 문제는 서비스 간 장애 전파 이다. 하나의 서비스 컴포넌트에 장애가 발생하면 ...

2021년 1월 12일
·
0개의 댓글

Titanic - Machine Learning from Disaster: EDA To Prediction(DieTanic)

이번에는 <EDA To Prediction(DieTanic)>이라는 노트북을 공부해보려한다. 이 노트북은 Ashwini Swain이 3년전에 작성한 노트북으로 2021년 1월 4일 기준 128,239의 조회수와 1797개의 투표를 받은 노트북이다.

2021년 1월 5일
·
0개의 댓글
post-thumbnail

(3-5) EDA project

EDA project를 해보았다.

2020년 12월 18일
·
0개의 댓글
post-thumbnail

(3-4) EDA

탐색적 데이터 분석을 통해 데이터를 통달해보자.

2020년 12월 17일
·
0개의 댓글
post-thumbnail

Programmers 인공지능 데브코스 - Week 3 Day 4

탐색적 데이터 분석을 통해 데이터를 통달해봅시다. with Titanic Data라이브러리 준비분석의 목적과 변수 확인데이터 전체적으로 살펴보기데이터의 개별 속성 파악하기Hint : Fare? Sibsp? Parch?함께 보면 좋은 라이브러리 documentnumpyp

2020년 12월 17일
·
0개의 댓글
post-thumbnail

탐색적 자료 분석(EDA)

탐색적 자료 분석(EDA)는 데이터 수집 시 데이터에 대해서 이해를 할 때 하는 분석이다. EDA는 다양한 차원의 관점에서 데이터를 보고 각각의 변수를 조합해 봄으로써 편견에 치우치지 않고 데이터를 있는 그대로 바라보는 분석이다.일반적인 통계 가설을 세울 때는 사람이

2020년 11월 11일
·
0개의 댓글

캐글 타이타닉으로 기초 쌓기 #5

참고한 커널을 거의 Copy한 정도이기 때문에 학습 등의 목적을 가지고 계신 분은 참고한 커널 Kaggle 공개 커널, 곽대훈님의 데이터 분석 어떻게 시작해야 하나요?로 이동해주세요.이 글은 \[캐글 타이타닉으로 기초 쌓기 특성 공학이란 특정한 기능(AI 알고리즘 적용

2020년 8월 12일
·
0개의 댓글

캐글 타이타닉으로 기초 쌓기 #4

참고한 커널을 거의 Copy한 정도이기 때문에 학습 등의 목적을 가지고 계신 분은 참고한 커널 Kaggle 공개 커널, 곽대훈님의 데이터 분석 어떻게 시작해야 하나요?로 이동해주세요.이 글은 \[캐글 타이타닉으로 기초 쌓기 이제 어떤 feature가 Survived에

2020년 8월 12일
·
0개의 댓글

캐글 타이타닉으로 기초 쌓기 #3

어제 docker의 tensorflow 이미지로 진행하다가 다 날려먹고 오늘 다시 처음부터 분석을 시작했습니다.참고한 커널을 거의 Copy한 정도이기 때문에 학습 등의 목적을 가지고 계신 분은 참고한 커널 Kaggle 공개 커널, 곽대훈님의 데이터 분석 어떻게 시작해야

2020년 8월 12일
·
0개의 댓글

캐글 타이타닉으로 기초 쌓기 #2

진행하기 앞서 Jupyter notebook을 사용하기 위해 터미널에서 다음의 명령어를 통해 학습 환경을 다운로드하였습니다.음 ... 클러스터의 wifi를 이용하니 굉장히 오래걸렸다. 한 25분 정도?

2020년 8월 11일
·
0개의 댓글