EDA

noo·2021년 7월 24일
0
post-thumbnail

프로그래머스 2021 국민대 여름방학 인공지능 과정 2주차 Day4 TIL


🔍EDA

데이터 그 자체의 특성을 파악하고자 다양한 각도에서 관찰하고 이해하는 과정


✅EDA 과정

1. 분석의 목적과 변수(column)를 확인하기

분석 목적 및 column들 확인
.dytpes 각 변수의 데이터 타입 확인

2. 데이터를 전체적으로 살펴보기: 상관관계, NA

.describe() 수치형 데이터에 대한 요약 제공 -> 데이터 타입 중요
.corr() 상관계수 확인 -> 상관성(경향성) is NOT 인과성(종속성), 둘을 구분해야 함
.isnull 결측치 확인 -> 결측치 처리 방법은 다양함

3. 데이터의 개별 속성을 파악하기

numpy, pandas로 필요한 데이터를 수치화하고 matplotlib(or seaborn)을 이용하여 시각화


저번주, 이번주 배운 개념들을 다같이 비벼보니까 신기하기도 하지만
직접하려니까 진짜 으아악 어렵다...
뭐 어떻게 써야하지 백만번 생각함

빨리 과제를 하자 과제를...

이틀을 날렸더니 이것저것 많이 밀렸다.. 주말 반납😅

0개의 댓글

관련 채용 정보