[2022 국민대학교 겨울 인공지능 특강] 2주차 4일 학습 내용

하지원·2022년 1월 14일
0

EDA란 Exploratory Data Analysis의 준말인데, 탐색적 데이터라는 뜻이다. 데이터 그 자체를 확인함으로써 인사이트를 얻고 유의미한 정보를 알아내는 접근법이다.

EDA의 과정은 다음과 같다.
첫 번째로 특정 데이터를 분석하려는 목적이 있어야 하는데, 이것이 명확해야 한다. 그리고 이에 관한 변수에 속하는 row data를 확인한다.
두 번째로 데이터를 전체적으로 살피면서 각 데이터간의 상관관계를 파악하고, 비어있는 항목(N/A)인지, 데이터 크기는 얼마인지 등을 파악한다.
마지막으로 데이터의 개별 속성을 알아야 한다. 숫자나 문자 데이터가 어떤 것을 나타내는지 아는 것이 중요하다는 뜻이다.

예를들어, 타이타닉호가 침몰했을 때 생존자와 사망자의 비율, 탑승자의 성별이나 가족 관계 여부 등에 대한 정보를 얻어내 가족이 같이 탔던 승객들은 적어도 가족 구성원 한명을 잃은 비율이 많았다거나, 사망자수가 절반이 넘었다거나 하는 등의 정보를 알아낼 수 있다.

profile
국민대 전자공학부, 서강대학교 석사과정, 크래프톤 정글 2기

0개의 댓글