탐색적 데이터 분석

tnaql·2024년 10월 29일
0

SQL 2

목록 보기
1/26

PANDAS DataFrame => 데이터를 뜯어보기 좋음

  1. 데이터 훑어보기

    1) info, describe 를 통해 훑어보기
    2) 컬럼에 널값이 있는지 체크
    3) 중복값 체크
    4) csv 파일 형식 체크

  2. 데이터 재구조화

    1) 그룹바이 (groupby)
    2) 피봇테이블 (pivot_table)
    3) 스택/언스택 (Stack_Unstack)

시각화 툴 => 데이터를 시각화할 수 있음

  1. 데이터 시각화

    1) 히트밉을 그려서 어떤 값들이 상관관계를 가지고있는지 확인
    2) bar/regplot/histplot
    3) 2개 이상의 컬럼의 상관관계(n차원)를 알고 싶을때 facetgrid
    4) jointplot도 융합형 느낌
    5) 반복문으로 여러개의 plot을 그릴 수 있다

profile
이직 준비중

0개의 댓글