[우리FISA 5기] AI엔지니어링 3주차 - 010일차

이정환·2025년 7월 14일

우리FISA

목록 보기
8/12

010일차 - EDA, matplotlib, seaborn

EDA

EDA란?

  • 탐색적 데이터 분석(Exploratory Data Analysis)의 약자
  • 모델링에 선행하여 다양한 관점에서 데이터를 관찰하고, 이해하는 과정
  • 통계 기법 및 시각화로 데이터의 특징을 파악

🔗Top EDA Tools For Exploratory Data Analysis and Techniques You Must Know

데이터 시각화

  • 시각화의 목적은 배경지식이 없는 사람에게도 정보를 빠르게 전달하는 것

💡 색 조합 & UI/UX적 지식을 토대로 해석하기 용이한 시각화 자료를 만드는 것이 중요하다.

🔗자연스러운 흐름의 디자인 레이아웃 - uiux lab

인포그래픽 사이트 🔗visualcapitalist

자료형에 의한 시각화 분류

💡 아래 사이트에서 자료형 조합별 시각화 종류를 확인할 수 있다.
🔗from Data to Viz

matplotlib

matplotlib란?

  • 공학용 소프트웨어인 매트랩과 유사한 시각화를 지원하는 파이썬 라이브러리

🔗Matplotlib cheatsheets and handouts

seaborn

  • matplotlib 라이브러리를 기반으로 작성된 라이브러리
  • 간결한 코드로 통계 처리 등 더 유용한 시각화 함수를 제공

🔗Example gallery

ydata_pr

  • 한 번의 모듈 호출만으로 EDA과정에서 필수적인 정보를 확인할 수 있는 HTML 페이지를 제작해주는 라이브러리

🔗YData Profiling

!pip install ydata-profiling

from ydata_profiling import ProfileReport

profile = ProfileReport(tips, title='tips analysis')
profile.to_file('test.html')

ydata-profiling으로 생성된 html 페이지 일부

💡 딸각

0개의 댓글