[python] mito 패키지로 빠르고 쉽게 EDA해보기

2innnnn0·2022년 4월 24일
0

Mito: Using pandas as a spreadsheet 보고 따라한 실습 포스팅.

0. Mito 소개 및 특징 설명

  • 한 줄 요약 : 스프레드시트(&엑셀)을 쥬피터랩에 집어넣었다!

  • 오픈소스 (유료기능도 있지만 굳이 쓰지 않아도 된다.)

1. 설치Installation

  • Python 3.6 이상의 파이썬 버전과 Jupyter Lab를 사용해야한다. Jupyter Notebook에서는 작동하지 않는 구조. (보통 jupyter 깔면 둘다 설치되어있을 것임.)
  • anaconda로 하면 좀 더 관리가 쉬울 수 있다.
  • 터미널 또는 윈도우 명령어 창을 실행하고 아래 명령어를 따라 치기
# 인스톨러 다운로드
python -m pip install mitoinstaller

# 설치
python -m mitoinstaller install
  • 실행이 완료되면 주피터 랩이 자동으로 실행될 것 이다. 빈 노트북을 생성하고 아래 명령어를 실행.
    기존에 주피터랩이 실행되어 있다면 서버를 다시 내렸다가 재실행하기
import mitosheet
mitosheet.sheet()
  • 정상적으로 설치되었다면 아래와 같이 GUI화면이 보여진다.

2. 데이터 불러오기Import data

  • csv와 excel만 불러오기 제공

3. 기능 소개Functionalities

1) 데이터 체크(결측치 & 분포) Check values and distributions

코드생성기 Auto-Generated code

  • 개인적으로 매우 강력한 기능 중에 하나라고 생각.
    내가 한 GUI액션이 파이썬 코드로 변환이 된다. 여기서 작성된 코드를 내 입맛대로 변환할수도 있다.

총평

  • 사실 파이썬 코드 작성이 매우 귀찮고, 데이터전처리를 조금이라도 시간을 줄이고 싶은 나로써는 반가운 기능이 아닐 수 없다.
  • 장인은 도구를 탓하지 않는다고 하지만, 숙련된 장인이라도 좋은 도구를 찾기 마련이다. 좋은 도구를 사용하여서 분석에만 집중 할 수 있도록 하자.
profile
성장한 데이터분석가

0개의 댓글