데이터셋의 기본적인 통계 요약 제공
데이터 분포 시각화 (히스토그램, 박스플롯 등)
상관관계 분석
Train vs Test 데이터 비교
두 개의 데이터셋 비교 (e.g., 기존 데이터 vs 새로운 데이터)
컬럼별로 차이점을 시각적으로 분석 가능
각 컬럼의 분포, 평균값, 이상치 탐색
숫자형 & 범주형 변수에 대한 통계 요약
결측치 확인
분석 결과를 HTML 파일로 저장하여 웹 브라우저에서 쉽게 확인 가능
컬럼별 탐색 기능 제공
컬럼별 데이터 분포 (히스토그램, 박스플롯 등)
상관관계(히트맵)
숫자형 & 범주형 데이터 분석
파일 크기와 컬럼 개수에 관계없이 탐색 가능
결측치 히트맵 제공
이상치 탐지
CSV, Excel, JSON, SQL 데이터베이스 연결 가능
실습 데이터 및 코드는 이상치 실습 코드 데이터 이용
import sweetviz as sv
from autoviz.AutoViz_Class import AutoViz_Class
import os
import webbrowser
AutoViz_Class().AutoViz(X_train)
report = sv.analyze(X_train)
report.show_html('./bike/sweetviz_report_df.html')
path = './bike/sweetviz_report_df.html'
webbrowser.open(os.path.realpath(path))
print(path, '파일 오픈 실행까지 확인')