[26일차]Pandas 입문 - 모듈 참조, 파일 불러오기, 한글오류 해결

김준석·2024년 1월 1일
post-thumbnail

Google Colab 환경에서 진행.

슬램덩크 플레이어 파일을 활용하여 강의 진행.

https://docs.google.com/spreadsheets/d/1wmAQ8bWCZUMvNDz07IINuqQ-C_GYugTpeyCmB2DFS-o/edit#gid=0

필요 모듈 참조하기

  • 판다스를 사용하기 위해서는 먼저 pandas 라이브러리를 불러와야 된다.
  • numpy라는 수학배열관련 모듈을 같이 불러온다.(딥러닝, 데이터분석에 많이 사용.)
  • matplotlib.pyplot 이라는 데이터 시각화 모듈을 같이 불러온다.
    • 요즘은 비슷한 기능의 seaborn을 많이 사용
import pandas as pd ##pd라는 별칭을 지어줌.
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

excel 파일을 pandas로 읽어 오기.

실습환경에 필요한 슬램덩크 능력치 파일을 불러오자.

# read_excel : 엑셀 파일 읽기
df = pd.read_excel('./slamdunk_player_stats.xlsx')

pandas로 파일을 읽어올때는 read_excel or read_csv 와 같은 함수를 사용한다.
인자값으로는 (파일경로+파일명)을 넣어주면 된다.

불러오려는 파일 우측 클릭 후 [경로로 복사] 선택 후 인자에 붙여넣기.

df = pd.read_excel("C:\Users\USER\Downloads\slamdunk_player_stats.xlsx")

이때 \ (역슬래쉬) 표시는 / 이 표시로 변경해준다,

df = pd.read_excel("/Users/USER/Downloads/slamdunk_player_stats.xlsx")

df 함수를 실행했을 때 엑셀구조와 동일한 결과가 나온다.

다른점은 좌측에 인덱스 번호가 추가!

여기서 print를 안하고 df 함수만 실행했는데 왜 결과값이 나오나?

pandas 환경에서는 여러 줄로 이루어진 코드 가운데 마지막 코드줄을 출력하는 기능을 탑재하고 있다.

예시) df입력 후 밑에 3+3을 입력

그렇기 때문에 따로 print 함수를 안써줘도 됨.


Google Colab - suqqest charts

suqqest charts란 구글 코랩에서 지원하는 자동 차트 변형기이다.

해당 기능을 이용해서 차트를 만드려고 했지만 한글 오류가 발생한다.

이를 해결해 보자.

한글 이슈 해결

  1. 한글 이슈 해결 - 로컬 환경

vsc, 아나콘다 등 로컬적으로 사용하는 환경에서 한글 이슈 발생시 아래와 같이 해결할 수 있다.

먼저, os와 matplotlib.pyplot 라이브러리를 참조해준다.

이후 운영체제가 맥인지 윈도우인지 확인 후 폰트를 변경해주면 해결!

import os
import matplotlib.pyplot as plt
if os.name == "posix": #운영체제가 posix(맥)일경우
	plt.rc("font", family = "AppleFothic")
else: #운영체제가 window일 경우
	plt.rc("font", family = "Malgun Gothic")
  1. 한글 이슈 해결 - Colab 환경

구글 코랩 환경에서 한글 이슈 발생시 아래와 같이 해결할 수 있다.

먼저 우리가 아는 폰트를 강제적으로 다운받아줘야 된다.

 # 한글 이슈 해결 - Colab
!sudo apt-get install -y fonts-nanum #나눔폰트 다운로드
!sudo fc-cache -fv #cache관련 명령어 사용
!rm ~/.cache/matplotlib -rf #cache를 강제로 삭제하겠다.

이제 다운 받은 폰트들에서 내가 아는 폰트명으로 세팅.

plt.rc('font', family = 'NanumBarunGothic')

이후 런타임 재시작을 하면 오류 해결!

suqqest charts

이제 이슈 없이 해당 차트를 볼 수 있게됨.

0개의 댓글