Pandas Dataframe 전체 출력하기

YoungBeen Jo·2022년 1월 20일

pandas를 통해 data handling할 때, jupyter notebook이나 colab에서 주로 사용하게 되는 이유 중 하나가 데이터를 바로 출력해가며 handling 할 수 있기 때문이다.

하지만 데이터의 길이가 길면 다음과 같이 중간은 ···으로 생략되게 된다.

이럴때 데이터의 출력을 조절하는 옵션은 아래와 같다.

import pandas pd
 
# row 생략 없이 출력
pd.set_option('display.max_rows', None)
# col 생략 없이 출력
pd.set_option('display.max_columns', None)

위의 None을 숫자로 입력해주게 되면 입력한 숫자만큼 나오게된다.
하지만 여기서 중요한 사실이 하나 있는데, 이렇게 설정해주면 앞으로 모든 값들이 설정한대로 출력된다.
(데이터가 큰 경우에는 jupyter가 멈출 수도 있다..)

그래서 나의 경우는 pandas의 option을 임시로 설정해준다.

with pd.option_context('display.max_rows', None, 'display.max_columns', None):
     print(corpNP[corpNP['사업장명'].str.contains('하나은행')])

위와 같이 with문을 활용하면 해당 print만 임시로 생략없이 출력할 수 있다.
단, jupyter의 원래 dataframe처럼 이쁘게 나오지는 않는다.

profile
Data Gooooner

0개의 댓글