Colab에서 Pandas 파일 불러오기, unicode에러

찌니·2021년 1월 6일
0

colab에서 Pandas Library를 이용해 외부 파일 불러오는 법

1. csv 파일 불러오기

import pandas as pd
df = pd.read_csv('파일명' or '파일경로')

csv는 구분자로 콤마(sep=',')를 추가해서 쓰지 않아도 된다.

2. text 파일 불러오기

# 구분자가 수직막대기(|)일때

import pandas as pd
df = pd.read_csv('파일명' or '파일경로' , sep='|')
# 구분자가 tap(\t) 일 때

import pandas as pd
df = pd.read_csv('파일명' or '파일경로' , sep='\t')
  • | (수직막대기) 키보드 위치 : backspace 아래 (shift + \ )
  • \t (탭) 키보드 위치 : backspace 아래 (\ = 백슬러쉬\)
    *슬러시(/)와 반대 주의

3. Excel 파일 불러오기

import pandas as pd
df = pd.read_excel('파일명' or '파일경로')

Excel 파일을 csv로 저장 후 다시 불러오기.

  1. 엑셀파일 불러오기
import pandas as pd
df =pd.read_excel('파일명.xlsx')
  1. csv로 저장 후 다시 csv 파일 불러오기
df.to_csv('csv로 저장할 파일 이름')
df1 = pd.read_csv('csv로 저장했떤 파일 이름')

외부파일 csv로 불러오기

  1. 구글코랩 파일 업로드 코드 입력
import pandas as pd
from google.colab import files
files.upload()
  1. 파일선택 누르고 파일 업로드하기

  2. csv 파일 불러오기

df = pd.read_csv('파일명')
df


Jupiter notebook 에서 csv 파일불러오기

  1. 먼저 주피터 노트북에 불러올 파일을 Upload 한다.
  2. 아래 코드 입력
import pandas as pd
df=pd.read_csv('파일명.csv', encoding='CP949')
df


파일 불러올 때 유니코드 에러표시 UnicodeDecodeError: 'utf-8' codec can't decode byte

구글 코랩으로 파일 불러오기 또는 드라이브 마운트로 파일 불러오기 시 Unicode Error가 뜰 때 ?

df = pd.read_csv('file' ,encoding= 'CP949')
또는 
df = pd.read_csv('file' ,encoding = 'latin')
profile
https://gggggeun.tistory.com/

0개의 댓글