'utf-8' codec can't decode byte 0xe9 in position 0: invalid continuation byte
에러 발생 이유
: 텍스트 파일을 읽거나 쓸 때, 파일의 인코딩이 잘못되었거나, 읽으려는 파일의 인코딩과 파이썬이 가정하는 인코딩이 맞지 않을 때 발생합니다
: 읽어드릴 파일의 포맷이 UTF-8이 아니기 때문에 발생한다.
: 에러를 무시하는 것이다.
: 다음과 같이 encoding_errors를 ignore로 하면 해결할 수 있다.
df = pd.read_csv('test.csv', encoding_errors='ignore')
: csv파일의 포맷을 찾아서 read_csv에 알려주는 것이다.
: chardet이란 모듈을 이용한다.
pip install chardet
# or
conda install chardet
설치를 하고 다음과 같이 실행해보자.
immport chrdet
with open("읽어올 파일 경로/읽어올파일.csv", 'rb') as rawdata:
result = chardet.detect(rawdata.read(10000))
print(result)
df = pd.read_csv('test.csv', encoding_errors='ISO-8859-1')