파일 인코딩 변환

종욱·2020년 12월 10일
0

데이터 전처리 후 윈도우환경의 작업자에게 파일을 전달하면
파일이 깨진다고 하는 경우가 많다.
UTF-8 인코딩을 열지 못하기 때문인데,

iconv 명령어를 활용하면 터미널에서 쉽게 변환이 가능하다.

find . -name "*.csv" -exec bash -c "iconv -f UTF-8 -t EUC-KR '{}' > '{}.euckr'" \;

원래 같으면 && 명령을 통해 파일명 재설정도 하나의 명령으로 가능하지만
변환에 성공했음에도 이상하게 아래와 같이 실패메시지가 뜬다.

iconv: ./result.csv:1137:0: cannot convert
iconv: ./result2.csv:1137:0: cannot convert

그래서 한 줄 더 입력해준다.

find . -name "*.euckr" -exec bash -c "mv '{}' '{}.csv'" \;

세상 모두가 UTF-8 을 쓰길

0개의 댓글