데이터 전처리 후 윈도우환경의 작업자에게 파일을 전달하면
파일이 깨진다고 하는 경우가 많다.
UTF-8 인코딩을 열지 못하기 때문인데,
iconv
명령어를 활용하면 터미널에서 쉽게 변환이 가능하다.
find . -name "*.csv" -exec bash -c "iconv -f UTF-8 -t EUC-KR '{}' > '{}.euckr'" \;
원래 같으면 && 명령을 통해 파일명 재설정도 하나의 명령으로 가능하지만
변환에 성공했음에도 이상하게 아래와 같이 실패메시지가 뜬다.
iconv: ./result.csv:1137:0: cannot convert
iconv: ./result2.csv:1137:0: cannot convert
그래서 한 줄 더 입력해준다.
find . -name "*.euckr" -exec bash -c "mv '{}' '{}.csv'" \;
세상 모두가 UTF-8 을 쓰길