[Encoding] 한글명 파일 깨짐 발견

adam adam·2022년 9월 13일
0

사례1

내 윈도우 노트북에서 git bash shell로 같은 문제 알집을 보면 한글명이 깨지는 게 보인다. 그리고 액면가로는 역시나 명령어가 안먹는다.

물론, 정확히는 리눅스 서버 상에서 발생하는 경우는 아니지만,
이러한 단서들로부터 추론할때, 과거의 인코딩 문제를 가진 파일들의 한글 이름이 깨졌고, 이에 따라 처음부터 utf-8로 보내야 했을 것이다.

분석

비록, 윈도우 OS 상에서의 사례지만, 리눅스 서버와 같이 Bash Shell을 사용한다는 점에 집중하여 문제를 분석해봤다.

우선 locale을 통해 현재 인코딩을 확인해보았다. 참고로 git bash shell의 경우 쉘 창을 우클릭하면 Options 항목의 text에서 인코딩을 바꿀 수 있다.

현재 eucKR로 쉘의 인코딩을 변경 해도,
UTF-8로 저장된 파일 이름들이 ls 하면 정상적으로 조회된다. ??? 이 아니라

운영체제의 인코딩이 문제가 아니라, 명령어(one of shell's utilities)마다의 무언가가 문제일 수도 있다고 우선 정리.

한편,
내 개인 윈도우 노트북으로 gitbash 상에서 UTF-8로 인코딩된 파일들에 대해, 인코딩을 eucKR로 변경하고 조회해도

file -i *

하면 한글명이 하나도 안깨진다.

어쩌면 git 다운로드 시, 접근하는 미러 사이트들의 파일들이 들쭉날쭉할지도 모른다고 추가적으로 생각하는 중이다.

그리고 리눅스 운영체제 실험상황같이 Bash Shell이라는 공통점에 집중하였지만,
근본적으로 윈도우 운영체제에서의 실험으로서 실험 조건이 불명확하다.

0개의 댓글