XML 파일에서 눈에 보이지 않는 리턴(즉, 개행 문자나 공백 문자 등)을 제거하려면, XML 파싱 라이브러리를 사용하거나 문자열 처리 기법을 사용할 수 있습니다. 여기서는 Python의 ElementTree
라이브러리를 사용하여 XML 파일을 파싱하고, 불필요한 공백을 제거하는 방법을 예시로 들어보겠습니다.
ElementTree
를 사용하여 XML 구조를 읽습니다.import xml.etree.ElementTree as ET
def remove_whitespace(elem):
"""요소와 자식 요소의 텍스트에서 공백을 제거하는 함수"""
if elem.text:
elem.text = elem.text.strip()
for child in elem:
remove_whitespace(child)
if child.tail:
child.tail = child.tail.strip()
# XML 파일 로드
tree = ET.parse('your_file.xml')
root = tree.getroot()
# 공백 제거
remove_whitespace(root)
# 변경사항을 새 파일에 저장
tree.write('cleaned_file.xml')
이 코드는 XML 구조를 유지하면서 모든 요소의 불필요한 공백을 제거합니다. your_file.xml
은 처리하고자 하는 XML 파일의 이름으로 바꾸어 주세요.
만약 특정 요소만 선택적으로 공백을 제거하고 싶다면, ElementTree
의 find
나 findall
메소드를 사용하여 특정 요소를 찾고 해당 요소에 대해서만 공백 제거를 수행할 수 있습니다.