XML은 데이터를 저장하고 전달할 목적으로 만들어졌으며, 저장되는 데이터의 구조를 기술하기 위한 언어이다.
서로 호환되지 않는 데이터 타입을 사용하는 시스템 간의 데이터 교환에는 많은 시간과 노력이 발생한다.
또한, 이렇게 데이터를 변환하는 과정에서 데이터의 손실이 발생하는 경우도 종종 있다.
하지만 XML은 데이터를 텍스트 형식으로 저장하므로, 소프트웨어나 하드웨어에 독립적으로 데이터를 저장하고 전달할 수 있다.
따라서 XML을 사용하면 새로운 운영체제나 프로그램, 브라우저 등에 상관없이 데이터를 안전하고 손쉽게 전달할 수 있다.
XML문서는 HTML 문서와 마찬가지로 트리 형태의 계층 구조를 가진다.
이러한 XML 트리는 하나뿐인 루트요소부터 시작하여, 각각의 자식 요소에 차례대로 연결된다.
XML 트리 구조에 포함되는 모든 요소는 자신만의 자식 요소를 가질 수 있다.
부모(parent) 요소는 여러 개의 자식(child) 요소를 가질 수 있다.
하지만 자식 요소는 단 하나의 부모 요소만을 가진다.
형제(sibling)요소는 같은 트리 레벨(tree level)에 존재하는 요소를 가리킨다.
즉, 형제 요소란 같은 부모 요소를 가지는 자식 요소 간의 관계를 나타낸다.
조상(ancestor)요소란 부모 요소를 포함해 계층적으로 현재 요소보다 상위에 존재하는 모든 요소를 가리킨다.
자손(decendant)요소란 자식 요소를 포함해 계층적으로 현재 요소보다 하위에 존재하는 모든 요소를 가리키낟.
XML 트리의 모든 요소는 자신만의 텍스트나 속성을 가질 수 있다.
기본적인 XML 문서는 다음과 같이 구성된다.
<?xml version="1.0" encoding="UTF-8"?>
<shop city="서울" type="마트">
<food>
<name>귤</name>
<sort>과일</sort>
<cost>3000</cost>
</food>
<food>
<name>상추</name>
<sort>야채</sort>
<cost>2000</cost>
</food>
</shop>
XML 문서는 맨 첫줄에 태그를 사용하여 XML문서임을 명시해야 한다.
<?xml version="1.0" encoding="UTF-8"?>
그 다음에는 XML 문서에 단 하나만이 존재하는 루트 요소를 생성한다.
이 루트 요소는 XML 문서에 존재하는 모든 요소의 조상(ancestor)요소가 된다.
<shop city="서울" type="마트">
위의 예제에서 루트 요소는 자식요소로 두 개의 <food>요소를 가진다.
<shop city="서울" type="마트">
<food>
...
</food>
<food>
...
</food>
</shop>
첫 번째 <food>요소는 <name> 요소, <sort>요소, <cost>요소의 총 세 개의 자식 요소를 가진다.
<food>
<name>귤</name>
<sort>과일</sort>
<cost>3000</cost>
</food>
위에서 살펴본 XML 문서는 상점에서 판매하는 식품에 관한 정보를 담고 있는 문서임을 명확하게 알 수 있다. 이처럼 XML 문서에서 요소의 이름은 저장하고 있는 데이터의 내용을 명확히 알려준다. 따라서 요소의 이름만으로도 데이터의 내용을 짐작할 수 있다.