- QGIS는 데이터를 생성하기 보다는 기존에 만들어진 것을 사용하거나, 다른 유형의 데이터를 지리적으로 분석하기 위해 사용하는 경우가 많다.
- 때문에 지리데이터를 확인하고 불러오는 방법을 알고 있어야 한다.
- 국가공간정보포털이나 공공데이터 포털에서도 많은 데이터를 받을 수 있다.
1) 공간데이터 다운받기
데이터의 경우 무엇보다 신뢰성과 정확성이 중요하다. 따라서 국가에서 제공하는 데이터를 잘 활용하는게 좋다.
국가공간정보포털에서 제공하는 오픈마켓과 공공데이터 포털에서는 좋은 품질의 데이터를 쉽게 찾을 수 있다.
[1] 국가공간정보포털
[링크]

개방공간에서 오픈마켓을 들어간다.

행정동 경계를 받고 싶다면 검색으로 쉽게 찾을 수 있다.

데이터와 정의서를 다운로드로 데이터를 받을 수 있다.

파일은 엑셀파일(정의서)와 쉐이프 파일(.shp)을 확인할 수 있다.
[2] 공공데이터 포털
[링크]

공공데이터 포털에서도 다양한 데이터를 찾을 수 있다.

전국초중등학교위치표준에 대한 정보를 찾게되면 다음과 같이 데이터에 대한 출처와 설명을 알 수 있다.

CSV로 다운로드를 눌러 파일을 저장해주자.
2) 데이터 불러오기
[1] SHP 파일

[레이어] - [레이어 추가] - [벡터 레이어 추가]

.shp 파일만 선택

추가를 선택하면 레이어에 데이터가 추가된다.
[2] CSV
SHP의 경우 .shp 파일 이외에 다른 파일로부터 좌표계와 데이터프레임등의 정보를 받아오기 때문에 자동으로 데이터가 저장이 된다. 하지만 CSV 파일의 경우에는 어느 정도의 설정이 필요하다.
- CSV는 쉼표로 구분된 구분된 텍스트 데이터(comma-separated values)를 의미한다.
- 데이터를 쉼표를 기분으로 구분하여 2차원 데이터 형태를 나타낸다.
- 문자열 조립을 통한 간단한 형식 구조라 처리 과정이 쉽고 범용성이 뛰어나다.
- 데이터를 문자로 보관하기 때문에 용량이 작고 보관이 용이하다.
- 하지만 쉼표 사용에 제한이 있고 데이터가 쉽게 변형되거나 오염되기 쉽다.

레이어 메뉴에서 구분자로 분리된 테스트를 선택하고 csv 파일을 불러온다.

이때 데이터가 깨져서 나오는데 인코딩 문제일 가능성이 높다.

인코딩을 EUC-KR로 변경해주면 깨지지 않고 잘 나온다.

파일 포맷의 경우 기본적으로 CSV로 되었다. 이는 쉼표를 기준으로 해당 데이터를 구성했다는 의미다.

하지만 파일에 따라 쉼표가 아니라 탭이나 다른 문자로 구분자를 설정한 경우도 있으니 필요에 따라 파일 포맷을 변경해줄 필요도 있다.

레코드와 필드에서는 첫 레코드가 필드 이름인지, 무시할 머리글 행 수등 다양한 설정이 가능하다.
만약 데이터의 첫 줄이 필드 이름이 아니라면 해당 체크를 해제하면 된다.

CSV는 도형에 대한 정의가 데이터 테이블에 포함되어 있다. 해당 데이터는 데이터 내부에 경도와 위도가 포함되어 있기 때문에 X와 Y에 경위도를, 좌표계를 4326으로 설정해야 한다.
당연히 이 경우에는 포인트 도형만 표현할 수 있다.

CSV로 포인트 외에 도형을 표시하고 싶다면 WKT를 사용할 수도 있다.
- WKT는 텍스트를 통한 도형 정의를 의미한다
- 도형의 정의와 좌표값을 다음과 같은 형식으로 표현하여 문자열로 기입힌다.
- WKT로 포인트, 라인스트링, 폴리곤 등을 표현할 수 있다.

애초에 도형없이 데이터의 결합만을 위해 데이터 테이블만 있는 레이어를 추가할 수도 있다.

추가를 하게 되면 다음과 같이 포인트들이 캔버스에 나타나게 된다.