PySAL(Python Spatial Analysis Library)

2innnnn0·2020년 4월 12일
0

제목(읽은 자료)

5분 발표용 정리

Moran's I

  • 가장 일반적으로 사용되는 공간 상관 측정에 쓰는 기법.
  • 지리적 공간 상에서 발생하는 현상은 일반적으로 인접할수록 유사한 특성을 보인다. 앞서 이러한 특성을 공간적 자기상관성으로 정의
    • 인접한 읍면동끼리는 ‘대체적으로’ 비슷한 값을 보이는 것이 일반적이다. 이는 공간적 유유상종에 해당하는 일종의 공간적 구조이다.
  • 공간적 자기상관성은 지리적 인접성(geographical proximity)을 전제로 유사한 값들의 군집경향을 지칭한다. 공간적 자기상관성을 정량적으로 측정하기 위하여 다양한 지수들이 제안되었다. Moran’s I 통계량(이후 I 통계량)은 공간적 자기상관성을 정량화하기 위하여 가장 보편적으로 활용되는 통계지수들 중 하나이다.
  • 실증자료를 이용하여 I 통계량을 계산하 기 위해서는 네 단계의 분석적 절차가 필요하다.
    • 첫 번째는 분석대상지를 일정한 형태 및 크기의 공간분석단위(spatial analysis unit)로 분할하는 것이다
    • 두 번째는 지리적 공간상에서 발생하는 현상을 단위지역별로 집계하는 과정
      • 가령 2010년 기준 범죄 발생건수를 시군구별로 집계하는 과정을 예로 들 수 있다
    • 세 번째는 단위지역별로 집계한 결과들 간 유사성을 측정하는 과정이다.
      • 유사성은 다양한 맥락으로 정의할 수 있겠지만 공간가지상관성 관점에서 보면 기준이 되는 어떤 수치로부터 같은 방향으로 크거나 작은 정도로 정의할 수도 있다. 예를 들어, 두 시군구가 범죄 발생건수에 있어서 전국 평균보다 크다면 두 시군구는 같은 방향으로의 유사성을 보이는 것으로 간주하는 것이다.
    • 네 번째로 단위지역들 간 지리적 공간상에서의 인접성(spatial adjacency)을 규정하는 과정이다. 인접성 역시 폭넓은 개념을 가지는데 이를 정량화하는 방식 역시 다양하다. 일관된 규칙을 적용하여 단위지역들 간 인접성을 정량화하 는 것은 공간통계 분석기법의 핵심적 특성 중 하나이다
  • 전역적GLOBAL I 통계량은 분석대상지 내에서 비슷한 값들이 인접하여 분포하려는 전반적인 경향을 나타내는 반면,
    국지적LOCAL I 통계량은 대상지 내 특정 단위지역을 중심으로 주변 단위지역들이 얼마나 비슷한 값을 가지는지를 가늠.

가. 바둑판(혹은 체스판) 패턴. - 맨 왼쪽의 그림은 평균보다 큰 값들과 작은 값들이 번갈아가면서 규칙적으로 인접하여 분포한 공간패턴을 예시

  • ‘다’가 나타내는 패턴은 유사한 값들을 공간적으로 모으려는 공간과정이 작용한 결과로 볼 수 있다. ‘가’의 경우는 유사한 값들끼리 서로 인접하지 않으려는 공간과정의 결과 중 하나로 볼 수 있는데 이는 현실에서는 찾아보기 힘든 개념적 사례에 가깝다. 무작위 공간패턴의 경우 유사한 값들끼리 서로 끌어당기거나 밀어내려는 공간과정이 없음을 나타내 며 이는 ‘나’의 경우에 해당한다. 이러한 의미에서 유사한 값들이 군집하려는 정도는 바로 이 무작위 공간패턴과 얼마나 차이가 나는가를 기준으로 추정한 결과에 해당한다

자유로운 정리

1. Moran's I 통계량의 기술적 의미

1. Moran's I 통계량의 기술적 의미

지리적 공간상에서 발생한 현상들은 서로 인접할수록 비슷한 성격을 띠는 특성이 있는데, 이를 공간적 자기상관성(spatial autocorrelation)이라 한다. Tobler(1970)가 주창한 지리학의 제1법칙이 공간자기상관성의 의미를 분명히 설명하는데, "모든 사물이 서로 연관되어 있지만, 특히 가까이 있는 것들이 멀리 떨어져 있는 것들보다 더 밀접하게 연관되어 있다”고 한다. 예를 들어, 아파트 가격은 가까이 인접할수록 비슷할 것이다. 다른 조건(평형, 구조 등)이 비슷하다면 한 아파트 단지 평균가격이 가령 평당 1000만원인데 바로 옆 단지의 경우 500만원으로 떨어지는 경우는 쉽게 찾아보기 어려울 것이다. 즉, 높은 매매가를 가지는 단지들끼리 공간적으로 인접하려는 경향은 쉽게 찾아볼 수 있다. 이는 낮은 매매가의 경우에도 마찬가지이다. 공간적 자기상관성은 이러한 공간적 유유상종(類類相從)을 지칭하는 용어이다.

  • Pysal을 구성하는 요소들

    • Explore탐색

      • 모듈은 점, 네트워크 및 다각적 언어에 대한 통계적 시험을 포함하여 공간 및 공간-팀 데이터의 탐색적 분석을 수행한다. 또한 공간적 불평등과 분배 역학에 대한 방법을 포함한다. modules to conduct exploratory analysis of spatial and spatio-temporal data, including statistical testing on points, networks, and polygonal lattices. Also includes methods for spatial inequality and distributional dynamics.
    • Viz시각화

      • 공간 데이터의 패턴을 시각화하여 클러스터, 특이치 및 핫 스팟을 탐지합니다.visualize patterns in spatial data to detect clusters, outliers, and hot-spots.
    • model모델

      • 다양한 선형, 일반 선형, 일반화된 추가 및 비선형 모델을 사용하여 데이터의 공간 관계를 모델링 합니다. model spatial relationships in data with a variety of linear, generalized-linear, generalized-additive, and nonlinear models.
    • libs라이브러리 (Core)
      - 매우 다양한 컴퓨터 기하학 문제를 해결합니다.solve a wide variety of computational geometry problems:
      - 다각적인 격자, 선, 점들로부터 그래프 구조.graph construction from polygonal lattices, lines, and points.
      - 공간 무게 행렬과 그래프의 구성과 상호 작용 편집construction and interactive editing of spatial weights matrices & graphs
      - 알파 형상, 공간 지수 및 공간-위상 관계의 연산computation of alpha shapes, spatial indices, and spatial-topological relationships
      - 스파스 그래프 데이터뿐만 아니라 공간 벡터 데이터의 순수 python판독기의 읽기 및 쓰기.reading and writing of sparse graph data, as well as pure python readers of spatial vector data.

      PySAL API DOC: https://pysal.readthedocs.io/en/latest/api.html

      2019년도 1월 기점으로 대규모 마이그레이션을 진행. 핵심기능이 변화했기 보다는 python 2에서 3버전으로 전용으로 하기 위함이라 적혀있음.

      Pysal.lib 는 기능이 많아서 별도 libpysal 패키지로 쓸 수 있게 해놓았음.

      오늘 예제에서는 1.14.4 버전의 레거시로 진행함.

- Computational Geometry
    - MST
    - Voronoi
    - Hulls
- weights
    - GAL
    - GWT
    - MAT
- Clustering
    - ARISEL
    - AZP
    - max-p
- EDSA
    - smoothing
    - LISA (Local indicators of spatial association)([https://en.wikipedia.org/wiki/Indicators_of_spatial_association](https://en.wikipedia.org/wiki/Indicators_of_spatial_association))
- Spatial Econometrics
    - Estimation
    - Testing
    - Diagnostics
    - Simulation
- Spatial Dynamics
    - Spatial theta
    - spatial tau
    - spatial Markov

보너스)
https://www.youtube.com/watch?v=qQNOlfOYtyw&t=1031s

다음 시간에 공간 군집 분석. spatial Clustering.

느낀점(인상 깊은 것, 아쉬운 것, 더 궁금한 것 등)

  • 많은 기능에 비해 아직 스타가 많지 않은게 좀 의아.
  • 공간통계로 머신러닝을 할 수 있다.
profile
성장하고 싶은 데이터분석가.

0개의 댓글