ADP 5과목 - 데이터 시각화

DMIS·2023년 2월 16일
0

ADP 필기

목록 보기
5/13
post-thumbnail

✐ 요약

✔︎ 시각화 인사이트 프로세스의 의미 → 시각적 이해의 위계

  • 데이터
    • 각각 분리된 개별적인 기초자료(원자료)
    • 데이터는 불완전하고 비연속적이며, 완전한 메시지가 아니므로 정보 전달 측면에서의 가치는 없다.
    • 예시 : 강수량
  • 정보
    • 데이터 간의 관계(상관관계, 인과관계)가 생성된 것
    • 서로 다른 데이터 간의 관계와 일정한 패턴을 가시화시킴으로써 정보를 보는 사람에게 내포하는 의미를 전달한다.
    • 예시 : 지역별 연간 강수량
  • 지식
    • 다양한 정보가 상위 개념의 관계를 맺고 조직화 된 것
    • 인류가 그동안 축적한 총체적인 정보가 조직적으로 재구성되어 새로운 의미가 도출되는 것
    • 예시 : A마을의 수해대책
  • 지혜
    • 개인화된 지식, 개인의 경험, 사고, 감정 체계와 결합되고 관계를 맺을 때 구조화되어 나타남
    • 지혜는 개인적 이해의 수준에 따라 결정되는 것으로, 도달하기 어려운 단계이며, 자기 내면화한 지식이기 때문에 명시적인 언어로 상대방에게 전달하기 어렵다.
    • 예시 : A마을 주민 개개인의 생활 노하우

✔︎ 시각화 인사이트

  • 삼(3)찰 : 관찰 → 성찰 → 통찰
    • 관찰 : 외부 세계의 온갖 대상과 그 대상들 사이의 상호작용을 관찰하면서 의미있는 관계를 찾아내는 것
    • 성찰 : 자신의 내면 세계를 깊이 살펴보는 것
    • 통찰 : 관찰과 성찰을 기반으로 내부와 외부 요인들 간의 관계를 통해 살펴보는 것
  • 삼찰을 바탕으로 대상과 대상들 사이의 숨겨진 관계를 찾아냄으로써 인사이트를 얻을 수 있다.

✔︎ 시각화 인사이트 프로세스 : 탐색 → 분석 → 활용 → 탐색(반복)

구분대상목표시각화 형태
탐색자료(데이터, 정보, 지식, 지혜)자료 사이에 존재하는 관계패턴파악
분석자료 사이의 관계관계의 구체적인 형태
자료의 상위/확장 개념(정보, 지식, 지혜 → 통찰)
그래프 분석
활용자료의 상위/확장 개념(정보, 지식, 지혜 → 통찰)내부에서의 적용
외부 대한 설명/설득
통찰의 검증과 정교화
인포그래픽

✔︎ 빅데이터 시각화 프로세스 : 정보 구조화 → 정보 시각화 → 정보 시각 표현

단계설명
정보 구조화데이터를 수집하고 정제하는 과정이므로 데이터세트를 만들기 위한 분석 도구가 필요하다.
정보 시각화주로 분석 도구에서 제공하는 그래프나 분석 도구의 특성에 따른 시각화가 이루어진다.
정보 시각 표현시각화의 의도를 강화해 전달하기 위해 분석도구에서 만든 결과물에 별도 그래픽 요소를 추가해 완성한다.

✔︎ 시각화 방법 → 시각 정보 디자인 7원칙

  • 정보 구조화, 정보 시각화, 정보 시각표현을 거쳐 최종적으로 시각화가 완성된다.
  • 에드워드 터프티는 아래 표와 같은 시각 정보 디자인 7원칙을 제시했다.
원칙내용
1. 시각적 비교를
강화하라
연관된 변수와 트렌드를 비교할 수 있는 도구를 제공해야 한다.
정보는 비교를 통해 사용자에게 더욱 가치가 올라간다.
2, 인과 관계를
제시하라
정보를 디자인할 때 원인과 결과를 명쾌하게 제시하라
3. 다중변수를
표시하라
여러 개의 연관된 변수를 활용해 정보를 표현하는 데이터도 있다.
4. 텍스트, 그래픽, 데이터를
한 화면에 조화롭게 배치하라
라벨과 범례가 도표에 녹아있는 다이어그램이 더욱 효과적이다.
5. 콘텐츠의 질과 연관성, 진실성을
분명히 하라
보여주려는 정보가 과연 사용자가 특정 목적을 달성하는 데 도움이 되는지를 고민하라
6. 시간순이 아닌
공간순으로 나열하라
시간보다는 공간에 따라 나열할 때 사용자의 이해가 쉬워진다.
7. 정량적 자료의 정량성을
제거하지 마라
트렌드를 나타내기 위해 정량적 자료를 그래프나 도표로 표현할 수 있다.
→ 정량적인 정보를 한 눈에 파악할 수 있기 때문이다.

✔︎ 시각화 방법 → 정보 시각화

시간 시각화분포 시각화관계 시각화비교 시각화공간 시각화
막대그래프
누적 막대그래프
점그래프
파이차트
도넛차트
트리맵
누적연속그래프
스캐터플롯(산점도)
버블차트
히스토그램
히트맵
체르노프 페이스
스타차트
평행 좌표계
다차원 척도법
지도 매핑

✐ 오답노트

⚑ 문제1

데이터 명세화와 관련된 설명으로 가장 적절하지 않은 것은 무엇인가?
① 측정값을 분류할 수 있는 모든 것은 차원이 될 수 있다.
② 차원과 측정값의 구분은 데이터의 성격에 따라 정해진 것이 아니기 때문에 분석 형태에 따라 얼마든지 달라질 수 있다.
③ 데이터를 명세화할 때는 어떤 단위나 형태로 표현되는지와 표현해야 하는지에 대해 항상 주의를 기울여야 한다.
④ 하나의 차원이 하나의 값으로 고정되었더라도 반드시 차원이라고 명시해야 한다.

정답
해설
하나의 차원이 하나의 값으로 고정된 경우에는 차원이라고 하지 않는 경우도 있다.

⚑ 문제2

변수들간의 선형/비선형 인과관계의 형태와 강도를 추출할 때 사용하는 통계적 분석기법으로 부적절한 것은 무엇인가?
① 회귀분석
② 로지스틱 회귀분석
③ 요인분석
④ 판별분석

정답
해설
요인분석은 어떤 결과에 영향을 미치는 요인들 사이의 관계와 핵심 요인을 선별하는 통계적 분석기법이다.

⚑ 문제3

인사이트를 활용함에 있어 더욱 발전시키고 확장할 수 있는 방법들 중 성격이 다른 하나는 무엇인가?
① 살펴볼 데이터의 형태를 둘 이상의 차원과 측정값의 구조로 잡았다는 것은 이미 그 데이터에 대해 여러 가지 관점으로 살펴볼 준비가 되었다는 의미이다.
② 계층 구조를 형성하는 하나의 차원 안에서 세부적인 하위 차원으로 분할해보는 것이다.
③ 먼저 전체 데이터에 대해 패턴을 탐색한 다음에, 이것을 일정 기준에 따라 쪼개 일부분만 보는 것이다.
④ 피벗 테이블 분석에서는 결국 행과 열에 어떤 차원을 배치하느냐이며, 시각화 도구도 바로 적용할 수 있다.

정답
해설
①, ③, ④ : 잘라보고 달리보기(슬라이스 & 다이스)
② : 내려다보고 올려다보기(드릴다운 & 리버스 드릴다운)

  • 잘라보기(슬라이스)
    • 먼저 전체 데이터에 대해 패턴을 탐색한 다음에, 이것을 일정 기준에 따라 쪼개 일부분만 보는 것
  • 달리보기(다이스)
    • 여러 개의 차원이 있는 경우, 차원들을 일정 기준으로 잘라내 서로 다른 관점의 단면들을 살펴보는 것
  • 피벗 테이블 분석에서의 슬라이스 & 다이스는 결국 행과 열에 어떤 차원을 배치하느냐이며, 시각화 도구도 바로 적용할 수 있다.
  • 내려다보기(드릴다운)
    • 현재 바라보는 관점에서 하위 계층으로 기준을 세분화하는 것
    • 잘라보기(슬라이스)는 어떤 차원을 기준으로 살펴보느냐에 대한 것이지만, 내려다보기(드릴다운)은 계층 구조를 형성하는 하나의 차원 안에서 세부적인 하위 차원으로 분할해보는 것이다.
  • 올려다보기(리버스 드릴다운)
    • 현재보다 상위 계층의 관점에서 보는 것

⚑ 문제4

시각적 이해의 위계구도상에서 하위의 개념이 조직화되어 만들어진 단계로 적절한 것은 무엇인가?
① 데이터
② 정보
③ 지식
④ 지혜

정답
해설

  • 데이터 : 개별적인 요소 하나하나
  • 정보 : 데이터 간의 관계가 생성된 것(연관된 요소들)
  • 지식 : 다양한 정보가 조직화된 것
  • 지혜 : 개인화된 지식(적용된 지식)

⚑ 문제5

에드워드 터프티가 제시한 시각 정보 디자인 7원칙의 내용으로 가장 부적절한 것은 무엇인가?
① 시각적 비교를 강화하여 정보의 가치를 높일 수 있다.
② 라벨과 범례가 도표에 녹아있는 다이어그램이 더욱 효과적이다.
③ 여러 개의 연관된 변수를 활용해 정보를 표현하는 데이터도 존재한다.
④ 공간이 아닌 시간순으로 나열할 때 사용자의 이해가 더욱 쉬워진다.

정답
해설
사간이 아닌 공간순으로 나열할 때 사용자의 이해가 더욱 쉬워진다.

⚑ 문제6

시각화 및 빅데이터 시각화에 대한 설명으로 가장 부적절한 것은 무엇인가?
① 빅데이터의 시각화는 그래픽 능력이 아닌 전문 빅데이터 분석능력과 동시에 시각화 능력, IT 기술 위에 서비스로 구현할 수 있는 능력을 선호한다.
② 정보 디자인을 위해서는 데이터의 범주 안에서 정보를 보고, 사용자를 위한 시각화 목적을 설정하고 이를 끝까지 고수해야 한다.
③ 전문 데이터 마이닝과 이를 연결하는 툴을 시각화 도구와 연계해 활용하지 못한다면 시각화의 가치를 창출하지 못하는 결과를 불러온다.
④ 시각화 과정에서는 정보 수용자의 관점만을 중심으로 표현하기 때문에, 작성자의 관점에서 정보를 해석하고 보여주려는 경향을 보여야 중립적인 해석을 기대할 수 있다.

정답
해설
시각화 툴이나 프로그래밍 과정에서 자칫 정보 수용자의 관점보다는 데이터 자체를 표현하는 경향도 종종 나타난다.(객관적인 데이터 설명)

⚑ 문제7

인터랙션 방식에 대한 설명으로 가장 부적절한 것은 무엇인가?
① 강조하고 디테일을 보여주는 형식에서는 비교 가능한 통계 그래프보다 더 많은 데이터 세트를 관찰할 수 있도록 한다.
② 인터랙티브 시각화의 장점 중 하나는 콘텐츠 보는 방식을 사용자가 결정할 수 있다는 것이다.
③ 여러 가지 방법으로 데이터 보여주기에서는 다중 기준 부분을 복합하고 조정해 사용자는 같은 시간에 데이터세트의 다른 면을 볼 수 있다.
④ 사용자 지정으로 시각 맵핑 변화에서는 사용자가 다른 설정을 할 때, 데이터가 맵 위에 시각 레이어를 프로잭션하는 방식으로 나타난다.

정답
해설
①은 사용자가 콘텐츠를 선택하는 방식에 대한 설명이다.

⚑ 문제8

정보 디자인 프로세스에서 단계와 설명의 연결이 가장 부적절한 것은 무엇인가?
① 데이터 수집 단계에서 시각화 전문가가 원데이터를 직접 수집하기는 어렵다.
② 계층 구조 만들기에서 컬러, 타이포그래피 등의 좀 더 주관적인 관점에서 디테일을 만들어가는 것이 좋다.
③ 포맷 선택하기 단계에서 충분한 예산이 있다면 데이터 시각화를 위한 가능성을 보여주는 인터랙션을 시도해보는 것도 좋다.
④ 초기 데이터의 아름다움을 만들어내는 것은 시각 접근방법 결정하기 단계의 한 방법이다.

정답
해설
②는 4단계(문제의 정의 단계)의 내용이다.

⚑ 문제9

정보 디자인 프로세스에서 중요한 정보에 대해 이해 가능한 시각표현 방법을 만들어내고, 이렇게 만들어진 시각표현을 사람에게 정보의 게층구조를 이해하도록 만드는 단계는 무엇인가?
① 내러티브 찾기
② 와이어프레임 그리기
③ 시각적 접근 방법 결정하기
④ 정제와 테스트

정답
해설
②는 6단계(와이어프레임 그리기)에 대한 설명이다.

profile
Data + Math

0개의 댓글