adp_5과목 정리

ilysm96·2023년 5월 17일
0

1장 시각화 인사이트 프로세스

DIKW

  • Data
    - 연구나 발견 결과인 일종의 기초자료
    - 위계도 : 시각화
  • Information
    - 생산자와 사용자 관점에 따라 다름, 형태와 형식, 자기 조직화 되지 않은 일반적인 의미
    - 위계도 : 디자인
  • knowledge
    - 다른 영역의 정보가 자기 조직화해 획득할 수 있는 것
    - 위계도 : 맵핑
  • Wisdom
    - 자기 내면화한 지식이기 때문에 명시적인 언어로 상대방에게 전달 어려움

시각화와 인사이트

  • 시각화 인사이트 프로세스 : 시각화를 통해 통찰을 추출하는 과정
  1. 탐색 (관계 발견)
    • 모든 데이터는 기본적으로 하나 이상의 측정값, 하나 이상의 차원을 갖고 차원과 측정값는 분석형태에 따라 달라질 수 있다
    • 데이터 구성원리
      - 이벤트 기록 접근 (어떤 이벤트로 생성 구성 되었는지)
      - 객체지향 관점에서 접근 (데이터 구조 설계 생성 후 통찰)
    • 연결고리 확인
      - 공통요소로 변환 (형태를 변환하여 연결고리)
    • 탐색 범위의 설정
  2. 분석 (관계 규명)
    • 평균에 대한 검정 및 추정 : t검정
    • 비율에 대한 검정 및 추정 : F분포법, 직접 확률 계산법
    • 분할표의 검정 : 카이제곱, Fisher 직접 확률 검정, 잔차 분석
    • 변수간 상관관계 : 상관분석
    • 변수간 선형/비선형 인과관계 및 강도 추출 : 회귀, 다중회귀, 로지스틱, 판별분석
    • 결과에 영향을 끼치는 요인들 사이 관계 : 요인분석, 주성분 분석
    • 대상 기준값에 따라 분류 및 다차원 공간 배치 : 군집분석, 다차원 척도법
    • 패턴이 비슷한 측정값과 그렇지 않은 측정값 분류 : 대응 분석
    • 시간의 흐름에 따라 변하는 데이터 : 시계열 분석
  3. 활용 (활용-통찰 검증 및 보안)
    • 인사이트 발전과 확장
      - 처음 살펴볼 때 : 보텀업
      - 적용하는 과정에서 추가로 얻어낸 정보 : 탑다운
      - 잘라보기 달리보기 내려다보기 올려다보기

2장 시각화 디자인

시각화 분류와 구분

  • 데이터 시각화
    - 그래픽 의미를 이용해 명확하고 효과적으로 커뮤니케이션 위함

  • 정보 시각화
    - SW시스템 라이브러리, DB 코드 같은 비수치정보, 인터넷 네트워크 관계 등 큰 범위 집합 시각적 표현
    - 분기도, 수지도, 히트맵, 트리맵

  • 정보 디자인
    - 복잡하고 구조적이지 않은 기술 데이터를 시각적 표현
    - 양적 정보 디자인은 데이터 객관적 비교해 인과관계를 왜곡 없이 전달 초점

  • 인포그래픽
    - 중요한 정보를 한 장의 그래픽으로 표현해 보는 사람들도 손쉽게 해당 정보 이해
    - raw data를 취급하지 않음
    - 정보형 메세지와 설득형 메세지

시각화 프로세스

빅데이터 시각화 프로세스 - 벤 프라이 7단계 방법론

  • 원하는 데이터를 직접 획득하여 상호작용까지 모든 단계를 아우르는 프로세싱
  1. 정보 획득 : 파일 디스크 등 정보 수집
  2. 분해 : 의미를 바탕으로 카테고리화
  3. 선별 : 불필요한 정보 제거
  4. 마이닝 : 데이터 분석 및 정보 추출 알고리즘 도출
  5. 표현 : 얻은 정보를 효율적 표출 방법 연구
  6. 정제 : 정보를 시각적으로 정제
  7. 상호작용 : 정보를 다양한 시각에서 시뮬레이션

빅데이터 시각화 프로세스

1단계 : 정보구조화 = 데이터를 수집하고 정제
2단계 : 정보 시각화 = 분석 도구 그래프나 분석 도구 특성에 따른 시각화 ex) 태블로, power BI
3단계 : 정보 시각표현 = 분석 도구에서 만든 결과물에 별도 그래픽 요소 추가

시각화 방법

1. 정보구조화

  • 정보의 조직화 : 분류 배열 관계 맺기
  • 데이터 수집 및 탐색
  • 데이터 분류하기 : 구분 텍스트(CSV, TSV), JSON, XML
  • 데이터 배열하기 : LATCH (location, alphabet, time, category, hierarchy)
  • 데이터 재배열 (사용자가 인식하기 쉽게 재배열)

2. 정보시각화

  • 시간시각화 : 막대, 누적막대, 점그래프
  • 분포시각화: 파이차트, 도넛차트, 트리맵, 누적 연속 그래프
  • 관계시각화: 스캐터 플롯, 버블차트, 히스토그램
  • 비교시각화: 히트맵, 체르노프 페이스, 스타차트, 평행 좌표계, 다차원 척도법
  • 공간시각화: 지도 매핑
  • 여러 변수 비교

3. 정보 시각표현

1. 그래픽 7요소

  • 모양 명도 위치 질감 색 기울기 크기

2. 그래픽 디자인 기본원리

  • 타이포그래피
    - 서체, 무게, 크기, 스타일, 색체, 간격
  • 색상
  • 그리드
    - 상단 왼쪽부터 오른쪽 하단
    - 정보의 역피라미드 : 가장 강력한 정보 맨위
    - 망 그리드 : 일관성 및 정확하게 개체 배치, 디자인 쉬움
    - 3등분 법칙 : 미학적 균형 및 역동성
  • 아이소타이프
    - 상징적 도형이나 정해진 기호를 조합해 시각적이고 직접적 방식

3. 인터랙션

  • 데이터를 의미있고 이해할수있으며 유용한 기술과 방법인 인터랙션이 많이 이용되며 시각화 툴 자체가 인터랙션 형태
  • 인터랙션 위에 구현된 정보 디자인은 비선형적, 정보제시 순서가 고정되지 않고 사용자가 임의로 접근 및 선택

4. 시각정보 디자인 7원칙

  • 시각적 비교를 강화하라
  • 인과관계를 제시하라
  • 다중변수를 표시하라
  • 텍스트, 그래픽, 데이터를 한 화면에 조화롭게 배치하라
  • 콘텐츠의 질과 연관성 진실성을 분명히 하라
  • 시간순이 아닌 공간순으로 나열하라
  • 정량적 자료의 정량성을 제거하지 마라

빅데이터와 시각화 디자인의 방향

  • 현재 데이터 시각화가 무엇이고 주체는 누구이며 회사의 직무도 많이 않음
  1. 최신의 기술과 도구를 사용해 분석
  2. 특정 시각화 기술이 줄 수 있는 한계에 대해서 이해
  3. 정보 디자인의 의도와 방향성이 목적과 어긋나지 않도록 하기
  4. 데이터의 범주 안에서 정보를 보고 사용자를 위한 시각화 목적 설정 및 끝까지 고수
  5. 정보형 메세지의 경우 적합한 데이터 수집 가공 그래프 연결 처리 전문성 필수
  6. 시각화의 아름다움에서 정보성이 결여된담녀 효율성과 참신성이 떨어짐

3장 시각화 구현

시각화 플랫폼

  • Tableau, Gephi, ~~ Intelligence, ~~ Insight

시각화 라이브러리

  • D3.js, Tangle, jQuery Visualize

인포그래픽스

  • iCharts, Visualize Free, Visual.ly
profile
안녕하세요 반갑습니다!

0개의 댓글