data에 대해 identity를 구분하는 가장 중요한 요소는, Spatial region 다음 color hue이다. 여기서 color는 색상에 따라 주는 느낌이 다르므로, 어떤 색으로 구상하냐에 따라 전하고 싶은 insight가 흐려지거나 선명해질 수 있다.
또한 시각화 정보를 보다 잘 전달하기 위해선 색상 조합과 시각화 구성이 매우 중요하다.
하지만 색 조합이 중요하다고 했지만, insight를 전달하는 방법론에 따라 선택적으로 조합해야 한다. 이과 정에서 전하고 싶은 내용을 모두 전달하고, 그 과정에서 오해가 없어야 한다.
아래 이미지를 보면, 전체를 무지개로 조합한 경우와, min-max를 색상으로 강조한 부분이 있는데,
누구나보면 알 수 있을 정도로, 전하고 싶은 insight를 명확히 표현했음을 알 수 있다.

앞서 말한, 색이 가지는 의미에 대해서도 명확히 구분할 필요가 있다.
예를 들어 카카오에 초록색, 네이버에 노란색으로 표시한다면 청자 입장에서는 헷갈릴 만한 요소가 될 수 있다. 또한 아래 그림은 미국 대선의 공화당과 민주당의 투표 결과인데, 당 색깔에 맞춰 빨간색과 파란색으로 지정한 것을 알 수 있다.
이처럼, 기존 정보와 느낌을 잘 활용하는 것이 중요하며, 만약 이러한 부분에 대한 감이 부족하다면 kaggle이나 decon, 혹은 다른 스터디 사례를 통해 왜 이런 식으로 표현한 지를 학습한 다음 색상을 선택하는 것도 좋은 방법이다.

범주형(categorical)
이산형 데이터를 시각화할 때 사용되며, 독립된 색상으로 구성되어 범주형 변수에 사용한다.
최대 10개의 색상까지 묶여 있으며, 색의 차이로 구분하는 것이 특징이다.
단, 색상이 적을수록 구분이 잘 되니 너무 많은 색은 피하며, 색상 간에 유사도가 적고, 밝기가 비슷하며, 명도와 채도가 비슷한 색상을 사용하는 것이 좋다.

결과적으로 아래와 같이 데이터의 구성에 따라 다양하게 범주형 데이터를 시각화 할 수 있다.

연속형(Sequential)
정렬된 값을 가지는 순서형, 연속형 변수에 적합하다. 연속적인 색상을 사용하는데, 어두운 배경에서 는 밝은 색이, 밝은 배경에서는 어두운 색이 큰 값으로 하여 강조하여 표현한다.
색상은 최대한 단일 색조로 표현하는 것이 중요하고, 균일한 색상 변화가 매우 중요하다.
가장 기본적으로 우리가 자주보는 github commit 횟수에 따라 daily로 심어지는 잔디(?)를 보면 알 수 있다.

발산형(Diverge)
연속형과 유사하지만 중앙을 기준으로 발산하는 형태로, 기온, 지지율 등을 표현하는데 적합하다. 따라서, 양 끝으로 갈 수록 색이 진해지며, 중앙색은 양쪽 점에 편향되지 않도록 해야 한다.

색을 사용하는 것은 highlight를 하는 것을 의미하며, 이러한 강조를 위한 방법 중 하나는 색상 대비(color Contrast)이다.
추가로 색각 이상을 고려해야 하는데,

이후 내용은 실습 코드로 진행!!