[BoostCamp AI Tech / Data Viz] (3-2) Color 사용하기

newbie·2021년 8월 18일

Color에 대한 이해

data에 대해 identity를 구분하는 가장 중요한 요소는, Spatial region 다음 color hue이다. 여기서 color는 색상에 따라 주는 느낌이 다르므로, 어떤 색으로 구상하냐에 따라 전하고 싶은 insight가 흐려지거나 선명해질 수 있다.
또한 시각화 정보를 보다 잘 전달하기 위해선 색상 조합과 시각화 구성이 매우 중요하다.

하지만 색 조합이 중요하다고 했지만, insight를 전달하는 방법론에 따라 선택적으로 조합해야 한다. 이과 정에서 전하고 싶은 내용을 모두 전달하고, 그 과정에서 오해가 없어야 한다.

아래 이미지를 보면, 전체를 무지개로 조합한 경우와, min-max를 색상으로 강조한 부분이 있는데,
누구나보면 알 수 있을 정도로, 전하고 싶은 insight를 명확히 표현했음을 알 수 있다.

앞서 말한, 색이 가지는 의미에 대해서도 명확히 구분할 필요가 있다.
예를 들어 카카오에 초록색, 네이버에 노란색으로 표시한다면 청자 입장에서는 헷갈릴 만한 요소가 될 수 있다. 또한 아래 그림은 미국 대선의 공화당과 민주당의 투표 결과인데, 당 색깔에 맞춰 빨간색과 파란색으로 지정한 것을 알 수 있다.
이처럼, 기존 정보와 느낌을 잘 활용하는 것이 중요하며, 만약 이러한 부분에 대한 감이 부족하다면 kaggle이나 decon, 혹은 다른 스터디 사례를 통해 왜 이런 식으로 표현한 지를 학습한 다음 색상을 선택하는 것도 좋은 방법이다.

Color Palette 종류

범주형(categorical)
이산형 데이터를 시각화할 때 사용되며, 독립된 색상으로 구성되어 범주형 변수에 사용한다.
최대 10개의 색상까지 묶여 있으며, 색의 차이로 구분하는 것이 특징이다.
단, 색상이 적을수록 구분이 잘 되니 너무 많은 색은 피하며, 색상 간에 유사도가 적고, 밝기가 비슷하며, 명도와 채도가 비슷한 색상을 사용하는 것이 좋다.

결과적으로 아래와 같이 데이터의 구성에 따라 다양하게 범주형 데이터를 시각화 할 수 있다.

연속형(Sequential)
정렬된 값을 가지는 순서형, 연속형 변수에 적합하다. 연속적인 색상을 사용하는데, 어두운 배경에서 는 밝은 색이, 밝은 배경에서는 어두운 색이 큰 값으로 하여 강조하여 표현한다.
색상은 최대한 단일 색조로 표현하는 것이 중요하고, 균일한 색상 변화가 매우 중요하다.
가장 기본적으로 우리가 자주보는 github commit 횟수에 따라 daily로 심어지는 잔디(?)를 보면 알 수 있다.

발산형(Diverge)
연속형과 유사하지만 중앙을 기준으로 발산하는 형태로, 기온, 지지율 등을 표현하는데 적합하다. 따라서, 양 끝으로 갈 수록 색이 진해지며, 중앙색은 양쪽 점에 편향되지 않도록 해야 한다.

그 외 색 tips(더 효과적인 색 사용을 위한 고민들)

색을 사용하는 것은 highlight를 하는 것을 의미하며, 이러한 강조를 위한 방법 중 하나는 색상 대비(color Contrast)이다.

  • 명도 대비 : 밝은 색과 어두운 색을 배치하여 강조
  • 색상 대비 : 가까운 색의 차이가 더 크게보이는데, 파랑 & 보라면 보라색은 조금더 빨갛게 보이고, 빨강 & 보라면 조금더 파랗게 보인다.
  • 채도 대비 : 채도가 높을수록 선명해 보인다 (회색&주황색 시 주황이 강조되는 것으로 보임)
  • 보색 대비 : 정 반대 색상을 사용하여 강조(빨강초록)

추가로 색각 이상을 고려해야 하는데,

  • 색맹 : 삼색원(RGB) 중 특정 색을 감지 못하는 경우
  • 색약 : 삼색원의 혼합색 중 부분적 인지 이상이 있을 경우
    색 인지가 중요한 분야(과학/연구 등)에 있어서 이러한 색약/색맹과 상관없이 인지할 수 있는 색상을 선택하는 것이 중요

이후 내용은 실습 코드로 진행!!

profile
DL, NLP Engineer to be....

0개의 댓글