두가지 타입이 있다
Numerical
Categorical
어떤 속성의 값이 숫자이기 때문에, 속성이 numerical이라는 것은 아니다.
ex) 만약 어떤 속성이 숫자지만 카테고리로 이용하는 것이면 numerical이랑 다르다.
- 이걸로 숫자 계산을 해도 의미가 없다
- like 성별을 1 0 으로 표현하는 방법
- 이 경우에는 값이 숫자지만, 숫자들은 categorical하게 쓰인다.
두가지 방법이 있다.
라인을 사용할때 = 순차적인 양적 데이터를 가질때
scatter를 사용할 때 = 순차적이지 않은 양적 데이터를 가질때
적은게 더 좋다
꾸미는건 적게 꾸미자
색은 조심스럽게 골라
만약 데이터가 numerical하다면,
Y축의 중요성
시간에 따른 변화율을 기록할때 유용
table.plot()을 통해 그린다.

plots.title(문자열)

plots.ylim(원하는범위시작,범위끝)
이전

이후

table.scatter(X축,Y축)

scatter 그래프와 plot그래프에서 x축과 y축이 같으면 서로 같은 그래프 모양을 나타낸다.


male과 female을 scatter로 비교해보았다.

여자가 많으면 남자도 많은 것을 알 수 있는데... 이렇게 비교를 해야할까??
Age라는 순차적 증가 값이 있으니 age를 x축으로 두고 두 값의 plot그래프를 그린다면 더 비교가 쉬울 것 같다..(땡!!)
바보 같은 소리하지마 과거의 나야!! 같은 x값에 대해 여러 y값이 있는 것 같고 두 변수 사이 관계를 알아야하니 이는 scatter를 이용해야해!!
먼소리야 age라는 순차적이 값이 있으니 그냥 age를 x축으로 하고 남자와 여자 비율을 plot으로 그리는게좋을듯?
Individuals
Variable
각 individual들은 하나의 카테고리를 가진다. 다합치면 100퍼센트가 된다.
중복된 값을 선택할 수 있는 경우
distribution이 아니다!!100퍼센트란 말은 그 값들.. 즉 그 값들을 다 합쳤을때, 비교 대상,,이 되는 값 원본 값만큼 크기가 같다는 것,,, 그 비교 값이 중복 값을 가진다면 비교 대상 원본 값보다 큰 값이 다 합쳤을대 나오니깐 좋지 않아요
어떤 범주 값의 분포를 뜻한다!!
즉 숫자 값에 대한 분포가 아닌 어떤 범주(단어)의 분포를 표현할때를 의미한다.
변수의 모든 값을 모든 빈도와 함께 표시한다.
Table.barh(카테고리값,x축)

x축은 numerical해야지 그래프가 그려진다.
어떤 숫자의 분파를 뜻한다.
즉 단어가 아닌 어떤 숫자 값의 분포를 표현할때 의미한다.
이때는 빈을 만들어 범위를 나누어 준다.
비닝란 빈이라고 하는 범위 내에 있는 숫자 값의 수를 세는 것
table.bin(칼럼명,빈)


이렇게 하면 해당 테이블 칼럼 값들을 빈에 맞게 설정해 테이블을 반환한다.
numerical에 사용하는걸 잘 알고있어라..[40,65) 빈에 값을 선택하려면 bin 40의 값을 고르면 된다.
빈 영역은 >= 인가 > 인가?
영역은 해당 값이 나타내는 값에 비례해야 한다.
) 번외
만약 테이블 값에서 백분율을 계산하려면??
-> 해당값/전체개수 * 100 하면 된다
히스토그램
히스토그램 축
히스토그램 높이 계산
높이는 밀도를 측정한다
높이 = 빈의 %/빈의 너비
높이는 빈의 공간 양에 대한 빈의 데이터 백분율을 측정한다.
높이는 혼잡도 or 밀도를 측정한다
units: 가로 축의 단위당 백분율
영역은 퍼센트를 측정한다.
바의 영역 = 빈의 % = height * bin의 너비
얼마나 bin이 붐비냐??
How many individuals in the bin?
그리기
table.hist(수평선 칼럼,빈, unit 이름,group="칼럼명")


빈을 설정 안하면 제일 이쁘게 나와준다.
여기서 각 막대의 height이 퍼센트/막대의 width이다.

히스토그램은 수평선 값들이 테이블에 얼마나 있는지 비율을 나타내주는 그래프이다.
바그래프는 수평선 값들에 대한 수직선 비율을 알고 싶을때 쓴다
라인 그래프는 x 값이 뉴메릭일때, 순차적인 양적 데이터를 가질때
스캐터 그래프는 순차적이지 않은 양적 데이터를 가질때, 값들 사이 연관성을 알고싶을때 사용한다.