막대의 영역 = 빈의 퍼센트 = 높이 * 빈의 너비
line graph
scatter plot
bar chart
histogram
함수생성은 알아서~~
배열을 생성한다.Table.apply(함수이름,칼럼명)
Ex



이 테이블의 row에 함수를 다 적용하고 싶다면?? apply 사용해

테이블이 데이터 타입이 다 number라면 col을 지정하지 않고 테이블 row마다 함수를 apply 할 수도 있다.

np.mean이랑 np.average랑 같다.
table.group(칼럼명,값을 어떻게 묶을까)
group 메서드는 column에 값들에 동일한 값을 가진 모든 row들을 반환한다.table.group([칼럼명,칼럼명],collect)
일단 테이블이다.

여기서 각 요일별 팁들의 평균을 알고 싶다면..

짜잔....
즉 해당 칼럼의 값들에 해당하는 값들을 계산을 할 때 사용하면된다.
테이블에서 칼럼이 여러개라면 group을 할 칼럼빼고 나머지 칼럼들이 그룹을할 칼럼에 맞춰 값들이 반환된다.
그룹을 그냥 칼럼만 명시하면 카운트만 해줌.
다른 작업을 한다면 해당 칼럼 말고 다른 칼럼에 대해 작업함
두개 이상 칼럼을 그룹핑하는거

이런 테이블이 있다.
성별과 날짜에 따른 tip의 평균을 알고싶다면..

리스트는 값들의 연속이다.
리스트는 table row를 생성할때 사용될 수 있다.
table column을 리스트로부터 만들어도 array로 변환된다.


table.pivot(가로축,세로축,values = 수집할 값들,collect= 수집 반환 값)
두 범주형 변수에 따라 교차 분류
카운트 또는 집계된 값의 그리드를 생성한다
두 개의 필수 인자:
첫째: 그리드의 column 레이블을 형성하는 변수
두 번째: 그리드의 row 레이블을 형성하는 변수
두 개의 선택적 인수(둘 다 포함하거나 둘 다 포함안함)
valus = 수집할 column 이름
collect = 수집할 함수
그룹과 달리 row col을 모두 지정해 compact하게 보여줄 수 있다.
첫번째 칼럼명 - 가로
두번째 칼럼명 - 세로

추가적 파라미터를 이용할 수 있다.


하나의 categorical 변수에 대한 distribution을 알고싶을때
두개 이상 categorical 변수의 교차 분류
나의 생각인데 그냥 두개이상 변수에 대해 뭐한다면 피봇이 좋은듯
두개의 테이블을 합친다.. 디비에도 있음
table.join(합칠때 이용할 칼럼,합칠 테이블,합칠때 이용할 칼럼)
t.join(,u,)의 한 가지 일반적인 사용
데이터 집합 t에는 categorical 변수 x가 있다.
표 u에는 해당 값의 일부 속성을 설명하는 가능한 x 값당 하나의 행이 있다.
조인된 테이블의 행은 t와 동일하지만, 이제 t의 각 행은 x 값의 속성을 가질 수 있다.