
import pandas as pd
이후 간단한 표를 만들어 그 표를 분석해보자.
df = pd.DataFrame({"a":[4,5,6],"b":[7,8,9],"c":[10,11,12]}, index=[1,2,3])
df

위의 그림과 같이 표가 생성되었다.
df["a"]
위 코드는 a칼럼에 있는 데이터(4,5,6)을 출력하는 걸 series 데이터라 한다.
위 사진과 같이 인덱스 값과 a의 데이커 값이 출력되는 걸 알 수 있다.
여기서, df[["a"]]
대괄호를 하나 더 쓰게 되면 a칼럼의 데이터값이 DataFrame형태로 나타난다.
즉 DataFrame은 2차원 구조이고 Series는 1차원의 구조이다.
예 2) column값이 a,b인 경우만 데이터 추출할 경우,
여기서 두 개 이상의 값을 불러 올때 DataFrame 형태로 불러와야함.


df.sort_values("a", ascending=False)
예 3) "c"칼럼 삭제
예 1) a 컬럼값을 그룹화하여 b 컬럼값 평균 구하기 -> a 값 정렬한 후 그에 맞는 b값이 여러개일 경우, 평균화. 하나 일 경우 그대로 기재한다. : groupby
예 2) pivot_table로 a의 index에맞춘 평균값 구하기
예 1) 꺽은선 그래프
예 2) 막대 그래프
예 3) 밀도함수
