2차원 형태의 데이터를 다루기 위한 자료형!
column
: 열, 데이터의 특징
row/index
: 행, 레코드numpy 2차원 array와 다른점
- column과 row에 숫자로 indexing 하는 numpy와 달리 각각 이름을 붙여 줄 수 있다.
- numpy는 모든 값이 같은 자료형이여야 한다. >>> 보통 숫자열
- pandas는 여러 자료형을 값으로 사용할 수 있지만 같은 column에는 같은 자료형만 있어야 한다.
2차원 list (df1)
2차원 numpy array (df2)
pandas Series (df3) 로 DataFrame을 만들 수 있다.
python dictionary 로 DataFrame 만들기
key로 column 이름
을 쓰고 column에 해당하는list, numpy array, pandas Series를 value
로 넣으면 됨.
list가 담긴 dictionary뿐만 아니라
dictionary가 담긴 list
로도 DataFrame을 만들 수 있다.