08/23

채언·2022년 8월 23일
0

Pandas dataframe

1. dataframe 만들기

  • dataframe 은 series들이 여러개 합쳐진 형태로, 여러개의 행과 여러개의 열의 조합이다. index, value, cloumn 으로 구성된다.

  • 넘파이를 이용해 랜덤으로 6행4열의 데이터를 만들고 date_range로 날짜데이터를 5개 나열한 리스트 데이터를 만들었다. 이를 dataframe 의 data 값과 index 값에 지정해준다. dataframe을 만드는 DataFrame 메소드를 이용하고 기본인자인 data, index, colums값에 각 데이터를 넣어준다.

2. dataframe 값 조회하기

  • head() 및 tail() 메소드를 이용해 데이터프레임의 위와 아래 값을 출력할수 있고, 디폴트는 5행이나 안에 값을 지정하면 지정한만큼의 행 개수를 출력한다. dataframe의 정보를 얻을수 있는 다양한 메소드들이 있다. 메소드를 사용할 경우 () 가 있고, 그냥 값을 출력할 경우 index, columns, values 와 같이 ()가 없다.

3. 값 정렬

  • sort_values() 에서, ascending = False 는 오름차순, inplace =True는 변경값을 mydata에 저장한다는 인자이다.

4. 인덱스 및 이름 이용하여 지정 값 출력

  • 두 개 이상의 데이터를 선택할 경우, [] 리스트의 형태로 적어야한다. 인덱스 값으로 슬라이싱 할 경우, 끝의 값 포함 안하지만 인덱스 명이나 컬럼이름으로 슬라이싱 할 경우 마지막 값까지 포함해서 출력
  • loc[a,b] 는 a 자리에는 행의 슬라이싱 b자리에는 열의 슬라이싱 값이 들어가고 index와 colums 명으로 지정한다.
  • iloc 는 loc 와 사용법은 같으나, 실제 인덱스 값인 정수값을 이용해 위치를 찾는다.

4. 조건에 따른 출력

  • 조건에 따라 값을 검색할때, 데이터프레임명 > n 으로 출력할 경우 boolean 형태로 출력되고 dataframe[] 으로 출력하면 그 값이 포함되어 출력된다. 해당하지 않을 경우, NaN으로 나온다.

5. 컬럼 추가

  • 컬럼추가 시, 없으면 새로 생성되고 존재하면 변경된다.

6. 컬럼 삭제

  • 컬럼 삭제시, del 을 사용한다. 이는, 아예 삭제되어 버리고 되돌릴 수 없다.

    -drop() 메소드를 사용하면 행 또는 열을 삭제할수 있고, axis 인자를 사용해 행 또는 가로를 지정해야한다.

7. 함수 적용 apply() 메소드

  • apply() 메소드는 함수를 적용한다. () 안에 아무 함수를 사용 할 수 있다.
profile
화이팅!

0개의 댓글