데이터 분석에서 가중 중요한 데이터 구조관계형 데이터베이스 의 테이블 또는 엑셀 시트와 같은 형태 (2차원 구조)변수들의 집합 - > 각 열을 변수라고 부름 분석 단위관측치 , 샘플정보변수 (feature , target)2차원 데이터 셋에서 COLUMN 하나를 가져온
데이터 프레임에서 몇개의 행의 정보를 볼것인지 보여주는 함수 데이터 프레임을 잘 읽어왔는지 체크하기 유용하다row 가 빈칸이면 5행만 가져온다.데이터 프레임의 뒤에서 부터 몇개의 행을 볼지 보여지는 함수 데이터 크기 를 볼수 있는 함수각 컬럼의 데이터 자료형을 확인할수
파이썬 정렬은 인덱스를 기준으로 정렬하는 방법이랑 특정 열을 기준으로 졍령하는 방법이 있다.sort_values() 특정열을 기준으로 정렬해라 ascending 옵션으로 오름차순 , 내림차순 정렬이 가능하다복합 열을 정렬할떄 리스트 형태로 먼저 정렬 기준을 앞에 그다음
데이터를 좀더 이해하기 위해 고유값 , 합 , 평균 , 최댓값 , 최솟값 등을 확인합니다.고유값이란 열이 가진 값중에 유일한 값의 범주 인지 확인하는 것이다.unique() 매소드를 사용해서 고유값을 확인한다.이때 2개이상의 열의 통계도 한번에 확인할수 있다.
시리즈(Series)와 데이터프레임(DataFrame)데이터프레임 : 2차원 구조시리즈 : 1차원 구조데이터프레임에서 열 하나를 띄어 내면 시리즈!시리즈 를 조회할때는 DataFrame.column 이름 / DataFrame'columnname'데이터 프레임으로 조회
집계 함수를 통해서 판다스의 열 을 기준으로 집계를 한다.특정 열의 값 합은 다음과 같이 구할 수 있습니다.'MonthlyIncome' 의 합 단일 열 'MonthlyIncome' 과 'TotalWorkingYears' 의 각각의 평균 이때 dtype 도 확인 가능하
영화 데이터를 가지고 데이터 선택 , 데이터 조건 , 데이터 변경 등 예제를 수행pandas 를 사용할떄 반드시 라이브러리 를 import 해야 하는 구문이다as 를 통해 약어로 표현한것이 pd 이다 -> 이 pd 를 통해 pandas 를 무조건 부를수 있다.direc