
결과: 디폴트는 0부터의 정수결과:결과: 기존 컬럼을 인덱스로 지정df.set_index('인덱스로 지정할 컬럼명')결과: df.index = 인덱스나중에 지정한 인덱스를 삭제하고 싶다면

각 컬럼을 시리즈 형태로 가져오기

n값을 입력하면 제일 상단 n개의 행을 보여줌데이터 타입, 행 개수 등컬럼 별 개수, 평균, 분위수 등결과: dtype('float64')전체 컬럼의 dtype 출력

iloc - 숫자로 인덱싱 데이터 프레임 정의 슬라이싱: 특정 위치의 값 찾기 첫 번째 행 보기 1-2번째 행 보기 한 칸 띄고 그 다음 칸 보기 행과 열 보기 ⭐️파이썬 기본 인덱싱처럼 ':' 뒤에 오는 숫자 -1 까지만 가져옴 loc: 컬럼명과 인덱스 이름으로 인덱싱 데이터 프레임 정의 전체 행, 특정 컬럼 찾기 전체 행의 'A' 컬럼 찾기...

조건이 참이 경우만 가져옴AND 조건: df(조건1) & (조건2): 흡연자인 남성 조회OR 조건: df(조건1) | (조건2): 흡연자이거나 남성인 사람 조회: 조건이 맞는 행, 모든 열 조회: 조건이 맞는 행의 tip부터 smoker까지의 열 조회: 조건이 맞는 행

인덱스가 유지된 채 합쳐짐.기존 인덱스를 없애도 새로 부여.concat(df1, df2, df3, axis = 0): axis의 기본 값이 0으로 설정되어 있음.행 수가 다른 경우:Null 값으로 채워진다.SQL의 JOIN과 유사.key 컬럼을 기준으로 병합디폴트는 이

'Category'가 인덱스로 들어감.성별과 요일 별 평균 구하기total_bill은 최댓값tip은 평균값size는 총합 산출

데이터 정렬 데이터프레임 정의 오름차순 정렬하기 (디폴트) 내림차순 정렬하기 여러 컬럼 기준으로 정렬하기 인덱스로 정렬하기 
ax.text(x축 좌표, y축 좌표, '텍스트 내용', fontsize = N)

연속형 데이터의 분포 확인bins: 구간의 개수상관계수를 보여줌

flights 데이터셋 활용해서 그래프 그리기 데이터 불러오기 1. 연도 별 총 승객 수 with line graph 2. 연도 별 평균 승객 수 with bar graph 3. 승객 수 분포 with histogram , 1인 경우 각 행에 함수 적용.lambd와 함께 자주 사용: 주문ID 값의 앞 5글자만 가져온다.문자열을 날짜로 생성날짜들의 리스트를 넣을 경우, Datet

sns.scatterplot(x = x, y = y, size = '사이즈를 결정할 컬럼')수평선수직선결과:

위 데이터프레임에서 'team' 컬럼을 제외한 나머지 컬럼들 사이의 상관관계를 분석하려고 한다.np.triu()는 입력 받은 데이터 프레임의 i 대각선 포함 그 위에 있는 값에는 1, 아래에 있는 값에는 0을 채워 반환한다.위 마스크로 히트맵을 그리면 상관관계가 1인

plot을 변수 (ax)에 할당한 후,label 이름: ax.get_xticklabels() -> 정해진 기존 label 가져옴rotation = 45 -> 45도 회전ha = 'right' -> 레이블의 오른쪽 기준 \- ha: horizantal alignmen

personr(col1, col2)반환값: (상관계수, p-value)teams_small 데이터셋의 'points' 컬럼과 나머지 컬럼의 상관관계와 p-value를 구하고자 한다.pearson 상관계수인 'r'과, p-value인 p를 구한 후, p 값이 0.05보다

샘플:데이터의 평균 계산데이터의 중앙값 계산데이터의 표준편차 계산데이터의 분산 계산데이터의 합계 계산데이터의 곱 계산샘플:데이터의 특정 퍼센타일 값 계산오름차순으로 작은 값이 0, 큰 값이 100np.quantile(a, 0.1) \`\`\`샘플:데이터의 최소값 반환데
fig, (subplot1, 2, ...) = plt.subplots(행 수, 열 수, 크기)한 번에 서브플랏을 정의하고 시작plt.subplot(행, 열, 지금 그릴 위치)

SQL로 데이터를 추출하다 보면 사용자 정의 함수나 데이터 전처리가 필요한 경우가 있다.파이썬에서 RDB에 접근하게 해주는 모듈이 바로 SQLAlchemyApplication Programming Interface두 소프트웨어 구성요소가 서로 통신할 수 있도록 하는 매