pd.pivot_table(df, index='행 인덱스', columns = '열 인덱스' , values = '조회하고 싶은 값', aggfunc='집계 방식')aggfunc : 'mean' 'sum' 'count'df.groupby('그룹명','그룹명2')df.g
join 4가지 방식'Inner Join' : 교집합'Left Join' : 왼쪽 전체'Right Join' : 오른쪽 전체'Outer Join' : 합집합df.set_index('columns 중에 하나 쓰기')pd.merge(df1, df2, on='컬럼', how
행 가져오기 (df'행 시작 인덱스' : '행 끝 인덱스')행 가져오기는 연속적으로 데이터를 불러옴 열은 '컬럼명'지정 행은'index'지정열 하나 가져오기 (df'컬럼명' or df.컬럼명)범위 설정 df\[df.columns시작인덱스 : 끝 인덱스]df.loc'행'
datetimepandas에서 날짜와 시간 데이터를 처리 하기 위해 지원하는 자료형datetime 자료형 변환 : 연산가능 Timestamp : 변환완료.dt : 슬라이싱 준비df'컬럼' + df'컬럼'df'컬럼' - df'컬럼'df'컬럼' \* df'컬럼'df'컬럼
결측값 : 자료에 누락된 값NaN, N/A, NULL, 0값 등 다양한 방식으로 존재 fillna('결측값을 대체할 값')value_counts() : 값을 세어주는 함수를 통해서 최빈값 알아냄결측치 처리 과정에서, 데이터 프레임의 인덱스가 바뀌는 현상 발생reset_
구체적인 로직을 적용하고 싶을 경우로직이 정의된 함수를 만들고, apply() 함수에 대입df'컬럼명'=df'컬럼명'.apply(replace_zero)dfdf'컬럼명'=df'컬럼명'.apply(lamda x:50 if x ==0 else x)df'컬럼명1'+'컬럼명2
Colab한글 깨짐 현상 해결 방법plot 데이터 집합을 도표, 그래프로 표시plot 함수는 kind라는 옵션으로 다양한 그래프 시각화 가능kind 옵션: line bar hist box pie scatter area빈도수를 알아볼 때 사용
List 데이터를 연속적인 공간에 저장 순서를 가지며 각 원소에 차례로 index가 할당됨 서로 다른 자료형을 원소로 가질 수 있음 수치적 연산은 불가능
x,y 화살표 밑면의 좌표dx, dy : x 및 y 방향을 따른 화살표의 길이 https://matplotlib.org/stable/api/\_as_gen/matplotlib.pyplot.arrow.html벡터의 실수배 연산을 벡터에 스칼라를 곱한다.벡터 :
링크텍스트수 또는 변수를 ()안에 행과 열로 배열2차원 형태의 array 또는 list로 나타냄행과 열의 개수는 매트릭스의 차원을 의미 .shape을 통해 확인두 매트릭스 일치 = 차원과 성분이 동일해야 함. 배열의 차원 확인벡터의 차원 확인 콤마 앞의 수는 벡터의 차
Unnamed: 0을 DataFrame에서 삭제하는 방법1\. index_col=0drop 사용링크텍스트