
판다스(Pandas)는 데이터 분석 및 조작을 위한 파이썬 라이브러리로, 데이터프레임(DataFrame)과 시리즈(Series) 구조를 제공함.데이터 처리, 정제, 변환, 분석 기능을 손쉽게 수행할 수 있음.시리즈는 1차원 데이터 구조이며, 인덱스(라벨)와 값을 가짐.
데이터프레임에서 특정 데이터에 접근하기 위해 인덱스를 설정할 수 있음. pandas에서는 기본적으로 정수 인덱스를 제공하지만, 특정 열을 인덱스로 설정할 수도 있음.데이터프레임을 생성하면 자동으로 0부터 시작하는 정수형 인덱스가 부여됨. 하지만 특정 열을 인덱스로 설정

1차원 데이터 구조로, 인덱스와 값(value)으로 구성됨.리스트, 딕셔너리, 넘파이 배열 등을 활용하여 생성 가능.2차원 데이터 구조로, 여러 개의 시리즈가 모여 만들어짐.행(row)과 열(column)로 구성됨.딕셔너리, 리스트, 넘파이 배열 등을 활용하여 생성 가

abs() 함수는 절댓값을 반환하는 함수이며, 넘파이 배열에 적용하면 각 요소의 절댓값을 반환함.넘파이 배열을 사용하면 빠르고 효율적인 연산이 가능함.예제 코드:map(): 시리즈 객체에 적용하여 각 요소를 변환함.applymap(): 데이터프레임 객체에 적용하여 각

pandas 라이브러리는 보통 pd 라는 별칭으로 사용됨.랜덤 시드, 어레이 내부에 사용되는 부동소수점 정확도, 도표 크기 지정 옵션 등은 이전과 동일함.Series와 DataFrame을 표로 보여줄 때 사용되는 행의 수를 20으로 지정함.기본값=60주요 메서드head

Pandas 라이브러리에서 여러 DataFrame 또는 Series를 연결(concatenate)행(row) 또는 열(column) 단위로 데이터를 합칠 수 있습니다.주요 인자objs: 합칠 객체들의 리스트. 이 객체들은 DataFrame 또는 Series여야 합니다.

다중 인덱스(MultiIndex)는 여러 단계로 구성된 인덱스를 의미하며, 계층적으로 데이터를 관리할 수 있음.pd.Series에서 다중 인덱스를 생성할 때 pd.MultiIndex.from_tuples()를 사용함.다중 인덱스를 활용하면 그룹별 데이터를 보다 직관적으

다중 인덱스(MultiIndex)는 여러 단계로 구성된 인덱스를 의미하며, 계층적으로 데이터를 관리할 수 있음.pd.Series에서 다중 인덱스를 생성할 때 pd.MultiIndex.from_tuples()를 사용함.다중 인덱스를 활용하면 그룹별 데이터를 보다 직관적으

그룹화된 데이터에서 다양한 통계량을 계산할 때 사용됨.대표적인 집계 함수들은 아래와 같음.기본 제공 집계 함수 외에도 사용자가 직접 함수를 정의하여 적용 가능함.agg() 또는 apply()를 활용하여 특정 연산 수행 가능함.데이터 변환에 사용되는 함수로, 그룹별 특정