이미지 출처
Key Python Libraries for Data Analysis and Code examples
이미지 출처
기능 | 설명 |
---|---|
데이터 읽기/쓰기 | 다양한 데이터 소스로부터 데이터를 불러오고 저장 (CSV, Excel, SQL 등) |
데이터 선택 및 필터링 | 데이터를 선택하고 필터링 (인덱싱, 슬라이싱, 조건을 사용한 필터링) |
데이터 정렬 | 데이터를 특정 열이나 인덱스를 기준으로 정렬 |
결측값 처리 | 데이터에 존재하는 결측값 처리 (결측값 제거, 데체) |
데이터 번형 | 데이터를 변형하거나 조작 (열 추가/삭제, 데이터 형식 변환) |
그룹화와 집계 | 데이터를 특정 기준으로 그룹화하고 그룹별로 집계 연산 수행 |
병합과 결합 | 두 개 이상의 데이터프레임을 병합하거나 결합 |
데이터 프레임의 통계분석 | 데이터의 기본 통계값 (평균, 표준편차, 최소값/최대값 등)을 계산하는 기능 |
Pandas는 데이터 분석에서 필수적인 도구로, 데이터를 쉽게 다루고 분석할 수 있는 강력한 기능을 제공함
import pandas as pd
import saeborn as sns
from sqlalchemy import create_engine
titanic = sns.load_dataset('titanic')
engine = create_engine("sqlite:///titanic.db", echo=False)
titanic.to_sql('titanic_table, con=engine, index=False, if_exists='replace', method="multi")
df_from_sql = pd.read_sql_query('SELECT * FROM titanic_table', con=engine)
print(df_from_sql.head())
import pandas ad pd
df_bda=pd.DataFrame({
'분반':['데이터분석입문반','SQL문법기초반','파이썬문법기초반','데이터분석모델링반'],
'학회원수':[100,200,300,400],
'우수학회원수':[50,60,70,80]
})
df_bda
분반 학회원수 우수학회원수
0 데이터분석입문반 100 50
1 SQL문법기초반 200 60
2 파이썬문법기초반 300 70
3 데이터분석모델링반 400 80
df_bda[['분반','우수학회원수']]
분반 우수학회원수
0 데이터분석입문반 50
1 SQL문법기초반 60
2 파이썬문법기초반 70
3 데이터분석모델링반 80
df_bda[['분반']] # DataFrame
df_bda['분반'] # Series
df_bda.info() # 모든 정보 확인
df_bda.describe() # 요약 통계치 확인
df_bda.describe(include="all") # 요약 통계치 전체 확인
df_bda.shape # 행과 열
df_bda.colums # 컬럼 출력
df_bda.types # 데이터 타입 출력
df_bda.head() # 앞에 데이터 추출 (이 경우 5개)
df_bda.head() # 뒤에 데이터 추출 (이 경우 5개)
df.iloc[행번호, 열번호]
df.loc[행레이블, 열레이블]