우리가 자주 쓰는 함수들을 모아놓은 묶음 정도로 생각
계산을 직접 하는 게 아니라 자주 쓰는 라이브러리들을 적재적소에 활용하는 능력이 중요
import pandas as pd
pandas라는 라이브러리(모듈)을 호출(import)하고 그 이름을 pd로 줄여서 명명하겠다
pandas.어쩌구
= pandas에 있는 어쩌구 함수만 쓰겠다
외우려고 하지말고 원리를 이해하면 됨
통계와 머신러닝 모델에서 가장 기본이되는 테이블 형태의 데이터 구조
pandas series
= 테이블의 열
# pandas 라이브러리를 활용한 csv 파일 읽기
df = pd.read_csv("xxxx.csv")
# 테이블 확인하기
display(df, df2, df3)
# 처음 5 줄만 출력하기
#df2.head()
# 마지막 5 줄만 출력하기
#df2.tail()
# 각 테이블의 행(가로) 길이 파악하기
len(df)
# shape: 테이블의 행과 열의 갯수를 반환
df.shape
# dtypes: 테이블 내 컬럼타입(문자형, 숫자형, 배열 등) 확인
df.dtypes
# columns: 테이블 내 컬럼 확인
df.columns
# values: 테이블 내 각 행들을 배열 형태로 확인
df.values
# 테이블 기본 구조 한눈에 확인하기
df.info()
# 전체 행 갯수, 평균, 표준편차, 최솟값, 사분위수, 최댓값 확인
df2.describe()
#컬럼별로 결측치(데이터가 없는) 확인하기
df.isnull().sum()
# 특정 컬럼 1개 가져오기
#방법1: 속성. 사용
df.Category
#방법2: [] 연산자 사용
df['Category']
#방법3: iloc 사용
# : 은 모든 행을 가져오겠다는 의미이며 dataframe 의 인덱스 번호 4번(카테고리)컬럼을 가져오겠다는 희미
df.iloc[:,4]
# 특정 컬럼 여러개 가져오기
#방법1: [[]] 연산자 사용
# []를 하나 사용하면 결과값이 series 형태로 반환되어 key error 가발생되며, [[]] 는 dataframe 으로 반환되어 에러가 나지 않습니다.
df[['Category','Selling Price']]
#방법2: iloc 사용
# : 은 모든 행을 가져오겠다는 의미이며 dataframe 의 인덱스 번호 4번,7번 컬럼을 가져오겠다는 희미
df.iloc[:,[4,7]]
# 특정 컬럼 버리기
# axis=0 은 인덱스 기준, 1은 컬럼 기준 삭제를 의미
# inplace=True 는 원본을 변경하겠다는 의미, False 의 경우 원본테이블은 변경되지 않음
df3.drop('Interaction type', axis=1, inplace=True)
# 조건에 부합하는 데이터 가져오기1
# 조건에 만족하는 행은 정상출력 ,아닌 행은 NaN 으로 반환
df2.where(df2['Age']>50)
# 조건에 부합하는 데이터 가져오기2
# true, false의 개념이 아닌 조건에 부합하는 데이터만 슬라이싱하여 가져오고 싶을 때
# mask 메서드로 불립니다. 이름은 반드시 mask 일 필요가 없습니다.
mask = ((df2['Age']>50) & (df2['Gender']=='Male'))
df2[mask]
# 데이터 그루핑- 기준 1개
df2.groupby('Gender')['Customer ID'].count()
# 데이터 그루핑- 기준 여러개
df2.groupby(['Gender','Location'])['Customer ID'].count()
# 데이터 count 와 nunique(distinct, 중복제거) 차이
df2.groupby('Location')['Age'].count()
df2.groupby('Location')['Age'].nunique()
SQL- 성분으로 구분한 아이스크림 총 주문량
SQL - 조건별로 분류하여 주문상태 출력하기
Python - 문자열을 정수로 바꾸기
Python - 자연수 뒤집어 배열로 만들기
코드카타 38-39✅
코드카타 15-16✅
라이브세션 1주차✅
종합반 1주차 복습✅
오늘 잠을 못 자서 너무너무 피곤했다.. 중간에 계속 졸아서 제대로 공부하지 못함 아무래도 파이썬의 주다 보니 종합반 강의를 한번 더 다시 봤고, 라이브세션 녹강도 한번 더 봤다 뭔가 필기할 거리가 없어서 TIL도 유독 짧아서 초라하네😭
그래도 오늘 팀원 분 궁금한 것도 최대한 도와드리고, 남아서 개인과제를 끄적였다!
5번문제까지는 풀어서 어려운 부분을 내일 풀어보려고 한다😊 오늘은 푹 자고 상쾌하게 하루를 시작해야쥐.. 파이팅🍀