[ 0101 ]
Bool
type(True)
True == 1
False == 0
True == '1'
숫자
type(1)
type(1.5)
사칙연산
2 ** 3
3 // 2
5 % 2
문자열 함수
.lower()
.upper()
.strip()
len()
리스트 함수
.append()
.remove()
딕셔너리 함수
{key:value}
중복 없음
A["abc"]="123"
del A["abc"]
[ 0102 ]
조건문 - if문 :
if :
elif :
else :
- 숫자를 입력하면 string으로 입력받고 앞에 int로 정수로 변환
- PEP20 = import this
반복문 - for문 :
- 반복 횟수가 정해져 있을 때
- 문자 = 변수 , “문자” = 문자열
range(시작(이상),끝(미만),증가치) 함수
- 증가치가 음수면 역순
- enumerate() 인덱스 번호 출력
-> for i in range(len(weekday)): =for i, w in enumerate(weekday):
while 문
while True:
함수
def A(매개변수=전달인자):
.split()
“”” ~ “””
[ 0103 ]
pandas ------------------------
= 행과 열로 되어있는 데이터분석 도구
import pandas as pd as
DataFrame
df[“가격”].tolist()
axis 0
df = df.drop()
.info()
.shape
.dtypes
.describe()
.describe(include=“object”)
NumPy
= 파이썬에서 사용할 수 있는 공학용 계산기
- 값을 하나만 넣었지만 모두 적용 -> 브로드캐스팅
%timeit
* 2개 이상의 데이터를 가져올땐 대괄호 2개
.loc[행, 열]
.iloc[]
.set_index()
.str.contains(“vita”)
.str.upper()
df["약품명_소문자"].str.contains("vita|비타")
sort_values()
na
assending=False
.to_csv(“파일명”, index=False)
pd.read_csv(“파일명”)
[ 0104 ]
seaborn
import seaborn as sns
.load_dataset()
df.head()
df.tail()
df.sample()
df.sample(frac=0.05, random_state=42)
.info()
.describe()
df.describe(include="object”)
.shape
.corr()
df["dataset"].value_counts()
df["dataset"].value_counts(normalize=True)
.groupby()
sns.countplot(data=df, x="dataset”)
sns.barplot(data=df, x="dataset", y=“x”, ci=None)
sns.barplot(data=df, x="dataset", y="y", ci=None, estimator=np.sum)
sns.boxplot()
df.hist(bins=)
sns.displot(data=df, x="y", hue="dataset", kde=True, col="dataset”)
sns.scatterplot(data=df, x="x", y="y", hue="dataset")
sns.regplot(data=df, x="x", y="y")
sns.lmplot(data=df, x="x", y="y", hue="dataset", col="dataset", col_wrap=2)