df.apply(function, axis = _)
orders['주문ID'].apply(lambda x:x[:5])
: 주문ID 값의 앞 5글자만 가져온다.
# 최대
df.max()
# 최소
df.min()
# 평균
df.mean()
# 중앙값
df.median()
# 최비값
df.mode(dropna = True) # 결측치 제외 여부
# 표준편차
df.std()
# 분산
df.var()
# 누적합
df.cumsum()
# 누적곱
df.cumprod()
# 분위수
df.quantile(q = 분위수 소수로 표현)
df.quantile(0.75) # 75% wlwja
# 상관계수
df.corr(method = 'pearson', min_periods = 1) # 상관계수 방식/유효 결과 얻기 위한 최소 값의 수
# 상관계수
df.corrwith(다른 행or열, method = 'pearson')
pd.to_datetime('2019-1-1 12')
# 결과: # Timestamp('2019-01-01 12:00:00')
pd.to_datetime(['2018-1-1', '2019-1-2'])
# DatetimeIndex(['2018-01-01', '2019-01-02'], dtype='datetime64[ns]', freq=None)
pd.date_range('2018-1-1', '2019-1-2')
DatetimeIndex(['2018-01-01', '2018-01-02', '2018-01-03', '2018-01-04',
'2018-01-05', '2018-01-06', '2018-01-07', '2018-01-08',
'2018-01-09', '2018-01-10',
...
'2018-12-24', '2018-12-25', '2018-12-26', '2018-12-27',
'2018-12-28', '2018-12-29', '2018-12-30', '2018-12-31',
'2019-01-01', '2019-01-02'],
dtype='datetime64[ns]', length=367, freq='D')
import datetime
# 현재 시간 가져오기
now = datetime.datetime.now()
print("현재 시간:", now)
# 날짜 및 시간 객체 생성
dt = datetime.datetime(2022, 3, 1, 12, 30, 45)
print("생성된 날짜 및 시간:", dt)
# 문자열을 날짜 및 시간으로 변환
str_date = "2022-03-01 12:30:45"
dt = datetime.datetime.strptime(str_date, "%Y-%m-%d %H:%M:%S")
print("문자열에서 생성된 날짜 및 시간:", dt)
# 날짜 및 시간 객체의 속성 접근
year = now.year
month = now.month
day = now.day
hour = now.hour
minute = now.minute
second = now.second
microsecond = now.microsecond
print(year, month, day, hour, minute, second, microsecond)
# 날짜 및 시간 객체 간의 차이 계산
delta = datetime.datetime(2022, 3, 1, 12, 30, 45) - datetime.datetime(2022, 2, 28, 11, 15, 30)
print("두 날짜 및 시간의 차이:", delta)
# 날짜 및 시간 포맷 지정
str_date = now.strftime("%Y-%m-%d %H:%M:%S")
print("포맷 지정된 현재 시간:", str_date)