Dictionary
age_code = """
10대 : AGE_001
20대 : AGE_002
30대 : AGE_003
40대 : AGE_004
50대 : AGE_005
60대 : AGE_006
70대 : AGE_007
기타 : AGE_008
( 비회원, 외국인, 그 이상 등 )"""
age_dict = {}
for age in age_code.split("\n"):
list = age.split(":")
if len(list) > 1:
key = list[1].strip()
val = list[0].strip()
age_dict[key] = val
age_dict
phone = ">경기 031 >강원 033 >충남 041 >충북 043 >경북 054 >경남 055 >전남 061 >전북 063"
phone_dict = {}
for ph in phone.split(">"):
list = ph.split(" ")
if len(list) > 1:
key = list[0]
val = list[1]
phone_dict[key] = val
phone_dict
{'경기': '031',
'강원': '033',
'충남': '041',
'충북': '043',
'경북': '054',
'경남': '055',
'전남': '061',
'전북': '063'}
pandas
import pandas as pd
Series 생성
pd_series = pd.Series([1,2,3,np.nan,6,7)]
pd_series
0 1.0
1 2.0
2 3.0
3 NaN
4 6.0
5 7.0
dtype: float64
DataFrame 생성
df_sports= pd.DatFrame()
df_sports
Column 추가 1
df_sports["운동종류"] = ["축구", "야구", "클라이밍", "농구", "요가", "필라테스", "복싱", "골프"]
df_sports
운동종류
0 축구
1 야구
2 클라이밍
3 농구
4 요가
5 필라테스
6 복싱
7 골프
Column 추가 2
df_sports["운동횟수"] = 4
df_sports
운동종류 운동횟수
0 축구 4
1 야구 4
2 클라이밍 4
3 농구 4
4 요가 4
5 필라테스 4
6 복싱 4
7 골프 4
Data type 출력
type(df_sports)
pandas.core.frame.DataFrame
type(df_sports["운동종류"])
pandas.core.series.Series
Column 값 변경
df_sports["운동횟수"] = [2, 1, 2, 5, 6, 7, 3, 4]
df_sports["운동횟수"]
0 2
1 1
2 2
3 5
4 6
5 7
6 3
7 4
Name: 운동횟수, dtype: int64
Column 값 삭제
df_sports["지역"] = "서울"
df_sports = df_sports.drop("지역", axis=1)
df_sports
Row 기준으로 데이터 가져오기
df_sports.loc[0]
운동종류 축구
운동횟수 2
Name: 0, dtype: object
df_sports.loc[[0,1,2]]
운동종류 운동횟수
0 축구 2
1 야구 1
2 클라이밍 2
Row, Column 기준으로 데이터 가져오기
df_sports.loc[[0,1,5], "운동종류"]
0 축구
1 야구
5 필라테스
Name: 운동종류, dtype: object
특정 운동종류만 가져오기
df_sports[df_sports["운동종류"].str.contains("구")]
운동종류 운동횟수
0 축구 2
1 야구 1
3 농구 5
특정 운동횟수 이상 해당되는 데이터 프레임 가져오기
df_sports[df_sports["운동횟수"] > 4]
운동종류 운동횟수
3 농구 5
4 요가 6
5 필라테스 7
df_sports[df_sports["운동횟수"] > 4]
운동종류 운동횟수
0 축구 2
1 야구 1
2 클라이밍 2
6 복싱 3
7 골프 4
Sort_values() 정렬하기
df_sports.sort_values(by=["운동횟수"], ascending=True)
운동종류 운동횟수
1 야구 1
0 축구 2
2 클라이밍 2
6 복싱 3
7 골프 4
3 농구 5
4 요가 6
5 필라테스 7
csv file 저장, 출력
df_sports.to_csv("sports.csv", index=False)
pd.read_csv("sports.csv")