멋사 AI 7기 2주차

psy4072·2022년 9월 22일
0
post-thumbnail

Dictionary

		age_code = """
		10대 : AGE_001
		20대 : AGE_002
		30대 : AGE_003
		40대 : AGE_004
		50대 : AGE_005
		60대 : AGE_006
		70대 : AGE_007
		기타 : AGE_008
		( 비회원, 외국인, 그 이상 등 )"""
        
        age_dict = {}
		for age in age_code.split("\n"):
    		list = age.split(":")
    		if len(list) > 1:
        		key = list[1].strip()
        		val = list[0].strip()
        		age_dict[key] = val
		age_dict
	phone = ">경기 031 >강원 033 >충남 041 >충북 043 >경북 054 >경남 055 >전남 061 >전북 063"
    phone_dict = {}
	for ph in phone.split(">"):
    	list = ph.split(" ")
    	if len(list) > 1:
        	key = list[0]
        	val = list[1]
        	phone_dict[key] = val

	phone_dict
    
    
    {'경기': '031',
 	'강원': '033',
 	'충남': '041',
 	'충북': '043',
 	'경북': '054',
 	'경남': '055',
 	'전남': '061',
 	'전북': '063'}

pandas

import pandas as pd

Series 생성

pd_series = pd.Series([1,2,3,np.nan,6,7)]
pd_series

0    1.0
1    2.0
2    3.0
3    NaN
4    6.0
5    7.0
dtype: float64

DataFrame 생성

df_sports= pd.DatFrame()
df_sports

Column 추가 1

df_sports["운동종류"] = ["축구", "야구", "클라이밍", "농구", "요가", "필라테스", "복싱", "골프"]
df_sports

운동종류
0	축구
1	야구
2	클라이밍
3	농구
4	요가
5	필라테스
6	복싱
7	골프

Column 추가 2

df_sports["운동횟수"] = 4
df_sports


운동종류	운동횟수
0	축구		4
1	야구		4
2	클라이밍	4
3	농구		4
4	요가		4
5	필라테스	4
6	복싱		4
7	골프		4

Data type 출력

type(df_sports)

pandas.core.frame.DataFrame
type(df_sports["운동종류"])

pandas.core.series.Series

Column 값 변경

 df_sports["운동횟수"] = [2, 1, 2, 5, 6, 7, 3, 4]
 df_sports["운동횟수"] 
 
0    2
1    1
2    2
3    5
4    6
5    7
6    3
7    4
Name: 운동횟수, dtype: int64

Column 값 삭제

df_sports["지역"] = "서울"
df_sports = df_sports.drop("지역", axis=1)
df_sports

Row 기준으로 데이터 가져오기

 df_sports.loc[0]
 
 운동종류    축구
운동횟수     2
Name: 0, dtype: object
   df_sports.loc[[0,1,2]]
   
   
		운동종류	운동횟수
	0	축구		2
	1	야구		1
	2	클라이밍	2
   
    

Row, Column 기준으로 데이터 가져오기

 
 df_sports.loc[[0,1,5], "운동종류"]
 
 	0      축구
	1      야구
	5    필라테스
	Name: 운동종류, dtype: object
 

특정 운동종류만 가져오기

  df_sports[df_sports["운동종류"].str.contains("구")]
  
  
		운동종류	운동횟수
	0	축구		2
	1	야구		1
	3	농구		5

특정 운동횟수 이상 해당되는 데이터 프레임 가져오기

df_sports[df_sports["운동횟수"] > 4]

	운동종류	운동횟수
3	농구		5
4	요가		6
5	필라테스	7


df_sports[df_sports["운동횟수"] > 4]


운동종류	운동횟수
0	축구		2
1	야구		1
2	클라이밍	2
6	복싱		3
7	골프		4

Sort_values() 정렬하기

df_sports.sort_values(by=["운동횟수"], ascending=True)


운동종류	운동횟수
1	야구		1
0	축구		2
2	클라이밍	2
6	복싱		3
7	골프		4	
3	농구		5
4	요가		6
5	필라테스	7

csv file 저장, 출력

df_sports.to_csv("sports.csv", index=False)

pd.read_csv("sports.csv")
profile
Ⓓ🅰️🅣🄰 ♡♥︎

0개의 댓글