import pandas as pd
customers = pd.read_csv('marketing_campaign.csv',sep='\t',index_col=['Marital_Status','Education'])
customers
customers.sort_index(level=0, inplace=True)

풀이
customers.sort_index(level='Marital_Status', inplace=True)
또는
customers.sort_values('Marital_Status', inplace=True)
customers.loc['Married','Graduation']
풀이 : 컬럼 열도 해주는 습관!
customers.loc['Married','Graduation', :]
customers.agg({'Year_Birth' : ['max','min','mean'], 'Income' :['max','min','mean']}).round(0)
풀이
위와 동일하게 한것과 아래 방법이 있다.
customers[['Year_Birth','Income']].agg(['max','min','mean'])
customers[['Year_Birth','Income']].apply({'max','min','mean'})
1.먼저 apply에 사용될 함수를 만들어준다.
def income(money):
if money >= 60000:
return '고임금'
elif money >= 30000 and money < 60000:
return '평균임금'
else:
return '저임금'
customers['Class_Income'] = customers['Income'].apply(income)
3.컬럼 위치 수정
data = customers.pop('Class_Income')
customers.insert(loc = 3, column= 'Class_Income', value=data)

customers.reset_index(['Marital_Status','Education'],inplace=True) #인덱스 초기화 #reset_index(inplace=True) 이렇게 해도 됨.
customers['Marital_Status'].replace(['Alone','Absurd','YOLO'],'Single',inplace=True)#값 Single로 변경
customers.set_index(['Marital_Status','Education']) #인덱스 재조립
customers.value_counts('Marital_Status')

데이터 수를 확인하니 **Alone, Absurd, YOLO** 얘들 없어짐
풀이
확인할 때 이렇게 하더라
customers.index.get_level_values(0).value_counts()
근데 값은 동일하게 나옴