import pandas as pd
import numpy as np
# 1-1 데이터 로드
df = pd.read_csv('train.CSV', encoding = 'cp949')
# 1-2 상위 5개 행 출력
# df.head(5)
# pd.DataFrame(df)
# df.describe()
# 연령별 생존율
# print(df["Age"].min())
# print(df["Age"].max())
# age_range = [(0 + 10 * i, 9 + 10 * i) for i in range(9)]
# for a,b in age_range:
# print(f"""{a}~{b}세의 생존율 : {df[(a <= df["Age"]) & (df["Age"] <= b)].describe().loc['mean','Survived']}""")
# 성별 별 생존율
# genders = df['Sex'].unique()
# print(genders)
# for i in genders:
# print(f"""{i}의 생존율 : {df[df['Sex'] == i].describe().loc['mean','Survived']}""")
#티켓 클래스별 생존율
# classes = df['Pclass'].unique()
# for i in classes:
# print(f"""Pclass {i}의 생존율 : {df[df['Pclass'] == i ].describe().loc['mean','Survived']}""")
# 'Embarked' 항구별 승객 수
port = df['Embarked'].unique()
for i in port:
if not pd.isna(i):
print(f"""{i} 항구에서 탑승한 승객의 생존율 : {df[df['Embarked'] == i ].describe().loc['mean','Survived']}""")