김수정 강사님
지난 번 DR.G 수업에 푹 빠져
이번에는 유성우 볼 수 있는 시간과 장소를 예측하는 법에 대해 강의를 들었습니다.
technical 한 영역과 그렇지 못한 영역의 교집합의 매력을 말씀해주셨습니다.
실제 세상을 technical 한 관점으로 바라보고 분석해보는 것은 실로 매력적입니다.
months = {'january':1, 'february':2, 'march':3, 'april':4, 'may':5, 'june':6, 'july':7, 'august':8, 'september':9, 'october':10, 'november':11, 'december':12}
meteor_showers.startmonth = meteor_showers.startmonth.map(months) meteor_showers.endmonth = meteor_showers.endmonth.map(months) moon_phases.month = moon_phases.month.map(months) constellations.bestmonth = constellations.bestmonth.map(months) meteor_showers.bestmonth = meteor_showers.bestmonth.map(months)
meteor_showers['startdate'] = pd.to_datetime(2020*10000+meteor_showers.startmonth*100+meteor_showers.startday, format='%Y%m%d')
hemispheres = {'northern':0, 'southern':1, 'northern, southern':3} meteor_showers.hemisphere = meteor_showers.hemisphere.map(hemispheres) constellations.hemisphere = constellations.hemisphere.map(hemispheres)
phases = {'new moon':0,'third quarter':0.5, 'first quarter':0.5,'full moon':1.0} moon_phases['percentage'] = moon_phases.moonphase.map(phases)
lastphases = 0 for index, row in moon_phases.iterrows(): if pd.isnull(row['percentage']) : moon_phases.at[index, 'percentage'] = lastphases else: lastphases = row['percentage']
meteor_showers = meteor_showers.drop(['startmonth', 'startday', 'endmonth', 'endday', 'hemisphere'], axis=1) constellations = constellations.drop(['besttime'], axis=1) moon_phases = moon_phases.drop(['month','day','moonphase','specialevent'], axis=1)
https://www.youtube.com/watch?v=Aln9p6farRg&t=1628s
So I preper to be very, very, very specific
when I'm doing data cleansing manipulation
because this phase of data science is arguably one of most important.
Obviously, the type of data that you collect in the way that you collect
it is very important.
But once you have your data,
making sure that it accurately reperesents the real world
and what you know about it
Then you're going to make right decisions and
inferences off of that
I think that is the most important thing is to make sure that's accurate.
데이터 정리와 정제의 중요함을 다시 한 번 깨닫는 계기가 됐다!
또한 어려운 내용을 쉽게 설명하는 능력
한 주제의 강의를 1시간 안에 마무리하는 능력도 중요함을 깨달았다!