9일차 강의 : 아르테미스 달탐사

Luis_J·2024년 9월 27일
0

MS_AI_School 5기

목록 보기
10/70
post-thumbnail

Summary

Introduction

김수정 강사님
지난 번 DR.G 수업에 푹 빠져
이번에는 유성우 볼 수 있는 시간과 장소를 예측하는 법에 대해 강의를 들었습니다.

technical 한 영역과 그렇지 못한 영역의 교집합의 매력을 말씀해주셨습니다.
실제 세상을 technical 한 관점으로 바라보고 분석해보는 것은 실로 매력적입니다.

Code, Conept & Explanation

아르테미스 달탐사 (유성우)

월을 숫자로 변경하기

months = {'january':1, 'february':2, 'march':3, 'april':4, 'may':5, 'june':6, 'july':7, 'august':8, 'september':9, 'october':10, 'november':11, 'december':12}

변경된 숫자로 파일의 월 다시 할당하기

meteor_showers.startmonth = meteor_showers.startmonth.map(months) meteor_showers.endmonth = meteor_showers.endmonth.map(months) moon_phases.month = moon_phases.month.map(months) constellations.bestmonth = constellations.bestmonth.map(months) meteor_showers.bestmonth = meteor_showers.bestmonth.map(months)

통일된 형식으로 변경하기

meteor_showers['startdate'] = pd.to_datetime(2020*10000+meteor_showers.startmonth*100+meteor_showers.startday, format='%Y%m%d')

반구의 형태를 숫자로 변경하기

hemispheres = {'northern':0, 'southern':1, 'northern, southern':3} meteor_showers.hemisphere = meteor_showers.hemisphere.map(hemispheres) constellations.hemisphere = constellations.hemisphere.map(hemispheres)

달의 형태를 숫자로 변경하기

phases = {'new moon':0,'third quarter':0.5, 'first quarter':0.5,'full moon':1.0} moon_phases['percentage'] = moon_phases.moonphase.map(phases)

값이 없는 경우를 보완하기 (null 값인 경우, null 이전 값을 넣기)

lastphases = 0 for index, row in moon_phases.iterrows(): if pd.isnull(row['percentage']) : moon_phases.at[index, 'percentage'] = lastphases else: lastphases = row['percentage']

불필요한 부분 삭제하기

meteor_showers = meteor_showers.drop(['startmonth', 'startday', 'endmonth', 'endday', 'hemisphere'], axis=1) constellations = constellations.drop(['besttime'], axis=1) moon_phases = moon_phases.drop(['month','day','moonphase','specialevent'], axis=1)

https://www.youtube.com/watch?v=Aln9p6farRg&t=1628s

Challenges & Solutions

Results

What I Learned & Insights

  1. 원하는 것을 매우매우매우 뾰족하게 정리해야 합니다. (very very very specific하게 정리하기!)
  2. 그렇다면 올바른 결정을 하고 제대로 추론할 수 있습니다.

So I preper to be very, very, very specific
when I'm doing data cleansing manipulation
because this phase of data science is arguably one of most important.

Obviously, the type of data that you collect in the way that you collect
it is very important.

But once you have your data,
making sure that it accurately reperesents the real world
and what you know about it

Then you're going to make right decisions and
inferences off of that

I think that is the most important thing is to make sure that's accurate.

데이터 정리와 정제의 중요함을 다시 한 번 깨닫는 계기가 됐다!
또한 어려운 내용을 쉽게 설명하는 능력
한 주제의 강의를 1시간 안에 마무리하는 능력도 중요함을 깨달았다!

Conclusion

  1. 원하는 것 매우 매우 매우 뾰족하게 정리하기
  2. 데이터 정리 & 데이터 정제 중요함
  3. 어려운 내용을 쉽게 1시간 안에 마무리하는 능력 키우기
profile
New life & History

0개의 댓글

관련 채용 정보