8일차 강의 : 달탐사_OverTHeMoon

Luis_J·2024년 9월 27일
0

MS_AI_School 5기

목록 보기
9/70
post-thumbnail

Summary

  1. 파이썬을 통해 데이터 분석이 가능합니다.
  2. 영화의 내용을 기반으로 실제 현실에서 도전해봅니다.
  3. 문을 두드리면 열립니다.

Introduction

김수정 강사님

내가 달을 간다면...

달에 간다는 가정 하에
내가 가져와야 하는 돌의 우선순위와 양을 구하는 문제를 풀어봤습니다.

MS LEARN 이 있다는 것만 알고
처음으로 들어가 봤는데
유튜브 교육 영상까지 있어서 흥미롭게 따라갔습니다.

핵심만 간결하게 설명해 줘서 재미있게 따라갔습니다.

아래 내용들은 기억할 만한 주요 문법 및 문장들입니다.

Learn 이 길이자 미래일 수도...
특히나 비전공자들의 희망이 될 수도 있겠습니다!

Code, Conept & Explanation

달탐사

판다스 라이브러리 활용

데이터 분석, 머신 러닝 등 다양하게 활용

import pandas as pd

CSV 파일 읽기 및 구조 샘플 확인

rocksamples = pd.read_csv('data/rocksamples.csv')
rocksamples.head()

측정 단위 변경 : g → kg

rocksamples['Weight (g)'] = rocksamples[Weight (g)'].apply(lambda x : x * 0.001)
rocksamples['Weight (g)']

칼럼명 변경 : Weigtht (g) → Weight (kg)

rocksamples.rename(columns={Weight (g)' : 'Weight (kg)'}, inplace=True)
rocksamples.head(3)

부분합, 엑셀의 sumifs, SQL의 Group By 절

sample_total_weight = rocksamples.groupby('Mission')['Weight (kg)'].sum()
smaple_total_weight

데이터 합치기, merge

missions = pd.merge(missions, sample_total_weight, on='Mission')

차이 구하기, diff

missions['Weight Diff'] = missions['Sample Weight(kg)'].diff()
missions

NaN 값 발생하는 경우, 숫자로 변형하기

missions['Weight Diff'] = missions["Weight Diff'].fillna(value=0)
missions

부족한 광물 숫자 세기

low_samples.groupby('Type')['Weight(kg)''].count()

https://youtu.be/jyFHnO7-4Gc?si=TWbqFcCWrdoQjJxv

Challenges & Solutions

Results

What I Learned & Insights

왜 데이터 분석을 해야 하는지 목적이 뚜렷해야 합니다.
그 목적성에 기반해서 필요한 내용들을 하나하나 실행해나간 후
필요 없는 부분들은 걷어내야 합니다.
고민 끝에 탄생한 결과물은 항상 심플하면서도 깊이가 있어야 합니다.

Conclusion

마지막 에필로그에서 강사님의 문장들이 와닿았습니다.

"I don't know all of those details
becasue I am not a subject matter expert.

But what I hope you've learned today,

1)
is that with publicaly-available information,
with data sets that you could collect yourself,

2)
you can really start to understand
and gain insight from this data,

3)
just with some lines of code and some simple multiplications and divisions

4)
Pandas and Python, when it relates to data science can be a little tricky sometimes,
so it's all about practice.

5)
That's what I love about doing it in these Notebooks and Visual Studio Code.

My original Notebook was a lot messier than this.
I created 10 million more DataFrames and tried it this way and add more columns.

and here we told a clear concised story
but I want to hear about your stories.

I want to hear how you explored the data,

(1) what other data sources you grabbed,
(2) and what other insights that you've managed
(3) to acquire through this exploration through data.

https://aka.ms/LearnWithDrG/OverTheMoon

Twitter
@drguthals

and use the
#LearnwithDrG

profile
New life & History

0개의 댓글

관련 채용 정보