여덟 번째 수업 | 아르테미스 달탐사 데이터 분석

Faithful Dev·2024년 9월 12일
0

김수정 강사님

아르테미스 달탐사 데이터 분석

링크텍스트

문제 정의

  • 목표: 아폴로 임무 데이터를 분석하여 2024년 아르테미스 임무 시 달에서 효율적으로 암석 샘플을 찾는 방법 연구

환경 설정

  • 필수 개발환경: Python, Visual Studio Code
  • 필요한 라이브러리: Pandas(데이터 분석용)

데이터 수집

  • 샘플데이터: NASA에서 제공하는 달 암석 샘플을 수집하고 가공
  • GitHub에서 데이터 수집: 로컬 환경에 저장 후 분석

데이터분석

  • Pandas 사용: 데이터 프레임 생성, 누락값 처리, 컬럼 변환, 그룹별 통계 계산
  • 주요 명령어:
    - read_csv(): CSV 파일 불러오기
    • groupby(): 임무별 샘플 중량 집계
    • describe(), info(): 데이터 요약 및 자료형 확인

임무 예측

  • 아르테미스 임무 예측: 아폴로 임무 데이터를 바탕으로 아르테미스 임무에서 수집할샘플 유형과 중량을 예측

Personal Insight

데이터 분석은 여전히 나의 주적..

오늘부터 시작된 데이터 분석 수업. 정말 쉽지 않다. 그래도 처음에는 노답이었는데, 점점 알아들을 수 있는 걸 보면 성장하고는 있는 거겠지. ㅠㅠㅋ

여전히 머리에 안들어오는 부분들은 소화가 어렵다. axis는 도대체 언제 0이고 언제 1인지, loc는 하나만 데이터를 받을 때 행이었는지 열이었는지 머릿속이 매번 혼란스럽다. 그러고보면 행열에 대한 이해가 내가부족한가? 그 부분 공부가 좀 필요한 건가?

axis=0이면 행(row)을 기준으로, axis=1이면 열(column)을 기준으로! ChatGPT에게 물어보고 답을 얻었지만, 이해한듯 싶다가도, 막상 실전에서 데이터로 보면 헷갈린다. 그냥 여러번 부딪히고 경험으로 익히는 게 답인가보다.

loc의 규칙과 인덱싱은 아직 꽤나 어렵고, 특히 pandas에서는 and 연산자가 사용이 안되고 &를 사용한다는 거 매번 까먹어서 매번 오류다. 그래도 에러가 뜨면 답이 있다는 것이니 그것으로 감사해야 하려나.

목표했던 데이터를 이해하며 성공적으로 뽑아냈다는 것만으로도 승리한 것이라 생각하련다. 이렇게 하나하나 '나도 할 수 있다'는 자신감이 생기면, 성장하는 걸음을 걸을 수 있지 않을까.

데이터 분석은 여전히 나의 주적이지만, 오늘은 이겼다고 총평하련다. 지금의 어려움을 넘어서면 언젠가 이주적이 서브 몬스터 수준으로 떨어질 날도 오지 않을까 기대해본다.

Lv.1 UP!

profile
Turning Vision into Reality.

0개의 댓글