[LG U+ Why Not SW Camp 7기] 7주차 회고

Iris Shin·2025년 7월 23일

LG U+ Why Not SW Camp 회고

기간: 2025.06.23-2025.06.27


💡 이론 학습 내용

이번 주에는 데이터 전처리와 시각화의 기초를 집중적으로 학습했습니다.

데이터 전처리 (Preprocessing)

  • astype(float)으로 데이터 타입을 변환하고, 0을 NaN으로 처리

  • np.nanmean을 활용하여 결측값을 무시한 평균을 계산하는 방법

  • np.argmax를 통해 각 주차별 최대값의 위치를 구하는 방법

기본 시각화 (Matplotlib)

다양한 시각화 도구를 사용하여 데이터를 효과적으로 표현하는 방법을 익혔습니다:

  • plt.plot()을 이용한 선형 차트

  • plt.bar()를 이용한 막대 그래프

  • plt.scatter()를 이용한 산점도

  • plt.hist()로 히스토그램 시각화

  • plt.boxplot()을 통한 박스플롯 시각화

추가 학습 포인트

  • df.set_index()로 날짜를 인덱스로 설정하는 방법

  • df.rename()으로 컬럼명 변경

  • plt.plot(..., color='red')로 색상 지정

  • np.random.randint()를 통해 랜덤 숫자 생성

👍 좋았던 점

다양한 차트를 직접 그려보며 상황에 맞는 시각화 방법을 비교해볼 수 있었음

pie, scatter, line, box plot 등 다양한 형태의 시각화를 경험함

새로운 사람들과의 협업이 흥미로웠고, 함께 학습하는 분위기가 좋았음

❗ 아쉬웠던 점 & 스스로 부족했던 점

‘왜 이 그래프를 선택했는가’에 대한 고민이 부족했음

필터링이나 조건 설정 등 코드 구문의 정확도에 개선 필요

시각화를 그리는 데 집중하느라 데이터의 분석적 해석이 부족했음

EDA를 접하고 나니 단순히 시각화하는 것을 넘어 목적에 맞는 데이터 활용이 필요함을 느낌

🌱 느낀 점 및 앞으로의 계획

단순한 시각화를 넘어서 의미 있는 인사이트를 도출하는 능력이 중요함을 느낌

분석 목적에 적합한 시각화 방식을 선택하는 기준을 더 명확히 세울 필요가 있음

EDA 및 시각화 결과를 바탕으로 스스로 데이터를 탐색하고 질문을 생성하는 사고 능력을 기르고 싶음

❓ 앞으로 더 깊이 생각해볼 질문들

Q1. 다양한 시각화 기법 중 특정 상황에서 가장 적합한 차트를 고르는 기준은 무엇인가요?

Q2. 데이터 전처리 단계에서 결측값을 처리하는 다양한 전략(평균 대체 외에)은 무엇이 있고, 각각의 장단점은 무엇인가요?

Q3. 시각화 결과를 분석적 인사이트로 연결하기 위한 사고 과정은 어떻게 설계해야 하나요?

profile
Welcome:)

0개의 댓글