[내일배움캠프] DAY18

채은·2025년 12월 22일

QA/QC pandas 내일배움캠프

내일배움캠프_QAQC_4기

목록 보기

17/60

1. 두번째 개인 과제 제출
2. 바이오/제약에서 자주 사용하는 차트 가볍게 찾아보기..
3. 증권사 자료 읽기
4. 타이타닉 gpt 문제

1. 두번째 개인 과제 제출

plt.grid(axis='True')
plt.grid(axis='both')
둘다 x,y축 모두에 격자선이 생김.

include_lowest=True -> 첫번째 구간의 시작값도 포함시켜라. pd.cut() 쓸 때 최소값이 의미 있는 경우(0, 기준값 등), 거의 항상 같이 쓴다.

colors = ['#66b3ff', '#99ff99', '#ffcc99']

plt.pie(DRC, labels=['Low (<= 0.015)', 'Medium (0.015-0.02)', 'High (> 0.02)'],
        colors= colors, autopct='%1.1f%%', startangle=140)

pie 설정 과정에서 괄호 안에 colors 내용을 다 입력해줄 필요가 없음. colors= colors으로 간단히 적으면 됨.

pie 차트에서
plt.axis('equal') -> 가로세로 비율 동일한 원으로 만들어줌
다른 옵션?
plt.axis('auto') -> matplotlib이 알아서 축 범위 설정. 왜곡 가능성 있음

이번 과제는 굉장히 친절하게 내주셔서 딱히 실수할 부분이 없겠다, 오래 안 걸리겠다 생각했었는데 큰 오산이었다. 이번엔 무려 파일 경로 잘못 가져오는 실수를 했다. 분명히 이게 맞는데.. 하면서 풀이를 다시보고 또보고 했지만 틀린 부분이 어딘지 알 수 없었다. 왜냐면 경로복사한 부분은 빼고 돌려보고 있었으니까!!!! 이거 때문에 시간을 꽤 허비해서 정말 비싼 교훈을 얻었다.... 글을 꼼꼼히 읽는 습관이 들이자ㅠ!

2. 바이오/제약에서 자주 사용하는 차트

영어로 검색해봤는데 역시나 히트맵이 많이 보였음.
히스토크램, 바이올린, 산점도 이런 것들을 많이 쓰는 듯

이거도 많이 보이는데 얘는 엣지 번들링(Hierarchical Edge Bundling)이라고 함.
복잡한 상호작용을 설명해야할 때 유용

3. 증권사 자료 읽기

산업 격변의 시대, 정부의 전략산업 정책으로 보는 2026년 산업 지도

4. 타이타닉 gpt 문제

오답교정

타이타닉 데이터셋으로 gpt가 내준 문제를 풀어봤슨

성별(sex)별 생존률의 평균

오답
df.groupby('sex')(df[df['alive']=='yes'].count()/df['alive'].count()).mean()
괄호
df.groupby('sex') 뒤에 소괄호를 썼음.
-> groupby().mean(), groupby()['컬럼'] 처럼 메서드 체인으로 써야 함
.

계산
df[df['alive']=='yes'].count()/df['alive'].count() 이렇게 쓰면 그룹화 전에 계산을 해버리는 거
-> df.groupby('sex')['survived'].mean()
.

컬럼
컬럼을 잘못 선택함
-> survived가 사고 당시 생존 여부. alive는 현재 시점에서의 상태
.
정답
print(df.groupby('sex')['survived'].mean())

나이(age)를 기준으로 새로운 컬럼을 만들기

오답
age_bins=[0,15,60]
df['age_group'] = df['age'](pd.cut(df['age'], age_bins))
df['age'] 일케 적으면 이거는 시리즈임.
시리즈는 ()로 호출할 수 없어서 오류가 나는 것.
.
정답
df['age_group'] = pd.cut(df['age'], bins=age_bins)

아티클 스터디
증권사 자료 마저 읽기

오늘의 소감

지난 주에 세운 주말 계획
zep 한번 들어가기 - 안 들어감
과제 끝내기 - 3번 못 풀고 자러감
팀원들이 추천해준 자료 읽기 - 안 읽음
이거 다 주말에 끝내기 - 못 끝냄!!

새롭게 알게된 점 & 어려웠던 점

내일의 목표
오전에 아티클 스터디
과제 발제
과제 해설 세션 놓친 부분 다시 보기
바이오/제약 분야의 시각화에 대해 좀 더 자세히 찾아보기

채은

내일배움캠프 사전교육 수강중

이전 포스트

[내일배움캠프] DAY17

다음 포스트