1. 두번째 개인 과제 제출
2. 바이오/제약에서 자주 사용하는 차트 가볍게 찾아보기..
3. 증권사 자료 읽기
4. 타이타닉 gpt 문제
plt.grid(axis='True')
plt.grid(axis='both')
둘다 x,y축 모두에 격자선이 생김.
.
include_lowest=True -> 첫번째 구간의 시작값도 포함시켜라. pd.cut() 쓸 때 최소값이 의미 있는 경우(0, 기준값 등), 거의 항상 같이 쓴다.
.
colors = ['#66b3ff', '#99ff99', '#ffcc99']
plt.pie(DRC, labels=['Low (<= 0.015)', 'Medium (0.015-0.02)', 'High (> 0.02)'],
colors= colors, autopct='%1.1f%%', startangle=140)
pie 설정 과정에서 괄호 안에 colors 내용을 다 입력해줄 필요가 없음. colors= colors으로 간단히 적으면 됨.
.
pie 차트에서
plt.axis('equal') -> 가로세로 비율 동일한 원으로 만들어줌
다른 옵션?
plt.axis('auto') -> matplotlib이 알아서 축 범위 설정. 왜곡 가능성 있음
.

영어로 검색해봤는데 역시나 히트맵이 많이 보였음.
히스토크램, 바이올린, 산점도 이런 것들을 많이 쓰는 듯

이거도 많이 보이는데 얘는 엣지 번들링(Hierarchical Edge Bundling)이라고 함.
복잡한 상호작용을 설명해야할 때 유용
산업 격변의 시대, 정부의 전략산업 정책으로 보는 2026년 산업 지도
오답
df.groupby('sex')(df[df['alive']=='yes'].count()/df['alive'].count()).mean()
- 괄호
df.groupby('sex') 뒤에 소괄호를 썼음.
-> groupby().mean(), groupby()['컬럼'] 처럼 메서드 체인으로 써야 함
.- 계산
df[df['alive']=='yes'].count()/df['alive'].count() 이렇게 쓰면 그룹화 전에 계산을 해버리는 거
-> df.groupby('sex')['survived'].mean()
.- 컬럼
컬럼을 잘못 선택함
-> survived가 사고 당시 생존 여부. alive는 현재 시점에서의 상태
.
정답print(df.groupby('sex')['survived'].mean())
오답
age_bins=[0,15,60] df['age_group'] = df['age'](pd.cut(df['age'], age_bins))df['age'] 일케 적으면 이거는 시리즈임.
시리즈는 ()로 호출할 수 없어서 오류가 나는 것.
.
정답df['age_group'] = pd.cut(df['age'], bins=age_bins)
아티클 스터디
증권사 자료 마저 읽기
오늘의 소감
지난 주에 세운 주말 계획
zep 한번 들어가기 - 안 들어감
과제 끝내기 - 3번 못 풀고 자러감
팀원들이 추천해준 자료 읽기 - 안 읽음
이거 다 주말에 끝내기 - 못 끝냄!!
새롭게 알게된 점 & 어려웠던 점
내일의 목표
오전에 아티클 스터디
과제 발제
과제 해설 세션 놓친 부분 다시 보기
바이오/제약 분야의 시각화에 대해 좀 더 자세히 찾아보기