240810 TIL #463 kaggle 코드 / pyplot

김춘복·2024년 8월 9일
0

TIL : Today I Learned

목록 보기
464/543
post-custom-banner

Today I Learned

오늘은 한 주 동안 배운 내용을 한번씩 정독하며 복습을 진행하고,
"머신러닝, 딥러닝에 필요한 기초수학 with 파이썬" 책을 사왔다.
책은 틈틈히 읽어서 블로그에 TIL로 정리해둘 생각이다.


참고 코드

  • kaggle에서 API로 dataset 쉽게 가져오는 법

    위 버튼을 누르면 API 커맨드가 나오는데 이를 아래의 코드들을 참고해서 colab에서 바로 데이터를 가져올 수 있다.
kaggle datasets download -d muhammadroshaanriaz/cancer-dataset-risk-of-developing-or-dying
  • google colab kaggle 관련 코드
# 1. Kaggle 데이터셋 다운로드
!kaggle competitions download -c titanic

# 2. 압축 해제
!unzip titanic.zip -d titanic

# 3. 데이터셋 로드 및 사용
import pandas as pd

# 데이터 로드
df = pd.read_csv('titanic/train.csv')

# 데이터 확인
print(df.head())
  • matplotlib.pyplot 으로 산점도 표현
import matplotlib.pyplot as plt

plt.scatter(x, t) # 산점도 생성
plt.xlabel('X축 라벨')
plt.ylabel('Y축 라벨')
plt.title('산점도 제목')
plt.grid(True) # 격자무늬 출력
plt.show() # 그래프 출력
profile
Backend Dev / Data Engineer
post-custom-banner

0개의 댓글