Kaggle Platform 알아보기

조권휘·2022년 8월 17일
0

Dacon/Kaggle

목록 보기
3/6

Kaggle 기본 홈페이지

  • 처음 회원가입 후 홈페이지 방문을 하면 kaggle competition에 참여할 것인지, 강의 course를 들을 것인지 물어본다.
  • 좌측 메뉴에는 주로 사용하는 것이 Competitions, Datasets, Code, Discussions, Courses 가 있다.
  • 우측의 나의 이름을 누르면 나의 프로필을 확인할 수 있다.
  • 좌측의 More을 누르면 user ranking, blog, community GuideLines 등도 확인할 수 있다.



프로필 확인

  • 프로필에서는 나의 등급, 팔로워, 활동 등을 확인할 수 있다.
  • 이 외에도 내가 참여한 competition, dataset, code를 확인할 수 있다.



Competitions

  • competitions 에는 다양한 대회들이 있다. 상금이 걸린 대회도 있고 학습을 위해 열려있는 knowledge 카테고리의 대회도 있다.
  • search하는 곳의 filters를 통해 원하는 대회의 분야를 찾아갈 수 있고, Your work를 통해 현재 내가 참여하고 있는 대회를 확인할 수도 있다.

  • 원하는 competition을 누른 뒤의 화면이다. Join Competition을 눌러 대회에 참여할 수 있다. 코드를 작성한 뒤 Submit prediction을 통해 점수를 확인해 볼 수 있다.
  • overview : competition의 개요와 설명이 적혀있다. evaluation에는 평가방법과 제출 형식이 나와있고, 그 아래에는 자주 하는 질문에 대한 답변도 나와있다.
  • Data : 주어진 데이터의 정보를 확인할 수 있고, 스크롤을 내리면 competition에 참여를 하고 동의사항에 동의를 한 뒤 데이터를 다운받을 수 있다.
  • Code : Dacon의 코드 공유와 같이 다른 유저들이 올린 코드를 확인할 수 있다.
  • Discussion : 다른 사람들과 질의응답을 할 수 있는 게시판이다.
  • Leaderboard : 자신의 코드를 점수로 환산한 뒤, 등수를 확인할 수 있는 게시판이다.
  • Rules : 대회 규칙이 적혀있는 게시판으로, 보통 참가자 당 1개의 계정을 사용하고, 팀원은 10명 이내, 제출은 하루 10회 이하, 코드 공유에 관한 내용들이 적혀있다.



Datasets

  • Datasets에는 Trending부터 Movies, Clothing, Covid-19까지다양한 데이터들이 존재한다.
  • Filters, Search를 통해 원하는 종류의 데이터 셋을 검색할 수 있다.

  • 원하는 Dataset에 들어가게 되면 위와 같은 화면을 확인할 수 있다.
  • 앞으로 dataset이 update될 빈도, 라이센스, 사용성 등이 나와있다.
  • 상단에 나와있는 Download를 통해 dataset을 다운받을 수 있다.
  • Data : dataset에 대한 정보가 담겨있다. dataset의 설명, 정보 등이 나와있고, dataset의 페이지마다 모델에 대한 설명도 나와있는 경우가 있다. 스크롤을 내려 이 dataset으로 진행되고 있는 활동도 확인할 수 있다.
  • Code : 유저들이 주어진 dataset으로 만든 모델과 코드를 확인할 수 있다.
  • Discussion : dataset에 대해 유저들끼리 토론, 질의 응답을 할 수 있다.
  • Metadata : dataset에 대한 이용 정보, 협력자, 기원, 저자 등을 확인할 수 있다.



Code

  • 유저가 notebook을 작성하거나 다른 유저들의 코드를 열람할 수 있는 공간이다.
  • 최근 trend한 코드, 분류, 회귀 등 filtering을 통해 원하는 종류의 코드를 확인할 수 있다.

  • 상단의 New notebook을 눌렀을 때의 화면이다.
  • 우측에서 data를 추가할 수 있고, setting을 통해 언어, 환경을 조정할 수 있다.
  • code와 markdown을 추가할 수 있으며 사용법은 쥬피터 노트북과 유사하다.
  • notebook을 저장하거나 github에 link도 가능하다.



Discussion

  • 유저들끼리 질의 응답을 하고 토론을 할 수 있는 공간이다.
  • 기본적인 forum부터 해서 kaggle의 competition에 관한 질의 응답, 그리고 data에 대한 질문도 다양하게 이뤄지는 공간이다.



Courses

  • 프로그래밍 기초, 파이썬부터 시작해서 SQL, 머신러닝 등등 다양한 강의를 볼 수 있는 공간이다.
  • 동영상 강의 형태는 아니며, Course를 수강한 내용을 직접 코드로 작성도 해볼 수 있다.



GuideLines(주의점)

  • 유저들끼리 친근하게 다가가며 다른 유저의 아이디어를 비난하지 말고, 아이디어를 개인적인 것으로 만들기보다는 서로 토론하고 존중할 것.
  • 진행 시스템의 조작 금지
  • 위반자에 대한 경고, 콘텐츠 제거, 계정 금지도 가능
  • 자세한 내용은 https://www.kaggle.com/community-guidelines 를 통해 확인
profile
안녕하세요 :) Data/AI 공부 중인 한국외대 컴퓨터공학부 조권휘입니다.

0개의 댓글