Databricks community로 PySpark 체험하기 #1

이동욱·2022년 1월 2일
0

PySpark

목록 보기
1/3

Intro

  • 추후에 다른 DataSource에서 구글 bigquery에 업로드 하는 과정까지 하려합니다.
  • 이번 포스팅은 간단한 회원가입과 cluster 생성에 관한 글 입니다.

Contents

  • 링크 로 접속하여 Company Email만 자신의 이메일로 정확히 입력한 후 GET STARTED FOR FREE 를 클릭합니다.

  • 무료버전을 사용할 것이라면 아래 회색으로 되어있는 Get started with Community Edition을 클릭합니다.
  • 이후 이메일 인증을 마치고 나면 Databricks community site 에 접속이 가능합니다.

  • 왼쪽 메뉴바를 통해 Compute로 들어가 Create Cluster를 진행합니다.

  • cluster가 생성이 완료 되었다면 왼쪽 메뉴바에서 Data로 들어가 Create New Table을 진행합니다.
  • 데이터를 드래그앤 드랍으로 업로드 한뒤 Create table in Notebook을 클릭하면 노트북 화면으로 진입하여 아래와 같이 작업할 수 있습니다.

Outro

  • PySpark가 좋다고 하는데 어떻게 사용해야 할지 모르는 분들을 위해 간단히 체험을 할 수 있도록 적어보았습니다.
  • 글 마치는게 어색해서 귀여운 춘식이로 마무리합니다.
profile
공부해서 남주자

0개의 댓글