현직 데이터분석가가 추천하는 VSCode Extension

2innnnn0·2020년 9월 25일
5
post-thumbnail

아래 확장기능(익스텐션)들은 VSCode를 사용하면서 개발자 뿐 아니라 PM이나 운영관리 같은 비개발자 실무자들도 사용하면 좋을 팁들을 가져왔다.

1. Material Icon Theme

  • 밋밋한 파일의 아이콘을 심플하면서 이해가 높은 심볼로 변경.

2. Geo Data Viewer

  • 기존에 작성한 글을 참고하면 좋다! Uber Deck.gl기반 Kepler를 연동한 패키지다.

3. Korean Language Package

  • VSCODE 한국어 패치다 번역이 정말 잘 되어있다, 그런데 이미 영어에 익숙해져있다보니 자주 쓰지 않는 패키지지만 VSCode를 사용하는 한국 커뮤니티 분들에게 경의를 표하기 위해 넣어두었다. 무려 41만 다운로드의 기록이 있다.(2020-09 기준) 643,234건으로 늘어났다(2021-06 기준)

4. Korean-translator

  • 위에 한국어팩을 검색하던 중 연관되어서 발견된 패키지다. naver api를 사용하는 플러그인인데 간혹 웹브라우저에서 번역이 안되는 PDF파일 등을 쉽게 번역할 수 있다는 장점이 있다.
  • Git Star🌟 꾹 눌러줍니다. (번역 처리 속도도 매우 훌륭!)

5. *(강력추천) Transformer

  • Transformer는 데이터를 변환하는 확장 프로그램이다. 해당 기능은 반드시 깔아두시길!
  • 제공하는 기능들만 해도 31가지나 된다!
Align CSV
Align To Cursor
Compact CSV
Copy To New Document
Count Duplicate Lines As New Document
Encode / Decode
Filter Lines As New Document
Filter Lines
Join Lines
JSON String As Text
Lines As JSON String Array
Normalize Diacritical Marks
Randomize Lines
Randomize Selections
Reverse Lines
Reverse Selections
Rotate Backward Selections
Rotate Forward Selections
Select Highlights
Select Lines
Selection As JSON String
Sort Lines By Length
Sort Lines
Sort Selections
Split Lines After
Split Lines Before
Split Lines
Trim Lines
Trim Selections
Unique Lines As New Document
Unique Lines
  • 분석가를 비롯하여 데이터를 자주 활용하는 분이라면 반드시 설치해서 사용해야한다.

6. Partial Diff

  • 데이터검증시 정말 유용하게 사용하는 기능. RAW를 하나씩 비교해야할때 해당 기능으로 빠르게 확인할 수 있음.

  • 아쉽게도 DIFF 부분만 뭔가 모아보고 싶은데, 아직까지 해당 기능을 갖춘 확장프로그램을 못찾았다. 나중에 찾으면 후술할 예정.

  • 다른 툴로는 Diff Tool 이 있다. 마찬가지로 간편하게 비교할 대상을 첫번째, 두번째로 지정해서 비교하는 툴.

8. SQL (BigQuery)

  • BigQuery 전용으로 만들어진 플러그인이지만, ANSI을 사용하는 다른 DB에서도 사용이 용이하게 만들어져 있다.

  • 해당 플러그인은 BigQuery를 실행해주는 것이 아닌, BigQuery문법과 용법을 서포팅해주는 도구다. 아래와 같이 SELECT 구문을 입력하면 여러 스닙펫들을 보여주는데, 이를 선택하면 자동으로 코드 작성을 간편하게 도와준다!

  • 나는 주로 함수 자동완성을 사용하는데 함수에 들어가는 파라미터를 까먹기 쉬워서 해당 자동완성을 활용해서 보다 함수를 쉽게 할 수 있다.

  • 편집기에서 명령팔레트를 실행하고 [언어 모드 변경change language mode] 후, sql-bigquery를 설정하면 된다. 혹은 우측 하단에 언어를 변경하면 된다.

9. SandDance for VSCode

  • 케글코리아 수비니움님을 통해서 알게된 패키지. CSV파일을 빠른 렌더링으로 손쉽게 EDA가 가능하게 시각화를 도와준다. 데이터를 3D로 표현하는 부분에서 시각적인 인상은 뛰어나다!

  • 며칠 사용하면서 느낀 점은 내가 잘 못 사용해서 그런지 모르겠지만 시각화를 내가 원하는 형태로 그려내기 좋지는 않다는 점이다. 일반적인 Gropping 하여 집계를 내는 부분에서 명확하게 표현이 쉽지 않다.

10. Generate Data

  • faker.js를 기반으로 만들어진 확장프로그램.
  • 원하는 종류의 더미데이터를 임의(가짜)로 만들어준다.
  • 보통 개발자들은 웹개발시 사용하나 분석가는 개인정보 이슈로 실제 데이터를 사용하면 안되는 경우 사용한다.
  • 확장 설정을 통해 locale을 ko 로 변경하면 일부 종류의 데이터에 대해서 해당 로컬 환경에 맞게 변형된다. 그러나 한글이 나오는 것 뿐이지 실제 데이터와 괴리감이 있다. (e.g. name.lastname -> 민준 오, 지민 황, Dr. 준서 김)
  • Generate Data : Mulitple 옵션으로 한번에 수십개의 데이터를 만드는 것도 가능하다.
  • 제공해주는 더미데이터 종류는 다음과 같다.
address : 주소
commerce : 상품
company : 회사
database : 데이터베이스 
date : 날짜
finance : 금융
hacker : 보안
image : 이미지
internet : 인터넷(네트워크)
lorem : 로렘 입숨
name : 이름
phone : 전화번호
random : 랜덤 
system : 시스템
  • vscode-faker 도 있는데 이건 다중으로 만들수도 없고 만들 수 있는 더미데이터 종류가 적어서 비추.
profile
성장하고 싶은 데이터분석가.

0개의 댓글