날씨가 뒤죽박죽이지만 매일 집에 틀어박혀 SQL 쿼리를 작성하고, 혹은 파이썬 코드를 쓰면서 창밖으로 나가려는 멘탈을 부여잡고 있다. 대체 이 SQL이 뭐라고 나를 괴롭게 하는 걸까?
그래 오늘은 그 SQL에 대해서 알아보자. 마침 오늘 우리의 튜터님께서 세션을 진행하시며 SQL이 무엇인지에 대해서 설명해주셨다. 오늘은 이걸 한 번 복습해보는 시간을 가져보자.
SQL은 기본적으로 데이터베이스에 저장된 데이터에 접근하기 위한 질의어다. 뭔소린지 모르겠다고 생각하면 나도 그렇다. 하지만 데이터 분석가에게 가장 기본적으로 요구되는 언어 능력임에는 반박의 여지가 없다.
데이터 분석가 공고를 찾아보면 기본적으로 파이썬과 함께, SQL을 활용할 줄 아는 능력을 요구하며, 이를 확인하기 위해 코딩 테스트도 진행한다고 한다. 그러므로 데이터 분석을 공부하는데 있어 SQL은 기본 소양이라 보아도 무방하다.
데이터는 모든 형태의 정보를 말한다. 우리가 카카오톡에서 주고 받는 대화, 사진, 영상도 모두 데이터이다. 그리고 그런 데이터를 모아놓는 곳을 데이터 베이스라고 한다. 그렇다면 이것을 그대로 SQL에 대입해보자.
SQL은 데이터베이스에 저장된 데이터를 불러오기 위해 데이터베이스를 에게 건내는 업무 지시문이라고 볼 수 있다. 다만 데이터 베이스에 전처리 없이 보관된 데이터, 즉 로우 데이터는 상당히 지저분하기 때문에, 이를 관리해주는 프로그램도 존재한다.
그 프로그램이 우리가 주로 사용하는 MySQL과 같은 DateBase Management System, 줄여서 DBMS이다. DBMS는 위의 사진과 같은 산만한 데이터들에 규칙성, 정합성을 부여해서 등록과 정리, 검색이 용이한 형태로 가공하는 소프트웨어이다! 이렇게 느낌표를 쓰니까 꼭 외국의 교재를 번역한 것 같아서 재밌다!
보통은 위와 같은 형태로 보기 좋게 가공이 되는데, 단순히 보기 좋을 뿐만 아니라 앞서 설명한 것처럼 해당 데이터가 가진 다양한 정보값이 정형화된 것을 확인할 수 있다.
내가 쓴 쿼리다. 저렇게 정형화된 데이터가 저장된 데이터 베이스에서 정보를 꺼내오기 위해 사용하는 요청의 형식이 SQL이다. 쓰다보면 GPT가 왜 일을 안 하는지 궁금해질만큼 머리가 아프다. 하지만 이것이 바로 데이터 분석의 가장 기본이 되는 기술이다.
아마 이제는 나의 진정한 복습을 위해 SQL을 어떻게 작성하고 있는지도 쓸 생각이지만, 오늘은 시간이 늦어 여기까지 하는 걸로 하자. 내일 보자구 친구들~