
이전 포스팅들에서 데이터 분석을 하기 위해서는 SQL, Python을 필수적으로 사용할 수 있는 것을 알 수 있었습니다.
그렇다면 SQL과 Python은 어떠한 언어일까요?

SQL은 데이터를 저장하는 가장 보편적인 기술이며, 대부분의 기업에서도 데이터를 SQL 방식으로 관계형 데이터 베이스에 저장할 가능성이 높습니다.
데이터를 분석하기 위해서는 데이터 추출이 선행되어야 합니다. SQL 방식으로 저장된 데이터를 추출하기 위해서는, SQL 쿼리를 사용합니다.
SQL 쿼리로 컴퓨터에 명령하여 데이터가 추출되면, R과 Python 언어를 쉽게 사용할 수 있는 환경이 만들어 집니다.
또한, SQL이 아닌 데이터를 추출할 때도, SQL과 비슷한 문법으로 컴퓨터에 명령하는 경우가 많습니다.
따라서 SQL은 데이터분석의 기초이자, 기본입니다.

파이썬이 현업에서 자주 사용되는 이유를 분석해 보았습니다.
사람의 언어와 유사하기에, 파이썬은 직관적인 언어라고 평가받습니다. 파이썬을 모르는 사람들도 쉽게 접근할 수 있고, 난이도도 어렵지 않아 많은 사람들이 사용하고 있는 언어입니다.
파이썬은 대량의 데이터를 빠르게 처리한다는 장점이 있습니다.
또한, 반복작업은 프로그래밍으로 처리하여, 일의 효율성을 높여주기도 합니다.
파이썬에서는 CSV파일을 불러들이기, 내보기가 모두 가능합니다.
실무에서는 엑셀로 데이터를 받는 경우도 많기 때문에, 엑셀과의 높은 호환성도 파이썬의 장점이라고 할 수 있습니다.
머신러닝, 딥러닝을 수행하는 경우에는 라이브러리를 불러들어야 합니다. 파이썬에는 여러 라이브러리가 존재하여, 다양한 방법으로 모델링을 진행할 수 있습니다.
대표적인 파이썬의 라이브러리는 다음과 같습니다.
SQL언어와 파이썬 언어 둘 다 데이터 분야에서 자주 쓰이는 언어이지만, 그 쓰임이 다르다는 것을 알게 되었습니다.
각 언어의 장점을 살려, 실무에서 적절하게 활용할 수 있도록 두 가지 언어 모두 열심히 배워보겠습니다.
참고자료1. 파이썬은 왜 데이터 분석에 많이 쓰일까?
참고자료2. 데이터 분석, SQL만 잘 다뤄도 먹고 들어갑니다.