파이썬은 1991년 귀도 반 로섬(Guido van Rossum)이라는 프로그래머에 의해 개발된 언어로, 가독성이 높고 쉬운 문법 덕택에 다른 프로그래밍 언어보다 빠른 습득이 가능하다는 특징이 있습니다. 그 덕에 프로그래밍을 전공하지 않은 비전공자 중심으로 인기를 얻어 데이터 분석과 모델링을 다루는 통계학부터 딥러닝과 인공지능을 활용하는 의학에까지 다양한 분야에 두루 활용되고 있습니다.
검색량을 기준으로 프로그래밍 언어 선호도를 조사하는 TIOBE index에서 2021년 2월 기준 파이썬은 선호하는 프로그래밍 언어 3위(10.86%)를 차지했으며, 오라일리 미디어가 온라인 학습 플랫폼의 학습 과정 및 사용자 선호도를 분석해 발표한 프로그래밍 언어 순위에서는 파이썬이 Java와 C++을 제치고 가장 높은 사용률을 보였습니다. (출처: TIOBE Index for February 2021)
우선 파이썬은 들여쓰기가 문법의 일부로, 구조를 파악하기 용이하다. 또한 자연어 같이 읽힌다는 장점, 즉 읽기 쉽고 익숙하다는 장점이 있다. 다양한 내장 함수도 지원한다.
사례 1: 리스트에 있는 숫자 모두 더하기
numbers = [1, 2, 3, 4, 5]
total = sum(numbers)
print(total) # 👉 15
int[] numbers = {1, 2, 3, 4, 5};
int total = 0;
for (int i = 0; i < numbers.length; i++) {
total += numbers[i];
}
System.out.println(total);
사례 2: 리스트 필터링
nums = [3, 8, 12, 4, 15]
filtered = [n for n in nums if n > 10]
<print(filtered) # 👉 [12, 15]
const nums = [3, 8, 12, 4, 15];
const filtered = nums.filter(n => n > 10);
console.log(filtered);
💫 파이썬은 초보자 친화적이면서도 실무에 유용하다.
내가 짠 코드도 나중에 보면 낯설기 마련인데, 코드가 자연어처럼 읽히면 이런 경우에도 금방 다시 이해할 수 있다. 또한, 협업에서도 가독성 좋은 언어는 큰 강점을 지닌다. 누가 읽더라도 이해하기 쉬운 코드일수록 전체적인 업무 효율이 올라간다.
이는 수정(디버깅) 및 유지보수가 편하다는 또다른 장점으로 이어진다. 잘 짜여진 가독성 좋은 코드는 쉽게 수정하고 확장할 수 있다.
SQL과 파이썬은 데이터 분석가의 양대 필수 스킬이다. SQL이 데이터 추출/정리용이라면 파이썬은 분석, 자동화, 모델링 전용 스킬이라고 볼 수 있다. 따라서 둘 다 알아야 실무형 데이터 분석가가 될 수 있다.
파이썬은 크롤링→정제→분석→시각화→리포트 자동화까지 가능하다.
예)
웹에서 실시간 데이터 수집 → Pandas로 정제 → Seaborn으로 시각화 → PDF 리포트 자동 생성
Pandas로는 엑셀로 수 시간 걸릴 작업도 몇 줄로 처리할 수 있다. 머신러닝, 회귀, 군집, 시계열 분석과 같은 복잡한 분석 기법도 쉽게 구현할 수 있으며, 단순 분석을 넘어 예측 모델링, 추천 시스템 등도 구현 가능하다.
또한, pandas.read_sql()로 SQL 쿼리 결과를 바로 분석할 수 있다.