JavaScript와 Node.js를 이용한 웹 크롤링 공부 시작

Joon·2021년 10월 17일
0

웹 크롤링

목록 보기
1/2

웹 크롤링 공부의 동기

언어인지학을 전공하시는 어머니께서 웹에서 원하는 단어들을 추출하고 분석할 수 있는 웹 크롤링 프로그램이 필요하다며 도움을 요청하셨다. 안그래도 근래 JavaScript를 공부하는 중이었기에
그동안 배운 JavaScript와 Node.js를 응용해보고, 추가로 데이터 분석 또한 간단하게 맛보고 싶어 JavaScript와 Node.js를 이용해서 이 프로그램을 한번 만들어보고자 한다.


나의 공부법의 근간은 주로 책이다. 이 주제와 알맞는 서적들을 찾다가 "자바스크립트와 Node.js를 이용한 웹 크롤링 테크닉, 쿠지라 히코우즈쿠에 저/이동규 옮김"이라는 책을 찾았고 이 서적을 참고하여 내 첫 사이트 프로젝트를 공부하며 이 과정을 이 블로그에 기록하려 한다.


PS. 혹시나, 혹여나, 정말로 혹시나 나중에라도 누군가 이 포스트를 보게 된다면 나의 험난한 여정은 참고만 하고 책을 구매하여 공부하시는 것을 추천한다. 왜냐하면 나의 여정의 전부가 아닌, 기록으로 남겼으면 하는 내가 보기에 공부가 되었던 내용을 기록할 것이기 때문이다.
책 표지는 아래와 같다.

왜 JavaScript인가?

개인적인 이유로는 필자가 근래 관심을 갖고 공부하는 언어가 JavaScript이기 때문이다. 하지만 이 책의 저자가 말하는 이유는 아래와 같다.
1. 배우기 쉽다
자바스크립트의 기본적인 문법은 매우 간단하기에 배우기 쉽다.
2. 다양한 라이브러리가 준비되어 있다.
다양한 자바스크립트 실행 엔진들이 존재하며(V8등등) 이를 통해 다양한 라이브러리를 사용할 수 있는 환경이 형성되고 있다. 특히나 Node.js같은 경우, 이를 위한 수많은 라이브러리가 있고 그 라이브러리들을 패키지 매니저인 npm(node package manager)를 통해 쉽게 설치하고 관리할 수 있다.
3. 유연성이 높아 코드를 빠르게 작성할 수 있다.
자바스크립트는 언어의 유연성이 매우 높은 것으로 정평이 나 있다. 프로토타입 기반의 객체 지향적인 코드를 작성할 수 있으며, Node.js의 경우는 기능을 모듈 단위로 효율적으로 관리할 수 있다.


그러면 다음 포스팅부터 개발 환경 구축을 시작으로 공부를 시작해보자!

profile
한줄씩 완성해가는 개발 공부

0개의 댓글