파싱(Parsing)? 크롤링?

조준범·2022년 1월 21일
1

개념 정리

목록 보기
2/4

랜더링을 알아보던 중 파싱(parsing)이란 말을 발견해서 찾아보다보니 또 크롤링이랑 말도 있더라..
문자를 숫자로 바꿔주는 ParseInt()는 들어봤어도 그냥 파싱은 뭘까 하다가 우선 찾아봄!

파싱(Parsing)이란?

언어학에서의 파싱(parsing)이란?
문장을 이루는 구성 성분으로 분해하여 문장의 구조를 결정 하는 것.
갑자기 언어학이 왜나와

그렇다면 내가 알고 싶은 관점에서의 파싱이란?

컴퓨터 과학에서 parsing은 일련의 문자열을 의미 있는 토큰(token)으로 분해하고,
이들로 이루어진 파스트리(parse tree)를 만드는 과정이다.

라는데 이해가 되지 않는다..
그래서 다시 다른것도 찾아보니..!

"파싱"이란 데이터를 분해, 분석해서 원하는 형태로 조립하고 다시 빼내는 것! 이란다. 출처는 요기서
그러니까 랜더링에서 HTML, CSS를 파싱해서 DOM트리, CSSOM트리로 만든다는건 내가 만든 HTML이랑 CSS, JS파일을 컴퓨터가 분해하고 분석해서 컴퓨터 자신이 알아먹을수 있는 형태로 조립하는 것이라고 이해를 하면 되겠다!

그렇다면 크롤링(Crawling)이란?

정식 명칭은 "Web Scraping"이다.
크롤링 혹은 스크래핑이라고 하는데 웹 페이지를 가져와서 거기서 데이터를 추출해내는 행위를 말한다.
이미 만들어진 HTML 문서나 오픈 API에서 필요한 정보만 긁어와서 사용하는 것!

0개의 댓글