구조와 의미를 결정하기 위해 일련의 규칙에 따라 일련의 기호나 텍스트를 분석하는 프로세스 = 구문분석
즉, 문서의 내용을 Token(토큰)
으로 분석하고, 문법적 의미와 구조를 반영한 Parse Tree(트리)
를 생성하는 과정
Token(토큰)
public static void main(String[] args) {
;;
}
Token : public, static, void, main, ... 이러한 토큰을 제외한 공백문자(스페이스, 탭문자, 개행문자 등)는 문자열 내에서 사용되는 경우가 아닌 이상은 모두 아무런 의미를 가지지 않는다.
Parse Tree(트리)
Ex. 브라우저는 HTML을 DOM트리로 파싱한다.
구문 분석을 수행하는 데 사용되는 소프트웨어 도구 = 파서가 파싱 작업을 한다.
parser(파서)란 컴파일러의 일부로서
원시 프로그램즉, 컴퍼일러나 인터프리터에서 원시 프로그램을 읽어 들여, 그 문장의 구조를 알아내는 parsing(구문분석)을 행하는 프로그램을 말한다.