검색 엔진이란 키워드를 검색해서 관련 있는 사이트를 들어갈 수 있게 하는 서비스를 말한다. 검색 엔진 최적화란 Search Engine Optimization의 줄임말로 'SEO'로 불린다.
SEO는 검색 엔진이 찾기 쉽도록 웹 사이트의 트래픽의 품질과 양을 개선하는 프로세스이다. 사용자가 특정 키워드로 검색했을 때 검색 결과가 상위에 노출될 수 있도록 하는 작업이다.
상위에 노출이 되면 방문 트래픽이 늘어나기 때문에 효과적이고, 비용 처리 없는 마케팅 수단이 된다. 아무리 좋은 웹 사이트라도 SEO를 충족시키지 못하면 첫 페이지에 노출될 수 없고, 고객에게 존재를 알릴 수 없다.
메타데이터는 UI상으로 보여지지 않는 정보들이지만, 웹 사이트에 대한 설명이라서 잘 작성해야 한다.og 작업은 웹 페이지가 SNS에 공유될 때 미리보기 정보를 제공한다.<!-- SEO -->
<meta charset="UTF-8" />
<link rel="icon" type="image/svg+xml" href="파비콘_이미지_경로.ico" />
<meta name="viewport" content="width=device-width, initial-scale=1.0" />
<title>OpenGraph</title>
<!-- OG (Open Graph Data) -->
<meta property="og:title" content="미리보기 제목">
<meta property="og:description" content="미리보기 설명">
<meta property="og:image" content="미리보기_이미지_경로.jpg">
<meta property="og:type" content="website">
<meta property="og:locale" content="ko_KR">
이스케이프 코드 사용모든 웹페이지를 색인이라는 곳에 저장한다. (백과사전)데이터를 추출해 내는 것, 크롤링을 하여 새 페이지를 찾으면 색인에 저장된다.크롤링을 하는 소프트웨어. 웹에서 페이지를 크롤링을 한 후에 색인을 생성하는 자동 소프트웨어검색엔진의 크롤러는 링크를 타고 페이지를 돌아다니며 html 파일을 읽는다. 이러한 작업을 통해 단일한 url마다 색인을 생성한다. 검색 결과로 색인된 페이지를 보여준다. SPA는 url이 한 개지만 여러 가지 뷰(view)를 가진다. 이런 경우 다양한 페이지 뷰가 단일한 Meta data로 보인다. 리액트의 CSR 방식은 페이지의 뷰는 변해도 페이지의 타이틀과 디스크립션을 바꿀 수 없기 때문에 사용자 경험 개선 및 검색엔진의 최적화가 어렵다.
💡 검색엔진 원리
검색 엔진은
정보를 수집하는 크롤러가 존재한다. 크롤러는 여러 사이트를 돌아다니면서각 사이트에서 얻은 정보들을 모아서 검색 엔진에 다시 돌려주게 된다.각 사이트들은 크롤러를 부르는 별명도 있다. 그런데 크롤러가 무작위로 모든 사이트의 정보를 수집하게 되다면 숨기고 싶은 정보까지 공개될 것이다. 이러한 현상을 방지하기 위해서 검색 엔진은 특정한 약속이 생겼다. 그것은 바로robots.txt 파일이다.
크롤러는 웹 사이트를 방문할 때가장 먼저 robots.txt 파일을 열게 된다.파일에'로봇을 허용한다'라고 되어 있으면 크롤러가 접근하여 정보들을 가져오고, robots.txt에서'크롤러를 거부한다!!!'라고 되어 있으면 이 사이트에 접근하지 못한다. sitemap.xml 파일도 있는데 웹사이트 내의 모든 페이지들을 나열한 파일이다. 사이트를 더 정확하고 효율적으로 탐색할 수 있게 만들어 준다.
참고