검색 엔진에서 찾기 쉽도록 사이트를 개선하는 프로세스
Google 검색은 웹 크롤러라는 소프트웨어를 사용하는 완전히 자동화된 검색엔진이다.
웹 크롤러는 정기적으로 웹을 탐색해 Google 색인에 추가할 페이지를 찾는다.
웹에 어떤 페이지가 존재하는지 파악하는 것으로, URL 검색을 통해 페이지를 방문(크롤링)한다.
Googlebot(로봇, 크롤러, 스파이더)은 알고리즘 프로세스를 사용해 크롤링할 사이트와 크롤링 빈도, 각 사이트에서 가져올 페이지 수를 결정한다. 또 과부하를 피하기 위해 사이트를 너무 빠르게 크롤링하지 않도록 프로그래밍되는데 이를 위해 사이트의 응답 등을 사용한다.
Googlebot은 링크를 따라가거나, 사이트맵을 읽거나 하는 방식으로 URL을 찾아내 액세스 가능한 페이지에 대해 크롤링하며, 크롤링하는 동안 Google은 방문 페이지를 렌더링하는 방식과 유사하게 최신 버전의 Chrome을 사용해 페이지를 렌더링하고 발견된 자바스크립트를 실행한다.
색인 : Google에서 알고 있는 모든 웹페이지를 색인에 저장한다. 각 페이지의 색인 항목은 해당 페이지의 콘텐츠 및 위치(URL)를 명시한다. Google에서 페이지를 가져와 읽고 색인에 추가하면 색인이 생성된다.
페이지가 크롤링되면 Google은 페이지의 내용을 파악하는데 이 단계를 색인 생성이라고 한다.
이 과정에는 <title>
요소 및 alt 속성, 이미지, 동영상 등 텍스트 콘텐츠 및 핵심 콘텐츠 태그와 속성을 처리하고 분석하는 작업이 포함된다.
색인 생성 프로세스 중 Google은 페이지가 인터넷에 있는 다른 페이지와 중복되는지 아니면 표준 페이지(검색결과에 표시될 수 있는 페이지)인지 판단한다.
표준 페이지를 정하기 위해 Google은 인터넷에서 찾은 비슷한 콘텐츠의 페이지를 클러스터링한 다음 그룹을 잘 대표하는 페이지를 선택한다.
Google에서는 표준 페이지와 그 콘텐츠에 관한 신호(언어, 국가, 페이지의 사용성 등)를 수집하며, 이는 검색결과에 페이지를 게재하는 다음 단계에서 사용될 수 있다.
표준 페이지와 해당 클러스터에 관해 수집한 정보는 대규모 데이터베이스에 저장될 수 있는데 이를 Google 색인이라고 한다.
색인 생성은 보장되지 않는다.
색인 생성은 페이지 콘텐츠 및 메타데이터에 따라서도 달라지는데, 일반적으로 다음과 같은 문제가 발생한다.
사용자가 검색어를 입력하면 Google 컴퓨터는 색인에서 일치하는 페이지를 검색한 다음 품질이 가장 높고 사용자와 가장 관련성(사용자의 위차와 언어, 기기 등)이 크다고 판단되는 결과를 반환한다.
검색결과에 게재되지 않는 원인은 다음과 같을 수 있다.
사이트맵을 제출하자.
사이트맵은 사이트에 있는 파일로, 새 페이지나 변경된 페이지가 있으면 이를 검색엔진에 알려준다.
robots.txt
파일은 검색엔진이 사이트의 일부에 액세스하여 크롤링할 수 있는지 알려준다.
생성기를 사용해 파일을 손쉽게 만들 수 있다.
이 파일로 민감한 자료를 적절하고 효과적으로 차단하는 것은 아니므로 안전한 방법은 아니다.
Googlebot은 사용자와 같은 방식으로 페이지를 인식한다. 렌더링과 색인 생성을 최적화하려면 Googlebot이 웹사이트에서 사용하는 자바스크립트, CSS, 이미지 파일에 항상 액세스할 수 있도록 허용해야 한다.
URL 검사 도구를 사용해 Googlebot이 콘텐츠를 렌더링하는 방식을 정확하게 확인할 수 있다.
<title>
요소는 사용자는 물론 검색엔진에 특정 페이지의 주제가 무엇인지 알려준다.<title>
요소의 내용이 검색결과의 제목 링크로 표시될 수 있다.<title>
요소 만들기<title>
요소 사용하기site:
연산자 사용)description
)의미 있는 표제 강조하기
<em>
, <strong>
으로 대체할 수 없는 heading tag(<h1>
<h6>
)
구조화된 데이터 마트업 추가하기
HTTPS 프로토콜 사용하기
웹 접근성 높이기
<a href=>
)좋은 콘텐츠 만들기..
신뢰 구축하기
전문성 드러내기
주제에 관해 적절한 양의 콘텐츠 제공
주의를 분산시키는 광고 표시하지 않기
링크 현명하게 사용하기
<meta name="robots" content="nofollow">
<a href="http://www.example.com" rel="nofollow">Anchor text here</a>
<a href="http://www.example.com" rel="ugc">Anchor text here</a>
HTML 이미지 사용하기
<img>
, <picture>
alt
속성 사용하기이미지 사이트맵 사용하기
표준 이미지 형식(JPEG, GIF, PNG, BMP, WebP) 사용하기
반응형 웹 디자인 (권장)
meta name="viewport"
사용하기동적 게재
Vary HTTP
헤더를 사용하여 사용자 에이전트에 따라 변경 사항을 알립니다.별도의 URL
rel="canonical"
및 rel="alternate"
요소가 있는 <link>
태그를 페이지에 추가하여 두 URL 간의 관계알리기Google에서는 Search Console이라는 도구를 제공한다.
검색 실적 분석
<title>
및 description
, meta 태그의 문제 식별사용자 행동 분석
<title>
및 description
, meta 태그 변경이 검색 엔진의 트래픽이 향상시켰는지Search Engine Optimization (SEO) Starter Guide
Google Search Central
SEO For Developers