
검색엔진최적화(SEO-Search Engine Optimization)는 웹사이트를 검색엔진에서 더 찾기 쉽도록 사이트를 개선하는 프로세스
즉, 구글과 같은 검색엔진에 친화적인 사이트를 구축하여 검색 광고가 아닌 자연 검색 결과(검색 결과 상위 노출)를 통해 트래픽의 양과 질을 극대화하는 작업
검색 엔진은 검색하는 사람들에게 긍정적인 사용자 경험을 선사하는 것이 목표이기 때문에 가능한 한 최고의 정보를 제공하길 원한다. 따라서, SEO는 검색 엔진이 콘텐츠를 특정 검색어에 대한 웹 상의 주요한 정보로 인식하도록 하는 것에 중점을 두어야 한다.
검색엔진 최적화의 필요성은 BACKLINKO의 연구 결과를 통해 확인할 수 있다.
위 이미지를 통해 첫 번째 페이지의 클릭률이 가장 높으며, 두 번째 페이지부터 클릭률이 급격하게 감소하는 것을 알 수 있다.
또한 첫 번째 페이지의 자연 검색 결과에 대해서는 가장 상단에 위치한 자연 검색 결과는 10번째에 위치한 자연 검색 결과보다 클릭률이 10배 더 높다.
이외에도
등의 연구 결과를 통해 검색엔진 최적화의 필요성을 확인할 수 있다.
그 중에서도 전세계에서 가장 많이 사용되는 Google을 중심으로 검색 엔진이 동작하는 방식과 검색엔진 최적화 방법을 알아보고자 한다.
Google은 크롤러라는 프로그램을 사용하여 끊임없이 웹을 탐색하고 색인에 추가할 페이지를 찾는 완전히 자동화된 검색엔진이다. 웹 크롤러는 정기적으로 웹을 탐색하여 Google 색인에 추가할 페이지를 찾는다. 실제로 Google 검색 결과에 표시되는 페이지의 대부분은 사이트 소유자가 직접 제출한 것이 아닌 Google 웹 크롤러가 웹을 탐색할 때 발견되어 자동으로 추가된 것이다.
Google 검색은 세 단계로 동작하나, 각 단계가 모든 페이지에 적용되는 것은 아니다.
자연 검색 결과의 순서를 정하기 위해서는 웹에 어떤 페이지가 존재하는지 파악해야 한다. 모든 웹페이지가 등록되는 중앙 레지스트리가 있는 것은 아니므로 Google은 계속해서 새 페이지와 업데이트된 페이지를 검색하여 파악된 페이지 목록에 추가해야 한다. 이 프로세스를 'URL 검색'이라고 한다.
Google이 페이지의 URL을 발견하면 내용을 확인하기 위해 크롤링한다. 이때 웹페이지를 가져오는 프로그램을 Googlebot(또는 크롤러, 로봇, 봇, 스파이더)이라고 한다. Googlebot은 알고리즘 프로세스를 사용하여 크롤링할 사이트와 크롤링 빈도, 각 사이트에서 가져올 페이지 수를 결정한다.
페이지가 크롤링되면 Google은 페이지의 내용을 파악한다. 이 단계를 색인 생성이라고 하며 <title> 요소 및 Alt 속성, 이미지, 동영상 등 텍스트 콘텐츠 및 핵심 콘텐츠 태그와 속성을 처리하고 분석하는 작업이 포함된다.
색인 생성 프로세스 중에 Google에서는 페이지가 인터넷에 있는 다른 페이지와 중복되는지 아니면 표준 페이지인지 판단한다. 표준 페이지는 검색결과에 표시될 수 있는 페이지이다. 표준 페이지를 정하기 위해 Google은 먼저 인터넷에서 찾은 비슷한 콘텐츠의 페이지를 그룹으로 묶은 다음(클러스터링) 이 그룹을 가장 잘 대표하는 페이지를 선택한다. 그룹의 나머지 페이지는 사용자가 휴대기기에서 검색하거나 클러스터의 특정 페이지를 찾는 경우와 같이 다양한 컨텍스트에서 게재 가능한 대체 버전이다.
사용자가 검색어를 입력하면 Google 컴퓨터는 색인에서 일치하는 페이지를 검색한 다음 품질이 가장 높고 사용자의 검색어와 가장 관련성이 크다고 판단되는 결과를 반환한다. 관련성은 사용자의 위치와 언어, 기기(데스크톱 또는 휴대전화)와 같은 정보를 비롯하여 수많은 요인으로 결정된다.
<title> 태그에는 사이트 제목을 기재하고, <div> 태그를 사용해 줄을 바꾸는 등 적절한 HTML 소스로 홈페이지를 구성하는 것은 검색엔진에게도 이해하기 쉬운 웹 문서가 되며, 유사한 내용의 웹 문서가 있을 경우 상대적으로 순위가 높아진다.
HTML 문서의 헤더에 들어가는 페이지 제목은 구체적이고 간결하게 구성해, 검색 결과 화면에서 텍스트가 잘리지 않도록 한다.
Google 등 메타 태그 정보를 검색 알고리즘 평가 대상에서 제외하는 검색 엔진이 증가하고 있지만, keywords, description 등의 정보는 검색엔진의 검색 결과에도 표시되고 있기 때문에 포함하는 것이 좋다.
alt는 이미지가 로딩되지 못했을 때 대신 표시되는 텍스트이지만 HTML 코딩과 유용성 측면에서도 좋고, 시각장애인용 스크린리더가 사용될 때 이미지 되신 alt 속성 값을 읽어 어떤 이미지인지 파악할 수 있도록 도움을 준다. 검색엔진 또한 이미지 내의 alt 속성 텍스트를 통해 인덱싱 작업을 하기 때문에 SEO에 도움을 준다. 하지만 alt 태그에 너무 긴 텍스트를 넣는 것은 피해야 한다.
대부분의 검색 엔진은 Flash 애니메이션의 텍스트를 수집할 수 없으며, 링크 또한 사용할 수 없다.
예를 들어, 홈페이지에 Flash만 놓고 HTML 소스에 <a> 태그를 코딩해 작성하지 않는 경우, 검색 로봇은 앞 뒤 페이지로 이동할 수 없어 검색엔진 데이터베이스에 수집되지 않는다.
구글은 https 보안 프로토콜을 더 선호하기 때문에, 인증기관에서 발급하는 ssl 인증서를 구입해 https로 변경한다면 전체 점수의 약 1% 정도에 해당하는 가산점을 부여한다.
사이트맵은 웹사이트에 있는 페이지, 동영상 및 기타 파일과 각 관계에 관한 정보를 제공하는 파일이다. 검색엔진은 이 파일을 읽고 웹사이트를 더 효율적으로 크롤링한다. 특히 사이트 크기가 크거나, 연결되는 외부 링크가 많지 않은 사이트, 리치 미디어 콘텐츠가 많거나 Google 뉴스에 표시되는 사이트의 경우 사이트맵을 루트 디렉터리에 위치하는 것을 권장한다.
robots.txt 파일은 크롤러가 사이트에서 액세스할 수 있는 URL을 검색엔진 크롤러에 알려준다. 이 파일은 주로 요청으로 인해 사이트가 오버로드되는 것을 방지하기 위해 사용하며, 웹페이지가 Google에 표시되는 것을 방지하기 위한 메커니즘이 아니다. 때문에 필요한 정보가 포함되어 있는지 체크 후 사이트 루트에 위치해두는 것이 좋다.
페이지 로딩 속도는 검색엔진최적화를 결정하는 요소 중 매우 중요한 부분을 차지한다. Google은 이 로딩 속도가 짧은 웹사이트에 더 높은 SEO 점수를 준다. 로딩 속도에는 ‘서버 속도’ 와 ‘데이터’가 영향을 준다. 서버는 웹 사이트의 엔진과 같은 존재입니다. 트래픽이 많아질수록 더 많은 메모리와 CPU 자원이 필요하다. 따라서 호스팅 서버 자원이 충분한지 주기적으로 확인해야하며 자원이 부족한 경우 자원을 추가해야 한다.
Google SEO는 모바일 중심으로 색인을 생성한다. 따라서 콘텐츠를 만들 때 모바일을 중점으로 만들어야 한다. 웹사이트의 모바일 친화성 여부를 확인하려면 Google 모바일 친화성 도구를 사용할 수 있다.
참고한 자료
Google 검색 센터