AI ( LLM ) 와 함께하는 SEO. 끝장을 보자.

Harrison Jung·2024년 7월 9일
10

두루미스( https://durumis.com ) 라는 블로그 플랫폼을 개발하면서 트래픽을 올리기 위해 할 수 있는 모든 SEO는 다하고 있는거 같다.


( Gemini 와 대화를 하는데, SEO 관련을 이야기 했더니 저런 반응을... )

우선 현재 서비스에서 사용하고 있는 기술(기능)들을 간단히 우선 목차만 나열하면 다음과 같다.

  • JSON-LD
  • Sitemap , Feed
  • IndexNow
  • hreflang Tag
  • Backlink

그리고 AI 관련기능은 다음과 같다.

  • Vector Search
  • LLM

우선 순서대로 살펴보자.

JSON-LD

JSON for Linking Data 라고 부르는 이 데이터 코드 조각은 주로 구글의 서치 콘솔에서 리치 검색을 위한 코드로 사용된다.
구글의 구조화된 데이터 마크업에 따르면,해당 코드들을 잘 사용하면 구글의 검색 노출에 좀 더 리치한 결과를 보여줄 수 있다고 한다.
예를들어 보자.

구글링을 하다보면 간혹 위와 같이 주소줄 옆에 도메인 > 한국어 > 해리슨 와 같이 표시되는것을 볼 수 있다. 이것은 사실 위에 이야기한 JSON-LD를 이용해서 데이터를 입력한건데, 구글의 구조화데이터를 이용하여 마크업을 하면 저렇게 표기하는게 가능하다.

그 외에도 다양한 정보 - 예를들면, 회사정보,지리 정보등 다양한 정보가 입력이 가능하니 한번쯤 읽어보면 좋을 내용. 사실상 메타태그의 범주안에 들어가는 내용이기도 하고, 혹은 구글에서는 JSON-LD 말고도 마이크로 태그로 넣어도 된다고 하니까 읽어보면 다 된다!

Sitemap / Feed(rss)

글을 잘 쓰고, 발행했다 치자. 이것을 구글에 알리기 위한 제일 좋은 방법은 구글 서치 콘솔 에 등록하는것이다.
그렇다고 페이지를 하나 하나 등록할 순 없고, 제일 좋은 방법은 역시 API로 통채로 등록하는것인데, 그게 바로 Sitemap / Feed
구글에서는 Sitemap으로 등록을 하면 해당 링크에 있는 모든 페이지를 불러오는데, 두루미스의 경우 2가지 방법을 채택하고 있다.
하나는 Sitemap 을 통해서 "전체글"을 1주일에 한번 등록하는 방법.
또 다른 하나는 Feed를 통해서 "최신글" 500개를 매일 갱신해주는 방법.
사실 등록은 상시로 되어 있는데, API 를 통해서 1주일/1일에 한번씩 갱신해주는 방법을 사용한다.
그러면 구글에서 좀 더 빨리 데이터를 크롤링 하는것을 "로드밸런서"를 통해서 확인할 수 있다.
물론 사용자들이 개별적으로 각자 RSS 를 등록하는 방법도 있으나, 그건 그거고, 이건 이거니까.

IndexNow

사실 이건 구글과는 전혀 상관이 없는데...
IndexNow 라는 검색엔진 협의체가 있는데, 이것을 이용하면, Bing 과 Naver 에 새로운 글이 등록되었다는것을 "실시간"으로 알릴 수 있다.
겨우 3% 밖에 안되는 Bing 이긴 하지만, 국내 시장의 주요 플레이어인 Naver 를 생각하면 해두면 나쁘진 않다. 물론 두루미스는 둘다 해놨다. 어찌되었던간에 검색엔진을 늘려놓고 나면 키워드 분석에 조금이라도 더 유리할 수 있으니까..

hreflang Tag

사실 국내 전용 서비스들은 이 부분은 거의 신경쓸일이 없다.
우리 같은 경우는 다국어 서비스라서 다국어 지원을 해야 하는데, 그에 따른 다국어 지원을 위한 Tag라고 보면 된다.
사람들이 쉽게 접할 수 있는 케이스로는 애플 홈페이지가 있는데, 애플 홈페이지 소스코드를 뜯어본 사람은 알겠지만 hreflang 이라고 해서 무지막지하게 많은 ( 무려 137개 언어와 지역!! ) hreflang을 지원하고 있는데, 우리는 그정도까진 아니고 , 18개의 언어에 대한 hreflang 을 지원하고 있다.
이 부분은 구글의 현지화된 버전 알리기 관련 자료를 자세히 읽어보면 큰 도움이 된다.


다음으로 AI 관련

Vector Search

두루미스는 처음부터 AI / LLM에 의한 서비스를 표방하고 나왔다.
그중 하나가 Vector Search 를 이용한 검색과 유사글 추천인데, 구글에서 자랑하는 검색 기능이 이것을 베이스로 한다고 한다. 물론 이게 다는 아니긴 한데, 사실 자연어 검색을 이용해보면 이것만한게 없다. 단순한 키워드 검색과는 품질이 다르다. 물론 좀 더 튜닝과 다양한것들이 필요하긴 한데.. 여유가 생기면 해볼 생각.아무튼 현재는 조금 아쉽긴 한데, 나중에 시간이 좀 더 여유가 생기면 튜닝을 해볼 생각. 현재 구현되어 있는 모습은 다음과 같다.

LLM

사실상 두루미스의 가장 핵심.
두루미스는 AI를 이용하여

  • 3줄 요약을 하고
  • 설명글을 작성하고 ( meta tag 의 description )
  • 해시 태그를 추천하고
  • 카테고리 분류를 하고
  • 제목을 기반으로 하여 자동으로 URL을 작성하고
  • 다국어 번역을 한다.
    간혹 "AI 번역은 번역의 품질이 떨어지지않나요?" 하는 사람들이 있는데, 그것과 관련해서도 올려놓은 글이 있다. 한번 참고하기를 ㅎㅎ. 요약하자면 기존의 NMT (신경망) 번역은 상대적으로 부족한것이 사실이나, 현재의 LLM 번역은 사람과 비교해서 크게 부족하지는 않다. 라는것이다.

AI에 관련된 글을 구글에서 고객 사례로 올려놓은 인터뷰 글이 있다.
https://cloud.google.com/customers/dreamyoungs?hl=ko
AI에 관련된 내용을 아주 자세하게 인터뷰해서 올려 놓은글이다.


여기까지 읽어보면 "어? 위에서 분명 Backlink 얘기한다고 했는데? 없네?" 할 수있다.
그렇다. 없다. 이유는... 아직 미공개 자료가 좀 있어서, 그건 이 글이 올라가서 반응이 좀 올때쯤 다음 글로 올릴 예정. 사실, 그거까지 한번에 올리면 그거 내용만 한편짜리라.. 너무 길기도 하고..

profile
차세대 생성형 AI 위키 서비스 "두루미스 위키"를 만들고 있는 개발자

1개의 댓글

comment-user-thumbnail
2024년 7월 9일

아.. CDN 얘기를 깜빡했네.. 그것도 다음편에...(아마..)

답글 달기