
세계 모든 웹 서버의 웹 페이지 정보들에 접근(조회)하고 싶다면
세계 모든 웹 서버의 도메인 네임(IP주소)을 통해 직접 일일히 웹 페이지 정보들에 접근해야될까?
무언가나 대신 세계 모든 웹 서버의 웹 페이지들을 미리다 찾아놓고,분류/정리한 뒤에
내검색어에 따라 적합한 웹 페이지들만 골라 전달해주면 어떨까?
무언가 : Google, Naver, Daum과 같은 검색엔진 서비스
다 찾아놓고 : 웹 크롤링 - 서계 모든 웹 서버의 웹 페이지 정보 수집(봇)
검색엔진은 전 세계의 웹 서버로부터 어떤 웹 페이지가 존재하는지 웹 크롤링으로 한번에 긁어 인덱싱한다.
웹 크롤러(봇)는 웹 페이지가 어떤 내용을 갖고 있고, 각 웹 페이지간에 어떤 관계인지 파악해야 하는데 추론하는 것보다 명시적인 것이 더 확실하다.
따라서 각 웹 서버는 robots.txt와 sitemap.xml을 통해 위 내용을 명시한다.
User-agent: [크롤러 이름]
Disallow: [크롤링 금지 경로]
Allow: [크롤링 허용 경로]
sitemap.xml은 검색엔진에 사이트의 구조를 명확히 알리고, 중요 페이지가 누락되지 않도록 한다.<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://www.example.com/</loc>
<lastmod>2024-08-24</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>https://www.example.com/about/</loc>
<lastmod>2024-08-20</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>
분류/정리한 뒤에 : 인덱싱, 앞서 수집한 전체 웹 페이지들을 상관관계별로 분류
검색어에 따라 적합한 웹 페이지들만 골라 반환 : 검색엔진의 검색 결과 반환
검색어와 검색 결과의 연관성 은 검색엔진을 사용하는 고객들의 만족도 및 검색엔진의 사명이다.
SEO)이 중요하다.검색엔진 최적화(SEO)는 웹 사이트를 검색엔진에서 더 높은 순위에 노출되도록 하는
전략과 기법을 의미한다.
On-Page SEOOff-Page SEOTechnical SEO웹 페이지의 만족도는 연관된 정보의 질과 양,
그리고 페이지 이동 및 이벤트 반응속도와 같은 성능에 의해 평가된다.
웹 페이지나 애플리케이션의 성능을 측정하고 평가하는데 사용되는 다양한 지표를 의미한다.
사용자가 웹 페이지를 로드하고 상호작용하는 동안 경험하는 속도와 반응성을 평가하는 데 중요한 역할을 한다.
웹 페이지의 사용자 경험을 평가하기 위해 정의한 성능 지표다.
이 지표들은 웹사이트의 성능, 특히 로딩 속도, 인터랙티브성, 시각적 안정성을 측정하며, 검색 순위에도 영향을 미칠 수 있다.
Load Time사용자가 URL을 입력하거나 링크를 클릭한 순간부터 페이지의 모든 리소스가 로드되어
화면에 웹 페이지가 완전히 표시될 때까지 걸리는 총 시간
FCP(First Contentful Paint)웹 페이지 내 처음으로 사용자가 인지할 수 있는 컨텐츠가 화면에 나타나는 시간
LCP(Largest Contentful Pain)웹 페이지 내 가장 큰 주요 컨텐츠가 완전히 화면에 나타나는데 걸리는 시간
TBT(Total Blocking Time)메인 스레드가 차단되어 페이지가 사용자 입력에 응답하지 못하는 총 시간
TBT가 높으면 페이지의 반응성이 떨어진다.
TTI(Time To Interactive)웹 페이지가 사용자와 상호작용을할 수 있는 상태가 되기까지의 시간
페이지가 완전히 로드되어 사용자가 클릭하거나 스크롤할 때 즉각적으로 반응할 수 있는 상태를 의미
FID(First Input Delay)사용자가 처음으로 페이지와 상호작용을 했을 때, 브라우저가 그 상호작용에 반응하는데 걸리는 시간
FID가 낮을 수록 더 나은 사용자 경험을 의미한다.
CLS(Cumulative Layout Shift)페이지가 로딩되는 동안 레이아웃이 얼마나 많이 이동하는지 측정한다.
레이아웃 이동은 사용자가 예기치 않은 경험을 겪게 할 수 있어 좋지 않다.
CLS가 낮을수록 사용자는 더 안정적인 경험을 한다.
Performance Metrics와Core Web Vital은
웹 페이지나 애플리케이션의 속도, 상호작용성, 안정성 등을 평가하는 중요한 지표들이다.
이러한 지표들은 사용자 경험을 최적화하고, 웹 사이트의 성능을 개선하는 데 핵심적인 역할을 하며, 비즈니스 성과와 검색엔진 순위에도 직접적인 영향을 미칠 수 있다.
Semantic HTML은 HTML 태그를 사용하여 웹 페이지의 내용과 구조를 의미적으로 표현하는 방식이다.
이는 웹 페이지의 요소들이 그 역할과 의미에 맞는 태그로 구성된다는 것을 의미한다.
Semantic HTML을 사용하면 브라우저와 검색엔진, 그리고 스크린 리더 등과 같은
접근성 도구들이 웹 페이지의 내용을 더 잘 이해할 수 있으며, 검색 결과에 더 관련성 있는
정보를 제공하여 SEO를 향상 시킬 수 있다.
<header><nav><main><section><article><aside><footer><figure> or <figcaption> 구글 Lighthoust는 웹 페이지의 성능, 접근성, SEO, 그리고 기타 웹 개발 관련 요소들을 자동으로 분석하고 개선할 수 있는 방법을 제안하는 오픈 소스 도구다.
개발자가 웹 페이지의 품질을 종합적으로 평가하고 최적화할 수 있도록 돕는다.
Chrome(또는 Edge) 개발자 도구를 이용해 Lighthouse를 사용할 수 있다.
F12 개발자 도구 → Lighthouse 탭페이지 로드 분석(Analyze Page Load)내 벨로그를 털어보자 ..!

분석을 누르고 약간의 시간이 지나고 나면 결과를 볼 수 있다.
힘 좀 내봐요 벨로그씨 ...
