[Python] User_agents 라이브러리로 웹 정보 파싱하기

Gi Woon Lee·2024년 10월 14일

Final Project

목록 보기
4/6

TIL: Parsing User Agent Strings with the user_agents Library

user_agents 라이브러리는 웹 브라우저의 user-agent 문자열을 파싱하여 장치, 브라우저, 운영 체제 정보를 추출할 수 있는 라이브러리입니다. 웹에서 접속하는 장치 및 브라우저에 대한 정보를 분석할 때 매우 유용합니다.

User-Agent 문자열이란?

  • User-Agent 문자열은 웹 브라우저 또는 장치가 서버에 요청을 보낼 때 자신에 대한 정보를 담고 있는 문자열입니다.
  • 이 문자열에는 장치(device), 브라우저(browser), 운영 체제(os) 정보가 포함되어 있습니다.

parse 함수

  • parse 함수는 user-agent 문자열을 받아서, 장치, 브라우저, 운영 체제 정보를 각각 파싱할 수 있는 객체로 변환합니다.
  • 변환된 객체는 device, browser, os의 속성들을 통해 각각의 정보를 추출할 수 있습니다.

주요 속성

  • device: 장치 정보를 반환합니다. 예를 들어, 어떤 종류의 기기(모바일, 태블릿, 데스크톱 등)를 사용 중인지 확인할 수 있습니다.
  • browser: 브라우저 정보를 반환합니다. 브라우저의 이름과 버전을 파악할 수 있습니다.
  • os: 운영 체제 정보를 반환합니다. 사용 중인 운영 체제와 그 버전을 알려줍니다.

예시 코드

from user_agents import parse

# 사용자 에이전트 문자열 정의
user_agent_string = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36"

# parse 함수를 사용하여 user-agent 문자열을 파싱
user_agent = parse(user_agent_string)

# device 정보를 출력
print(user_agent.device)
  • 위 코드는 데스크톱 장치에 대한 정보를 반환합니다.
  • 반환 값은 Device(family='Other', brand=None, model=None)로, 데스크톱 장치임을 나타냅니다.

요약

  • user_agents 라이브러리는 user-agent 문자열을 손쉽게 파싱하여 장치, 브라우저, 운영 체제 정보를 추출하는 데 유용합니다.
  • 이를 통해 사용자의 접속 환경을 분석하거나 맞춤형 사용자 경험을 제공할 수 있습니다.

0개의 댓글