TextRazor 분류기 종류

이창영·2024년 7월 12일

TextRazor docs

import textrazor

textrazor.api_key = "API_KEY_GOES_HERE"

client = textrazor.TextRazor(extractors=["entities", "topics"])
response = client.analyze_url("http://www.bbc.co.uk/news/uk-politics-18640916")

for entity in response.entities():
    print(entity.id, entity.relevance_score, entity.confidence_score, entity.freebase_types)

# classifiers 선언해줄려면
tr_client.set_classifiers(["textrazor_mediatopics_2023Q1"])
  • textrazor_iab_content_taxonomy_3.0
    • IAB Content Taxonomy v3.0: 2022년에 업데이트된 최신 IAB Content Taxonomy입니다.
  • textrazor_iab_content_taxonomy_2.2
    • IAB Content Taxonomy v2.2: 이전 버전의 IAB Content Taxonomy입니다.
  • textrazor_iab_content_taxonomy
    • IAB Content Taxonomy v2: 2017년에 업데이트된 IAB QAG 세그먼트입니다.
  • textrazor_iabLegacy
    • IAB QAG 세그먼트의 구 버전입니다.
  • textrazor_mediatopics_2023Q1
    • IPTC Media Topics: 최신 버전 (2023년 3월)으로, 텍스트에 중점을 둔 IPTC의 1100개 용어 분류입니다.
  • textrazor_mediatopics
    • IPTC Media Topics: 2017년 버전의 IPTC Media Topic 분류입니다.
  • extrazor_newscodes
    • 구 버전의 IPTC NewsCodes입니다.
  • ustom classifier name
    • Classifier Manager 인터페이스를 통해 이전에 생성한 사용자 정의 분류기입니다.

챗지피티에게 물어보니 2023년 버전인 textrazor_mediatopics_2023Q1을 추천한다고함.

가장 최신버전이라서 그렇다고함.

profile
AI개발자를 꿈꾸는 개발자 이창영 입니다.

0개의 댓글