기획 2

벼리·2025년 3월 17일

6

먼저 프로젝트 개요가 실현 가능한지 검토

  1. 키워드 추출
    트렌드 키워드를 추출하기 위해서는 대한민국 사람들이 자주 이용하는 검색엔진 및 SNS 사이트를 이용해야 합니다.

  • 인터넷 트렌드 사이트에서 2025/01/01부터 2025/03/15까지 국내 이용자의 포털 사이트 이용률을 나타낸 표입니다. 네이버, 구글, 빙, 다음 순으로 점유율이 높습니다.
  • 여기에 포털 사이트는 아니지만 이에 준하는 역할을 수행하는 유튜브와, X(트위터), 인스타그램, 쓰레드 등의 SNS도 포함하면 더 신뢰할 수 있는 키워드를 추출할 수 있겠다고 생각했습니다.
  • 다만, 다양한 사이트를 모두 한번에 추가하기보다는 먼저 가장 점유율이 높은 사이트를 우선적으로 시범 운영을 해볼 필요가 있습니다. 그렇기 때문에 검색 엔진 분야와 SNS 분야에서 모두 점유율이 높은 네이버의 키워드를 추출해보고, 필요하다면 DAUM이나 유튜브 등으로 확장하기로 했습니다.
  • 네이버는 데이터랩 API로 키워드 데이터를 전송받을 수 있을 것으로 보입니다. 하지만 실시간 검색어는 지원하지 않기 때문에 직접 네이버를 이용하긴 어려워 보입니다.
  • 대신 블랙키위, 썸트렌드, 키워드사운드 같은 키워드 분석 사이트가 대체로 네이버랩 API를 사용하므로 이를 이용해 트렌드 키워드를 추출하기로 함
  • 여러 키워드 분석 사이트를 돌아다니다보니, 오늘의 검색어 이 사이트가 인기 검색어 키워드를 추출하는데 괜찮아 보였음.
  • requests 패키지로 데이터 추출이 가능하다는 것을 확인함.
  • 차후에 추출한 데이터를 데이터랩과 같은 서비스를 사용하여 더 나은 키워드로 가공할 수 있을지 확인해보기로 함.
  • 빅카인드로 분야별 관심뉴스를 받아보려고 시도했지만 잘 안됐음
  • 일간 키워드 데이터의 키워드 빈도 및 단어 빈도를 csv로 저장하는 코드 추가
  1. ChatGPT
  • 무료 버전으로도 웹 검색이 가능함. 다만 종종 잘못된 기사를 퍼오거나 상관없는 사건을 갖다 붙이기도 함.
  • 어짜피 API를 사용해야 하기 때문에 유료 버전을 이용할 수 밖에 없지 않나? 다만 서드파티 서비스 중에서 무료 버전의 API를 제공하는 서비스도 있을지도 모름.
  • ChatGPT 말고 다른 여러 LLM 모델을 찾아보는 것도 필요할 듯
  • ChatGPT API를 활용하려면 선결제 5달러를 내야함.
  • ChatGPT, Claude, Gemini 중에서 고르면 될 듯
    자세히 쓰는 Gemini API
  • Gemini 챗봇 서비스를 제공하는 구글에서, Gemini Model로 여러 실험을 해볼 수 있는 AI Studio라는 서비스가 있음. Structured Prompt 내에서 Sample을 이용하면 답변의 Tone을 조절할 수 있음. (Few Shot Learning)
  • ChatGPT, Cluade, Gemini 중에서 일일 무료 할당량이 남아있는 모델의 API를 자동으로 이용하면 어떨까?
  • 클로드는 무료 버전으로 글 작성 불가능, 제미니는 가능한데 삽입된 여러 양식들(표, 목차) 등이 누락됨.
  • 5달러 (세금 포함 약 8천원) 결제 후 ChatGPT API 연결 성공
  • 글 한개 발행하는데 약 70원 비용 발생 (ChatGPT 4o-mini 기준)
  • messages Params 사용하면 지침을 매번 전달하지 않고 세션 유지 가능
  1. Prompt Engineering
  • 업데이트 대혁명, 자동 블로그 글 이정도까지 나옵니다.(feat. 쏘넷 3.7,GPT 4.5)
  • 위 영상의 프롬프트를 일단 갖다 쓰기로 함
  • 블로그 글을 높은 품질로 자동으로 글을 써주기 때문
  • 5개의 txt 파일이 있고, 각 파일은 LLM 모델이 어떤 방식으로 글을 써야 하는지를 지시하는 지침임.
    • 블로그 작성 AI 엄격한 순차 실행 5단계 프로세스 지침 (blog_five_process로 명칭 변경)
    • blog_output_format
    • html_style_reference
    • natural_human_blog_writing_instruction
    • blog_style_guide
  • 일단 주어진 자료를 활용하고, 앞으로 블로그 전문가 강의를 보면서 프롬프트를 고쳐나가기로 함
  • UI가 아닌 api에 맞게 blog_five_process 수정
  • 컬러는 직접 변경하기로 함
    • #4a148c : 제목 및 소제목
    • #7b1fa2 : 제목 밑줄
    • #6a1b9a : 목차 링크, 태그
    • #333 : 기본 텍스트 색
    • linear-gradient(135deg, #f5f0ff, #f0e6ff) : 목차 Box 배경색
    • #9c27b0 : 세로선 및 테이블 헤더 색
    • #e1bee7 : 표의 테두리색
color_dict = {
    "#4a148c": "#F38C79",  #B03052 : 제목 및 소제목
    "#7b1fa2": "#FFC1B4",  #e1bee7 : 제목 밑줄색
    "#6a1b9a": "#007074",  #6a1b9a : 목차 링크, 태그
    "#333": "#333",     #333 : 기본 텍스트 색
    "linear-gradient(135deg, #f5f0ff, #f0e6ff)": "linear-gradient(135deg, #FFFFFF, #FFC1B4)",  # linear-gradient(135deg, #f5f0ff, #f0e6ff) : 목차 Box 배경색
    "#9c27b0": "#034C53",  #9c27b0 : 세로선 및 테이블 헤더 색
    "#e1bee7": "#F38C79"   #e1bee7 : 표의 테두리색
}
  • 주석은 그대로 두고 색상코드 참조해서 value를 변경해달라고 하면 됨
  1. Blog
  • 확인해보니 네이버 블로그, 티스토리 모두 블로그 작성 API 지원을 종료함
  • 구글 블로그는 아직 지원중임.
  • 구글 블로그로 해야 할지, 아니면 Selenium 같은 방식으로 우회해야 할지 고민중
  • Tistory의 post.json으로 requests 라이브러리 포스팅 가능한 것으로 확인.
  • 타이틀 및 태그 또한 자동으로 Parsing 가능
  • 카테고리도 추가 가능
  • 티스토리로 진행하기로 함. 다만, API를 지원하지 않아 카카오를 로그인하고 세션 쿠키를 매번 가져와야 하는 번거로움이 있음
  • TSSESSION과 _T_ANO 값을 매번 갱신해야 할듯
    • 쿠키 값 복사하면 자동으로 파싱하도록 수정함
  1. Google Analytics & Bigquery
  • 서치 콘솔 등록
  • 구글 애널리틱스 연결
  • 48시간 후 데이터가 잘 들어오는지 확인
  • 48시간 동안 기다릴 필요 없음. 직접 태그매니저에서 컨테이너 생성하고 head, body를 티스토리 html 편집기에 이식해야 함.
  • 빅쿼리 연결. 일일 배치 실행 후 올바르게 적재되었는지 확인함 (아침 9시에 적재하는듯?)

해야 할 일

  • 키워드 선정 로직 구성 (어제 이 키워드가 상승했으니 키워드를 토대로 글을 작성하자!)
  • GA4 이벤트 설정 (유입 채널, 스크롤 얼마나 내렸나, 등)
  • 테이블 정의서
  • 애드센스 신청
  • 글 포맷을 쉽게 바꿀 수 있는 방법
  • 카테고리 판별 프롬프트 추가 (카테고리별 글 포맷을 정해주는 것도 가능할까?)

0개의 댓글