스터디 디스코드 봇 (2) - BOJ 문제 검색

Jeuk Oh·2021년 9월 5일

스터디용 디스코드 봇 개발과정

목록 보기

2/4

디스코드 서버 내 스터디 관리용으로 개발하는 간단한 토이 프로젝트입니다.

추가 된 기능

BOJ 문제 검색 (난이도, 알고리즘 분류)

BOJ 문제 검색 기능

아이디어

매 주 스터디를 위한 문제를 선정해야할 때, 직접 고르기도 귀찮고 스터디원들과 문제를 공유할 때 디스코드 게시판에 url를 난사하게 되면 보기 매우 지저분하다는 문제가 있었습니다.

봇을 이용해서 깔끔하게 문제를 정리해줍시다.
solved.ac에 이미 훌륭한 BOJ 검색 엔진이 구현되어있습니다. 당장은 solved.ac에 query를 넣고 가져와서 이쁘게 보여주는 쪽으로 구현하였습니다.

구현

1. crawler.py

solved.ac에 가서 이리저리 검색기능을 써보고 사이트도 개발자 도구로 확인해보며 대충 구조를 파악합니다.

모든 검색 기능을 쓰는 것은 포기하고, 단일 tier와 단일 tag 하나에 대해서만 검색하도록 하겠습니다. 크롤러 인풋으로 tier와 tag에 대한 스트링이 오면 적절하게 url을 만들어서 requests로 긁어오도록 하였습니다. url 마지막에 sort=random을 더해 무작위 문제가 나오도록 하겠습니다.

개발자 분이 봇 차단을 잘 해놓셨는지 요청이 잦을 시 요청 결과가 비어서 옵니다. 원활한 사용을 위해서 백준 사이트를 db화 하는 것으로 리펙토링할 생각을 해야할 것 같습니다.

일단 급하게 쓸 것이니 flag로 결과가 왔는지 안왔는지 구분합니다.

import requests
from bs4 import BeautifulSoup
import re

def BOJCrawler(args:dict):
	...
    ret = []
    h = re.compile('[가-힣]+')
    if Object:
        flag = url
        for item in Object[1:]:
            rank = #문제난이도
            num =  #문제넘버
            name = #문제이름
            link = #문제링크
            if h.search(name):
                ret.append([rank,num,name,link])
    else:
        flag = False
        ret = url
    return ret, flag

정규식을 사용해서 문제 제목에 한글이 있는 경우에만 ret에 담읍시다. 응답이 비어서 왔다면 ret으로 url만 넘깁니다.

2. main.py

main에서 args를 받으면 크롤러로 넘겨주어 데이터를 받고, discord에 전송해줍니다. 데이터가 오지 않았다면, url이라도 보여줍시다.


from utils.crawler import *
from utils.embed import *

@client.command(
    name="BOJ",
    brief = "난이도 태그(math, .. , backtraking, bfs, dfs ..)"
                )
async def reprBOJ(ctx,*args):
    input_args = {'tier':args[0],'tag':args[1]}
    data, flag = BOJCrawler(input_args)
    await ctx.send(embed=embed_print_BOJ(input_args,data,flag))

데이터가 잘 왔을 시 이쁘게 보여줄 embed 함수를 만듭니다.

3. embed.py

def embed_print_BOJ(query,data,flag):
    title = f'(난이도:{query["tier"]}, 분류:{query["tag"]})'
    embed = Embed(title="추천 문제" + title, url=flag or data, color=0x00ff00)
    if flag:
        rank_text = '\n'.join(f'{x[0]}' for x in data[:10])
        number_text = '\n'.join(f'[{x[1]}]({x[3]})' for x in data[:10])
        name_text = '\n'.join(f'[{x[2]}]({x[3]})' for x in data[:10])

        embed.add_field(name="Rank", value=rank_text, inline=True)
        embed.add_field(name="Numbers", value=number_text, inline=True)
        embed.add_field(name="Name", value=name_text, inline=True)
    else:
        embed.add_field(name="요청이 잦습니다", value="링크에서 확인하세요 ㅜ")
    return embed