
실시간 기반의 프로젝트 웹게임 서버를 운영하면서“사용자가 입력하는 텍스트를 어떻게 안전하게 관리할 것인가?”이 문제는 항상 가장 복잡한 기술적 난제 중 하나였다.한국어에서는 욕설 변형이 너무 자유롭다.숫자, 특수문자, 자모 분리, 무의미한 반복, 의도적 오타까지…기존의

MalJosim은 RAG(Retrieval-Augmented Generation)와 LLM을 활용한 욕설 필터링 API 서비스입니다.단순 키워드 매칭을 넘어서 컨텍스트를 이해하고 더 정확한 필터링을 제공하는 것이 목표입니다.프레임워크: NestJS 10.x데이터베이스:

욕설 필터링 시스템을 구축할 때 가장 큰 고민은 비용과 정확도의 균형입니다.만약 모든 요청에 AI를 사용한다면:비용이 너무 높음 (OpenAI API 호출 비용)응답 시간 증가 (AI 호출은 수백 ms 소요)확장성 문제 (트래픽 증가 시 비용 폭증)하지만 AI 없이 사
금칙어 필터링 시스템을 개발하면서 성능 문제에 직면했습니다. 초기에는 Sliding Window 방식으로 후보 단어를 추출하고 Redis에서 매칭을 확인했는데, 네트워크 I/O가 많아 응답 시간이 느려졌습니다. 이를 해결하기 위해 Trie 데이터 구조를 도입하여 성능을