서비스 출시가 점점 다가오면서 챗봇에 대한 기능은 거의 다 구현했지만,이 기능을 과연 서버가 버텨줄까 하는 의구심이 들었고,출시 경험이 있는 대표님께서도 부하테스트의 중요성을 강조하셔서 부하테스트를 하기로했다.부하 테스트는 결국 API 요청을 많이 보내는 것이고, 그
인공지능 기능들이 구현이 완료된 상태에서 부하 테스트를 진행했고,현재 한 서버에 여러 컨테이너로 분리된 서비스들을 각각의 서버로 분리해야할 필요성을 느꼈다, (마이크로서비스 아키텍쳐를 구현해야했다.)실제 서비스에서도 끊김없이 서비스가 유저되어야했다. 일전에 Locus
gunicorn 에러 로깅 설정
우리 챗봇 서비스는 생성 AI를 사용하여 응답을 제공한다.ChatGPT와 HyperClova를 사용한다.부하 테스트를 하는 도중 네이버 HyperClova에 Request를 보냈을때초당 4개가 넘으면 "Too many request" 에러가 발생되었다.현재 테스트앱말고
ChatGPT를 사용하다 보면 가끔 답변을 안하는 경우가 있다.이럴때 보통 Timeout Error가 발생하는데 이 에러는 클라이언트 측에서 어떻게 할 방법이 없다.하지만 OpenAI 공식사이트에서 이를 예방하는 방법을 적어두어 공유해보고자 한다.속도 제한 오류를 방지
어느 정도 기술 개발이 완료된 상태에서 기본적인 보안 설정을 하는 방법에 대해 알아보았다.공공 API를 사용하다 보면, Key를 같이 넣어줘야하는 경우가 종종있는데, 비슷하게 구현하고자한다.원래는 시크릿(복호화)키를 같이 놓고 일정 주기마다 갱신을하면서, 세션을 유지하