
새로운 API를 구현할 때마다 항상 같은 고민을 한다.
"정상 케이스는 작성했는데, 예외 케이스는? 경계값은?" "펫 ID가 비어있는 경우, 잘못된 형식인 경우, 존재하지 않는 ID인 경우... 패턴이 너무 많다"
펫 검색 API, 펫 등록 API, 재고 관리 API... 기능이 늘어날 때마다 테스트 케이스도 함께 증가한다. 솔직히 이 작업이 가장 번거롭다고 느꼈다.
그러던 중 Apidog에 AI 기능이 추가되었다는 소식을 접했다. "테스트 케이스를 자동으로 생성할 수 있다"고 한다. 지금까지 수동으로 작성하던 작업을 얼마나 효율화할 수 있을지 직접 테스트해보기로 했다.
결론부터 말하자면, 이건 쓸만하다. 완벽하지는 않지만 확실히 작업 시간이 줄어들었다.
먼저 평소 느꼈던 문제점들을 정리해보자.
완전성 확보가 어렵다
정상 케이스는 작성할 수 있어도, 예외 케이스나 경계값을 모두 커버하려고 하면 누락이 발생한다. 특히 여러 파라미터가 얽혀있는 경우, 조합 패턴을 생각하는 것만으로도 지친다.
사양 변경 대응이 번거롭다
API 사양이 변경될 때마다 테스트 케이스도 전부 재검토해야 한다. 어디를 수정해야 하는지 찾는 것만으로도 시간이 소요된다.
팀 내 작성 방식이 제각각이다
A는 상세하게 작성하지만, B는 최소한만 작성한다. 리뷰할 때 "이 정도면 충분한가?"라고 고민하는 경우가 많다.
예외 케이스를 미루게 된다
정상 케이스를 작성하고 만족해버려서, 예외 케이스는 "나중에 작성하자"고 생각한 채 잊어버린다. 그리고 프로덕션에서 버그가 발견되는 악순환이 반복된다.
이런 문제들을 안고 매번 테스트 케이스를 작성해왔다.

API 정의를 작성한 후 "test case" 탭을 연다. 화면 중앙에 "Generate with AI" 버튼이 있으니 클릭하기만 하면 된다.
다음 화면에서 생성하고 싶은 테스트 타입을 선택할 수 있다:

처음에는 전부 선택해서 일괄 생성해봤다.
몇 초 기다리면 테스트 케이스가 쭉 표시된다.

이번에는 펫샵 데모 프로젝트에서 "펫 ID로 검색하는 API"를 예시로 테스트해봤다:
정상 케이스
예외 케이스
경계값
보안
' OR '1'='1 등)솔직히 "여기까지 생각해주다니"라고 놀랐다. 특히 경계값이나 보안 패턴은 수동으로 작성하면 누락하기 쉬운 부분이라 도움이 된다.
※스크린샷: 생성된 테스트 케이스 목록
생성된 테스트 케이스는 그대로 사용할 수 있는 것도 있고, 수정이 필요한 것도 있다.

각 테스트 케이스에는 "Accept" "Discard" 버튼이 있어서 내용을 확인하면서 선택할 수 있다.
참고로 생성 수는 자동 모드와 수동 모드가 있다:
자동 생성을 선택했더니 21개의 테스트 케이스가 생성되었다. 내용을 확인하면서 선택했다:
최종적으로 생성된 21개 중 16개를 채택하고, 5개는 삭제 또는 수정했다.
중요한 것은 자신의 비즈니스 로직에 맞춰 선별하는 것이다. AI가 생성한 케이스를 그대로 사용하는 것이 아니라 필요한 것만 채택한다.
Apidog 자체는 AI 모델을 제공하지 않는다. OpenAI나 Claude 등의 API 키를 직접 설정해야 한다.
설정 방법:
1. Apidog 설정 화면 열기
2. "Enable AI Features" 버튼을 ON으로 전환
3. "Add Provider" 클릭
4. 원하는 LLM 모델(OpenAI, Claude, Gemini 등)을 선택하고 API 키 입력 
AI 기능은 초기 상태에서 꺼져 있다. 처음 사용하는 경우 설정 화면에서 활성화해야 한다.
나는 Claude Sonnet 4를 사용하고 있지만, GPT-4도 문제없이 작동한다.
여기가 중요한 포인트다.
고성능 모델을 사용하면 실무에 가까운 테스트 케이스가 생성된다. 반대로 성능이 낮은 모델을 사용하면 엉뚱한 케이스가 늘어난다.
내 경험으로는:
비용과 정확도의 균형을 고려해서 모델을 선택하는 것이 좋다.
AI가 만들어주는 것은 어디까지나 초안이다. 그대로 프로덕션에 사용하는 것은 위험하다.
특히 비즈니스 로직에 의존하는 부분은 AI만으로는 판단할 수 없다. 예를 들어:
이런 사양은 사람이 리뷰해서 추가·수정해야 한다.
수동으로 작성하면 1시간 걸리는 작업이 AI를 사용하면 15분에 끝난다.
특히 프로젝트 초기나 대규모 사양 변경 시에는 이 차이가 크다.
내 경우 주당 5~6시간을 테스트 케이스 작성에 사용했는데, AI를 도입한 후 2~3시간으로 줄었다. 남은 시간으로 핵심 로직 테스트를 더 탄탄하게 할 수 있게 되었다.
이전에는 사람마다 테스트 케이스의 세밀도가 제각각이었다.
AI를 사용하면 최소한의 베이스라인이 확보된다. 거기서 각자 필요에 따라 추가·수정하므로 전체적인 품질이 상향 평준화되었다.
신입 엔지니어에게도 "어떤 테스트 케이스를 작성해야 하는가"의 참고가 된다.
최종적으로 이런 사용법으로 정착했다:
1. AI로 초안 생성
프로젝트 초기나 대규모 변경 시 먼저 AI로 일괄 생성한다.
2. 리뷰와 조정
생성된 케이스를 확인하고 채택·삭제·수정을 판단한다.
3. 수동으로 보완
비즈니스 로직에 의존하는 부분이나 중요한 경로는 수동으로 추가한다.
4. CI/CD에 통합
확정된 테스트 케이스를 CI/CD 파이프라인에 통합해 지속적으로 실행한다.
5. 정기적으로 재검토
사양 변경이 있으면 AI로 재생성해서 차이를 확인한다.
이 플로우로 바꾼 후 테스트 케이스 작성과 유지보수가 훨씬 편해졌다.
이번에 Apidog의 AI 기능을 사용해보고 가장 느낀 점은 "AI에게 전부 맡기는 것이 아니라 협력자로 사용한다"는 것이다.
AI가 초안을 만들어주기 때문에 나는 사양이나 비즈니스 로직 확인에 집중할 수 있다. 결과적으로 테스트 품질과 작업 속도 모두 향상되었다.
완벽한 도구는 아니지만 확실히 개발 효율은 올라간다.
특히 이런 사람들에게는 시도해볼 가치가 있다:
한 번 AI로 생성해서 자신의 API에서 얼마나 효율화할 수 있는지 테스트해보길 바란다.
이 글이 도움이 되었다면 공유해주세요.
질문이나 의견이 있으면 편하게 남겨주세요.