LLM실습(1): 음성봇 제작

Ohback·2025년 3월 8일

[OpenAI API 활용한 나만의 봇 제작]

수업시간 중 OpenAI API를 활용하여 나만의 음성봇을 제작하는 시간을 가졌다.
이런 실습 너무 재밌다!

조건은 whisper를 사용하여 음성으로 인풋을 입력 받고 프롬프트 엔지니어링을 통해 내가 원하는 스타일로 설계하여 gpt 모델로 인풋에 대한 응답을 출력하고 또한 이전 대화를 기억하고 응답할 수 있도록 하는 것이었는데 나는 음성 인식이 안되는 에러와 싸우다보니 시간이 부족해 프롬프트 설계도 제대로 하지 못하고 여러모로 아쉬움이 많이 남았지만 재밌는 실습이었다.

내가 만든 음성봇에 대해 설명해보자면, 우선 나는 모델을 여러가지 사용하기보단 같은 모델을 사용했을 때 프롬프트에 따라 응답이 어떻게 다르게 나올지가 궁금하여 아래와 같이 세가지 버전의 페르소나를 만들었다.

아래는 스트림릿으로 구현한 화면으로 보시다시피 위 코드로 만들어놓은 3가지 버전의 스타일 중 선택할 수 있도록 했고, 버튼을 클릭하여 음성을 녹음하고 텍스트로 변환하여 아래 대화기록 부분에 출력해줄 수 있게끔 만들어놓았다. 또, 질문에 따른 gpt의 응답 역시 대화기록에 함께 출력된다.

아래 사진 두 장은 청개구리AI와 철학자AI의 응답을 비교해놓은 것으로 간단한 프롬프트만으로도 다른 말투를 사용하는 AI가 생성되었음을 비교해 볼 수 있다.

[트러블 슈팅]

위에서 언급했던 음성 인식 에러에 대해 설명하자면,
from streamlit_audiorecorder import st_audiorecorder 이 부분이 문제의 코드였는데, 정상적으로 install을 마쳤으나 패키지를 import 해올 수 없었다. 반 친구들 중 누구는 되고 누구는 나와 같은 에러를 겪고 있는 것을 보았을 때 버전끼리의 충돌로 추정된다. 삭제와 reinstall, upgrade 등을 시도해보아도 해결이 안되어서 from audio_recorder_streamlit import audio_recorder로 바꾸니 깔끔하게 해결되었다. gpt에게 물어보니 후자가 최신 버전이라고!

profile
기록은 기억을 지배한다.

0개의 댓글