
안녕하세요, 메디테크 스타트업 인티그레이션에서 데이터 엔지니어로 근무하고 있는 류중경입니다. 오늘은 저희 회사에서 개발 중인 의료 Q&A 챗봇 서비스 프로젝트에 대해 소개드리고자 합니다.
본 프로젝트는 내부적으로 ‘F.R.I.D.A.Y.’(이하 FRIDAY)라는 코드명으로 불리고 있으며, 이는 마블 코믹스의 아이언맨 캐릭터, 토니 스타크의 AI 비서 ‘자비스’의 후속 버전에서 영감을 얻은 명칭입니다. 이번 프로젝트를 통해 인티그레이션이 운영 중인 치과 의료 플랫폼 ‘데니어’의 서비스가 어떻게 확장되고 발전하고 있는지 말씀드리겠습니다.
데니어(DENEER)는 치의학(DENtistry)과 선구자(PioNEER)의 합성어로, 글자 그대로 치과 의료 시장의 혁신과 성장을 위해 새로운 영역을 개척하는 선구자 역할을 자임하는 팀입니다. 인티그레이션의 미션처럼 치과 의료인과 종사자들이 진료에만 온전히 집중할 수 있는 환경을 만들어, 궁극적으로 의료 서비스의 질을 높이고 사람들의 건강한 삶에 기여하려고 여러가지 노력을 기울이고 있습니다.
저희는 전국 치과의사와 치대생의 53%가 가입한 대규모 커뮤니티 서비스인 모어덴(moreDEN)을 운영하고 있습니다. 이 커뮤니티 플랫폼을 통해 치과 의료인들간의 유용한 정보를 나누고, 네트워킹과 소통의 장 역할을 맡고 있으며, 구인/구직, 커머스, 온라인 클래스 등 다양한 서비스를 제공하고 있습니다.

모어덴에는 현직 치과의사분들이 공유해준 3만 여개의 Q&A 임상 데이터가 축적되어 있습니다. 이 데이터는 단순한 질문과 답변의 모음이 아닙니다. 임상 의료진들의 노하우 공유, 치과의료진 동료들의 추천, 커뮤니티 운영자의 꼼꼼한 관리를 통해 정제된 귀중한 지식의 보고입니다. 이런 고품질의 데이터야말로 치과 의료를 혁식하는 서비스를 만드는 원동력이 되고 있습니다.
저희는 최근 주목받는 AI기술을 활용하여 이러한 지식을 보다 쉽고 적극적으로 활용할 수 있는 AI 비서를 의료진에게 제공하고 싶었습니다.

이제 본격적으로 기술적인 이야기를 해보겠습니다. 모어덴에 축적된 풍부한 Q&A 데이터를 바탕으로 언제든지 물어볼 수 있는, 마치 경험 많은 선배가 곁에서 조언해 주는 것과 같은 느낌을 줄 수 있는 치과 의료 Q&A 챗봇을 만들고자 했습니다. 단순 검색엔진은 키워드의 존재 여부를 기반으로 응답하고, 생성형 AI를 사용하면 할루시네이션, 즉 창작된 정보가 만들어지는 부작용이 있습니다. 이러한 문제를 해결하기 위하여 RAG 시스템을 구현하기로 결정하였고, Amazon Bedrock서비스를 활용하기로 결정하였습니다. 아마존 베드락 서비스를 선택한 이유는 다음과 같습니다.

Q&A챗봇에서 정확한 정보를 제공하기 위하여 Retrieval-Augmented Generation(RAG) 시스템을 구현하였습니다. RAG 시스템의 핵심은 효과적인 정보 검색과 그에 기반한 답변 생성에 있습니다. 이를 위해 다음과 같은 전략에 따라 시스템을 구축했습니다.
데이터 전처리:
계층적 청킹(hierarchical chunking) 기법을 사용하여 데이터를 분할했습니다. 단순 질의 응답 뿐만 아니라 의료진들이 함께 평가한 상위 우수 답변이 데이터에 포함되도록 전처리 과정을 거쳤습니다.
검색 최적화:
검색할 때에는 작은 크기의 청크를 사용하여 정확한 검색 결과를 얻도록 하였고, 답변을 생성할 때에는 보다 큰 크기의 청크를 사용하여 풍부한
맥락 정보를 제공하였습니다.
프롬프트 전략:
응답의 정확성을 높이기 위하여 적절한 역할을 부여하고, 지시 기반의 프롬프팅 기법과 추가 맥락을 설정함으로써 보다 정확하면서도 상황에 맞는 답변을 유도하였습니다.
질의 재작성:
사용자의 질문을 분석하여 핵심 키워드를 추출하고, 이를 바탕으로 사용자의 의도를 반영한 검색 질의를 작성하였습니다. 이를 통해 Q&A 데이터 뿐 만 아니라 관련 논문도 찾아보게 함으로써 답변의 품질을 높였습니다.
세션 비유지 전략:
각 질문을 독립적으로 처리하여 시스템의 복잡도를 낮추고 확장성을 높였습니다. 이를 통해 항상 최신 정보를 바탕으로 일관성 있는 답변을 제공할 수 있게 되었습니다.

우리가 보유한 Q&A 데이터 외에도 관련 논문을 활용하여 보다 깊이있는 정보를 제공하였습니다. 질문에 관련된 논문 정보를 제공하기 위하여 PDF 압축, 요약, 키워드 추출 기능을 사용했습니다.
PDF 압축: Ghostscript를 사용하여 대부분의 논문 PDF를 5MB 이하로 압축했습니다.
요약: 치과 분야의 전문성을 유지하면서도 검색에 최적화된 형태로 쿼리를 재작성했습니다. 구조화된 출력 형식을 사용하여 일관성 있는 요약을 생성 했습니다.
키워드 추출: 학술적 가치와 검색 효율성을 모두 고려한 키워드를 추출했습니다. 추출된 키워드를 이용해 유사한 논문들을 추천하는 기능도 구현했습 니다

우리의 시스템은 Amazon Bedrock을 중심으로 다양한 AWS 서비스들이 유기적으로 연결되어 있습니다.
OpenSearch: 검색 엔진 및 벡터 DB 역할
ECS: 컨테이너 오케스트레이션
Lambda: 서버리스 함수 실행
S3: 객체 스토리지
API Gateway: API 관리 및 보안
DynamoDB: NoSQL 데이터베이스
CloudFront: 콘텐츠 전송 네트워크(CDN)
이러한 서비스들을 조합하여 확장이 용이하면서도 안정적인 시스템을 구축할 수 있었습니다.


본 서비스에 앞서 실제 사용자들의 피드백을 받기 위해 클로즈드 베타 서비스를 운영해보았습니다. 많은 치과 의사분들께서 체험단에 신청하여 사용해 보셨고, 기존의 지식을 잘 활용할 수 있는 도구가 나온다는데 대해 많은 환영과 관심을 보여주셨습니다.

물론 우리 시스템에도 아직 개선의 여지가 있습니다. 가장 큰 과제는 답변 검증의 어려움입니다. 의료 정보의 특성상 전문가의 확인이 필수적인데, 이를 자동화하는 것은 아직 쉽지 않습니다. 사내 치과의사분들의 도움을 받아 실제 답변 내용을 검증해 가면서 프롬프트의 정확도를 높였습니다.
앞으로 다음과 같은 방향으로 시스템을 개선해 나갈 계획입니다:
멀티모달 기능 추가: 텍스트뿐만 아니라 이미지도 이해하고, 적절한 임상 데이터를 제시해 줄 수 있는 통합 시스템을 목표로 하고 있습니다.
개인화된 논문 관리 기능: 사용자별로 맞춤형 논문 추천 및 관리 기능을 추가하여 지식 학습의 유용성을 높이려 합니다.
한의학 도메인 확장: 치과 시스템의 노하우를 바탕으로 한의학 분야로도 적용 범위를 넓혀갈 계획입니다.

FRIDAY 프로젝트를 통해 우리는 AI 기술의 현재 상태와 미래의 발전 가능성을 동시에 확인할 수 있었습니다. 아직 해결해야 할 과제가 많지만, 한 걸음씩 꾸준히 나아가다 보면 궁극적으로 혁신적인 의료 AI 시스템을 구축할 수 있을 것이라 확신합니다.
데니어는 단순히 기술 개발에 머무르지 않습니다. 우리의 궁극적인 목표는 치과 의료 전문가들이 진료에 더욱 집중할 수 있도록 지원함으로써, 결과적으로 모든 환자들이 더 나은 의료 서비스를 받을 수 있게 하는 것입니다. 이번 AI 챗봇 프로젝트는 그 목표를 향한 중요한 진전이라고 생각합니다. 우리는 치과 의료 시장에서 게임 체인저가 되기 위해, 기술 혁신을 통해 의료 서비스의 품질을 높이고, 더 나아가 사람들의 건강한 삶에 기여하기 위한 도전을 지속할 것입니다.
감사합니다.