XDAC: XAI-Driven Detection and Attribution of LLM-Generated News Comments in Korean
논문 원본
보도자료: 한국어 'AI 생성 댓글' 탐지 기술 개발
- KAIST 전기및전자공학부 김용대 교수 연구팀이 국가보안기술연구소(국보연)와 협력해, 한국어 AI 생성 댓글을 탐지하는 기술 'XDAC'를 세계 최초로 개발했다고 밝힘
- 생성형 AI 기술의 발전 → 이를 악용한 온라인 여론 조작 우려 증가 → 이에 따른 AI 생성글 탐지 기술 개발
- 기존의 기술은 대부분 영어로 된 장문의 정형화된 글을 기반으로 함
- 짧고(평균 51자), 구어체 표현이 많은 한국어 뉴스 댓글에는 적용이 어려웠음
- 연구진은 아래 네 가지 전략을 적용한 AI 댓글 생성 프레임워크를 개발해, 실제 이용자 스타일을 모방한 한국어 AI 생성 댓글 데이터셋을 구축했다고 함
- 14종의 다양한 LLM 활용
- 자연스러움 강화
- 세밀한 감정 제어
- 참조자료를 통한 증강 생성

- 설명 가능한 AI(XAI) 기법을 적용해 언어 표현을 정밀 분석한 결과, AI 생성 댓글에는 사람과 다른 고유한 말투 패턴이 있음을 확인
- AI
- "것 같다", "에 대해" 등 형식적 표현
- 높은 접속어 사용률
- 전 세계적으로 통용되는 표준화된 이모지를 주로 사용
- 사람
- 반복 문자(ㅋㅋㅋㅋ), 감정 표현, 줄바꿈, 특수기호 등 자유로운 구어체 표현을 즐겨 사용
- 한국어 자음(ㅋ, ㅠ, ㅜ 등)이나 특수 기호(ㆍ, ♡, ★, • 등) 등 문화적 특수성이 담긴 다양한 문자를 활용
- XDAC는 이러한 차이를 정교하게 반영해 탐지 성능을 높였다고 함
- 줄바꿈, 공백 등 서식 문자를 변환하고, 반복 문자 패턴을 기계가 이해할 수 있도록 변환하는 방식 적용
- 각 LLM의 고유 말투 특징을 파악해 어떤 AI 모델이 댓글을 생성했는지도 식별 가능하게 설계
