gaon project 일지#4

HyunJunSon·2025년 11월 5일

NIPA-ORACLE

목록 보기
28/28

1. 화자분할 라이브러리 테스트

라이브러리 URL

  • 위코드를 현 프로젝트 상황에 맞게 셋팅해 테스트함

# 발화자 구분 옵션
diarization_config = speech.SpeakerDiarizationConfig(
    enable_speaker_diarization=True,
    min_speaker_count=2,
    max_speaker_count=3,
)

config = speech.RecognitionConfig(
    encoding=speech.RecognitionConfig.AudioEncoding.MP3,  # MP3 파일일 경우
    sample_rate_hertz=44100, # 보통 mp3는 44100
    language_code="ko-KR", # 한국어 코드
    diarization_config=diarization_config,
    enable_automatic_punctuation=True  # 문장부호 자동추가
)
  • 주요옵션 위와같음
  • 문제는 결과가 발화자가 1명으로 나옴
word: '최근에', speaker_tag: 1
word: '건강한지', speaker_tag: 1
word: '아니면', speaker_tag: 1
word: '아픈', speaker_tag: 1
word: '곳이', speaker_tag: 1
word: '있었는지요', speaker_tag: 1
word: '이야기', speaker_tag: 1
word: '해', speaker_tag: 1
word: '줄래요', speaker_tag: 1
word: '앞으로', speaker_tag: 1
word: '나오세요', speaker_tag: 1
word: '최근에', speaker_tag: 1
word: '다친', speaker_tag: 1
word: '적', speaker_tag: 1
word: '있어요', speaker_tag: 1
word: '네', speaker_tag: 1
profile
즐겁게 공부하고 사람들에게 도움을 주는 개발자가 되고 싶습니다.

0개의 댓글