1. 화자분할 라이브러리 테스트
라이브러리 URL
- 위코드를 현 프로젝트 상황에 맞게 셋팅해 테스트함
# 발화자 구분 옵션
diarization_config = speech.SpeakerDiarizationConfig(
enable_speaker_diarization=True,
min_speaker_count=2,
max_speaker_count=3,
)
config = speech.RecognitionConfig(
encoding=speech.RecognitionConfig.AudioEncoding.MP3, # MP3 파일일 경우
sample_rate_hertz=44100, # 보통 mp3는 44100
language_code="ko-KR", # 한국어 코드
diarization_config=diarization_config,
enable_automatic_punctuation=True # 문장부호 자동추가
)
- 주요옵션 위와같음
- 문제는 결과가 발화자가 1명으로 나옴
word: '최근에', speaker_tag: 1
word: '건강한지', speaker_tag: 1
word: '아니면', speaker_tag: 1
word: '아픈', speaker_tag: 1
word: '곳이', speaker_tag: 1
word: '있었는지요', speaker_tag: 1
word: '이야기', speaker_tag: 1
word: '해', speaker_tag: 1
word: '줄래요', speaker_tag: 1
word: '앞으로', speaker_tag: 1
word: '나오세요', speaker_tag: 1
word: '최근에', speaker_tag: 1
word: '다친', speaker_tag: 1
word: '적', speaker_tag: 1
word: '있어요', speaker_tag: 1
word: '네', speaker_tag: 1