동적 페이지로 구성된 Naver cafe의 게시물 내 데이터들(제목, 작성자, 작성 일시, 본문 등)을 추출하여 모으기 위한 작업을 정리한 포스트입니다.
동적 페이지로 구성된 Naver cafe의 게시물 내 데이터들(제목, 작성자, 작성 일시, 본문 등)을 추출하여 모으기 위한 작업을 정리한 포스트입니다.
이 포스트는 '구름'에서 진행하는 KDT 프로그램인 'AI 자연어처리 전문가 양성 과정'의 프로젝트 과정에서 수행했던 Whisper의 한국어 음성 통화 ASR 작업용 파인튜닝 과정 및 코드를 기록한 포스트입니다.