캐글 대회 : TensorFlow Speech Recognition Challenge
필사 커널 : Speech representation and data exploration
import os
# 현재 디렉토리
os.getcwd()
# 디렉토리 변경
os.chdir("디렉토리 경로")
# 디렉토리 파일 확인
os.listdir()
import os.path
# path가 디렉토리이면 True, 아니면 False를 반환한다.
os.path.isdir('/Users/Desktop/temp/test.txt')
# OS의 형식에 맞게 각각의 경로들을 하나의 경로로 이어준다.
os.path.join("/Users/Desktop","Temp","test.txt")
# path의 절대경로를 반환한다. 입력받은 path에는 파일 혹은 폴더 이름이 들어온다.
os.path.abspath("temp")
# path의 기본이름을 반환한다. 입력받은 path에는 절대경로가 들어온다. (abspath와 반대되는 함수)
import os.path
os.path.basename('/Users/Desktop/temp/test.txt')
# path의 파일/디렉토리 경로를 반환한다.
import os.path
os.path.dirname('/Users/Desktop/temp/test.txt')
import pathlib
# Path 객체를 생성할 수 있다. 인수로 경로의 문자열을 지정한다. 상대경로든 절대경로든 상관없이 모두 가능하다.
pathlib.Path()
p_file = pathlib.Path('temp/file.txt')
print(p_file)
# temp/file.txt
# 고속푸리에변환(FFT, Fast Fourier Transform) 계산
from scipy.fftpack import fft
fft_vals = scipy.fft(y)
# 시그널 프로세싱 도구
from scipy import signal
# 다양한 파일을 읽고 쓰는 데에 사용됨
from scipy.io import wavfile
#
import librosa
# 오디오 파일 불러오기
librosa.load()
audio_path = 'data/1_0000_trim.wav'y, sr = librosa.load(audio_path)
# 오디오 파일 파형 시각화
import librosa.display
librosa.display.specshow()
librosa.display.specshow(log_S, sr=sr, x_axis='time', y_axis='mel')
# 주성분 분석용 함수
from sklearn.decomposition import PCA
# 주성분을 몇개로 할지 결정
pca = PCA(n_components=2)
printcipalComponents = pca.fit_transform(x)
# 주성분으로 이루어진 데이터 프레임 구성
principalDf = pd.DataFrame(data=printcipalComponents, columns = ['principal component1', 'principal component2'])