Mean pooling - 임베딩 차원 맞춰보자이

minsing-jin·2025년 5월 10일
0

ML

목록 보기
2/7

문제

Lyrics와 quantized f0된 melody를 FFT encoding을 하면 [batch size, hidden channel, time(seq_len)-> 시퀀스 Length]가 나온다.
sequence length가 다를 수도 있지 않누??

해결

mean pooling을 하세유~~

hidden channel의 각 feature마다 Mean을 때려서 seq len을 1로 맞춤 -> melody도 마찬가지

ex)

  ------hidden channel---------
김  
민
재
짜
스
  mean mean mean mean mean mean ....
 
profile
why not? 정신으로 맨땅에 헤딩하고 있는 코린이

0개의 댓글