[근황] 2022.6.2

Minguinho_zeze·2022년 6월 1일
0

근황

목록 보기
8/19

안녕하세요. 밍기뉴와제제입니다.

오랜만에 근황을 씁니다. 근데 최근글도 근황을 쓴 글이네요. 이러다가 근황만 쓰는 블로그로 변하는게 아닌가...호덜덜.

지난 근황글 이후 어떤 일이 있었냐면...

1.연구참여

우선 저의 주 관심사죠, 포항공대 하계방학 연구참여를 위한 활동을 미리 진행하고 있습니다. Audio Captioning을 딥러닝 알고리즘으로 수행하는 방식을 연구하기로 했으며 같이 프로젝트를 수행하는 대학원생 한 분과 계속해서 교류하며 프로젝트 준비를 하는 중입니다.

말 나온 김에 Audio Captioning에 대해 간단히 설명드리도록 하겠습니다. 정확히 말하면 '자동적으로' audio captioning을 한다고 해서 Automated Audio Captioning(AAC)라고 부르는 이 task는 대락적으로 아래와 같은 구조를 가진 딥러닝 기반 네트워크에서 수행됩니다.

이러한 encoder-decoder 구조가 정답은 아닌데 거의 100%의 논문이 해당 구조를 가진 네트워크를 제안합니다. 음...정답이라고 해야겠군요.

아무튼, 저는 AAC를 주제로 하는 딥러닝 관련 논문들을 보며 지식을 쌓는 중에 있습니다. 그리고 AAC를 잘하려면 Audio에서 feature를 잘 추출하는 네트워크가 필요한데, 그런 애들이 주로 있는 task가 Audio tagging, Audio recognition입니다. 그래서 여기서 나온 논문들도 보고 있습니다.

그리고 AAC에서 많이 쓰이는 encoder-decoder 구조가 어디서 나온거냐면 Image Captioning에서 나온 구조입니다. 그렇기에 Image Captioning을 수행하는 네트워크에 관한 논문도 확인하고 있습니다.

물론, 제일 많이 보는건 AAC를 주제로 하는 논문입니다. 이거만 봐도 시간이 호로록 지나가더라구요. 하루가 48시간이었으면 좋겠습니다.

여튼, 이렇게 연구참여에 관련해 많은 논문을 보며 많은 것을 공부했기에 이걸 한데 정리해서 블로그에 올리려고 했는데...양이 너무 많아서 쓰다가 지쳤습니다. 그래서 (1), (2) 등으로 n부작 컨텐츠로 갈려구요. 나눠서 쓰다보면 언젠가 완성하겠죠? 저를 믿습니다.

2.기말고사...과제..

기말이 2주 남았습니다. 시험공부를 시작해야겠습니다.

원래 이 생각을 저번주에 했거든요? 근데 점수 비중이 큰 과제가 2개 있더라구요. 그래서 그거 한다고 공부를 못했죠. 교양 과제였는데 후...공돌이인 저한테 너무 어려운 과제였습니다.


오늘의 근황글은 여기까지 쓰려고 합니다. 종강하고 쓰거나 연구참여 직전에 쓰거나 아무튼 쓸 내용이 쌓였다 싶으면 쓰고자 합니다.

다음글에서 뵙겠습니다. 다음글이 과연 근황글이 될 것인지, 아니면 AAC를 설명하는 글이 될지 궁금하네요.

profile
안녕하세요. 딥러닝 알고리즘에 관심이 많은 대학원생입니다.

0개의 댓글