
최근에서야 파이썬을 이용해서 웹을 크롤링하는 법을 배웠고,
그동안 종종 생각만 하던 프로젝트를 진행해보려고 한다.
그것은 바로 ..
예를 들어 묘하게 어느 해에는 드보르작 교향곡 8번을 5개 오케스트라에서 갑자기 한다던가, 그 다음에는 브람스 1번을 우후죽순 한다던가...
그리고 또 이렇게 한번 붐이 일었던 곡은 한동안 자주 나오지 않는다.
이것이 진짜일까 너무 궁금해서 아마오케 대상으로 분석해보고 싶었으나..
아마오케들의 정보를 얻는것은 쉽지 않았다.
최근들어 아마오케의 홍보수단이 페이스북에서 인스타그램으로 옮겨가느라 옛날 정보들이 사라졌고, 페이스북이라고 모든 정보들이 있는 것은 아니다.
그렇다고 아마추어 오케스트라 연합에 협조를 구하기도 애매하다. 회장단이 그거 하나하나 찾아서 알려주는거도 고생일테고 내가 무슨 권한으로?
그래서 간단하게 크롤링해올수 있을 것 같은 전문단체로 타겟을 잡았다.
내가 세운 가설을 정확히 말하자면,
클래식 연주곡에는 주기가 있고
그 주기는 대체로 아마추어 단체의 주기보다 전문단체의 주기가 약 1년정도 늦다
는 것이다.
이는 경험에서 비롯한 것이다.
예외로, 작곡가 탄생 nn0주년이나 사후 nn0주년인 경우에는 그 해의 해당 작곡가 곡의 연주빈도가 튀는 경향이 있다. 이 또한 고려할 점이다.
대상은 예술의전당과 롯데콘서트홀.
사실상 모든 연주홀을 긁어오기란 불가능하니, 내가 아는 가장 큰 연주홀인 예술의전당과 롯데콘서트홀의 연주회 정보를 가져오기로 했다.
또한, 같은 곡을 이틀 연속으로 하는 경우가 가끔 있는데 이 경우는 내가 하나하나 골라내기 어려우므로 별개의 연주회로 간주하기로 했다.