[논문 리뷰] Measuring Firm-Level Inflation Exposure: A Deep Learning - Approach

immanuelk1m·2023년 7월 14일
0

Paper Review

목록 보기
8/9
post-thumbnail

Abstract

기업의 earnings conference call transcripts에서 문장들을 딥러닝 분석 후, 해당 기업이 인플레이션에 어느 정도 노출되어 있는지와 주가가 오르고 내릴 지, input price와 output price의 차이도 확인한다.
이러한 방식으로 추출한 인플레이션 노출 정도가 공식 CPI와 큰 상관관계가 있다. 높은 인플레이션 노출을 가진 기업은 어닝 콜 발표 시 부정적인 주가 반응을 보인다. 기업의 가격 결정력은 부정적인 주가를 방어할 수 있는데, 인플레이션 노출이 높은 기업은 미래 매출원가가 높고 영업 현금 흐름이 더 낮기 때문에 이러한 기업은 CPI 발표 시, CPI가 컨센선스를 상회할 경우 주가 하락이 나타난다.

Introduction

  • 2022년에 인플레이션이 심해짐

  • 화학, 비내구제, 제조회사는 인플레이션 노출이 아주 심함.

  • 반면 비지니스, 장비회사, 통신사, 헬스케어 분야는 인플레이션 노출이 낮음.

  • 기업들은 인플레이션 노출 정도를 차별화하거나

  • 인플레이션으로 발생한 비용을 소비자에게 전가함

  • 기업들의 인플레이션에 노출된 정도를 측정하는 것은 어려움

  • 어닝콜 자료에는 기업의 input & output price의 변화 정보가 담겨있음

  • 해당 정보는 기업의 내부 정보로 어닝콜 발표 시 투자자들에게 전달이 됨

  • 공시 자료에는 정보 전달이 제한되어 있어 기업 경영진들의 의견이 잘 반영 되어 있는 어닝콜 자료를 사용

  • 기업은 인플레이션 노출 정도 일부를 소비자에게 전가

  • 어닝콜 자료를 문장 단위로 Transformer Network로 분석

  • 모델을 통해 문장이 가격변화와 관련이 있는지 알 수 있고,

  • 그렇다면 가격이 오르고 내리는지 혹은 input & output price와도 관련이 있는지

  • 2007년 1월부터 2021년 7월까지 SeekingAlpha에서 CRSP와 Compustat에 있는 미국 기업들의 102,112개의 earnings call transcript를 분석

  • 모델이 가격 학습을 정확히 포착할 수 있도록 가격변화와 연관된 데이터들을 Train Data로 사용

  • 따라서 가격변화와 관련된 단어 list를 추출해야 함

  • 2021년 1월 ~ 6월 어닝콜 자료 중 target words를 많이 담고 있는 5개의 어닝콜 자료를 선택

  • 각 산업에서 타겟 단어가 가장 자주 사용된 가격변화와 연관된 텍스트 다섯 개를 선택

  • target word : inflation,” “deflation,” “price,” “cost,” “margin,” “labor,” “wage,” “expense,” “payment.”

  • 수작업으로 어닝콜 자료의 각 문장을 3가지 범주로 나누어서 labeling을 진행

  • (1) 가격 변화와 관련된 정보

  • (2) 가격 변화의 방향과 관련된 정보

  • (3) input & output price와 관련된 정보

  • 직접 확인한 28,932개 문장 중 가격변화와 관련된 1,335개의 문장에서 1,280개는 target word를 담고 있고, target word list가 인플레이션과 연관된 정보를 잘 포착한다는 것을 확인함

  • target word가 포함된 문장 4,710개 중 27.18% (1,280개)는 (1)에 불과하기에 BoW 방식으로 하는 것은 부적절함

  • 해당 단어만 있다고 가격변화와 관련 짓는 것은 비약이 있다는 것으로 일단 해석

  • label들이 unbalancedd 되었고, target words가 관련된 정보를 잘 포착하는 것을 고려했을 때,
    target word를 포함한 sentence들을 딥러닝 모델에 학습시키는 방향으로 집중함.

  • 따라서 pre-trained model (BERT, RoBERTa, FinBERT) 3가지 모델을 사용

  • target word에 포함되지 않은 단어들도 이해 가능

  • 단어 Sequence, Length도 학습하기에 학습이 더욱 수월

  • 해당 모델들은 글에서 어느 부분이 중요한지 학습하고, 가격 움직임 문맥에서의 정확한 예측을 함

1~2 page 정리

어닝콜 자료에서 가격 변동과 관련이 있을 것 같은 target word를 고르고,
target word를 가지고 있는 sentence만 따로 추려서 labeling을 3가지로 수작업으로 하였는데,
그렇게 하는 것보다 해당 sentence 들을 BERT 모델에 학습 시키는 것이 더 정확
input price가 매출 원가를 의미?? output price는 무엇을 의미??

  • RoBERT가 어떤 문장이 가격과 연관되어있는지 90.44%의 정확도로 예측함
  • 여기서의 정확도는 수작업으로 labeling 한 것과 RoBERT가 내놓은 결과의 차이?
  • fine-tuned RoBERT 모델을 사용
  • RoBERT가 마찬가지로 3가지로 labeling을 진행할 것인데
  • 가격의 방향 / input & output price와 관련된 정보 두 가지로 labeling을 진행
  • 인플레이션의 노출 정도 : InflationExp = input price 상승 문장 수 - input price 하락 문장 수
  • 산업 분야 별로 정말 인플레이션 노출 정도가 다른지 검증을 하였음
  • 매 분기마다 firm-level inflation exposure를 종합하였고, yoy PPI와 0.775의 상관관계를 보임
  • 반면 target word의 빈도수와의 상관관계에서는 0.01을 보여줌
  • PPI, CPI 같은 공식 Inflation 수치가 나오기 전에 미리 해당 값을 추측 가능함

3 page 정리

수작업으로 진행했던 Labeling을 BERT 모델을 사용해 Clustering을 진행하였고,
인플레이션 노출 정도를 정하여 예측 값을 PPI와 비교해봤는데 상관관계가 어느 정도 있다는게 증명.

4 Page

  • 인플레이션 노출 정도가 자산 가격에 어떤 영향을 미치는지 알아봄

  • 계속 언급 되었던 것처럼 어닝콜 text-data에 따라 주가가 어떻게 반응하는지 살펴봄

  • sector 별로 다르게 반응하는데, 가격 결정력이 높은 기업은 소비자에게 인플레이션을 전가할 수 있어 인플레이션 노출에 큰 영향을 받지 않음

  • 이벤트 패널 회귀분석 결과, InflationExp가 한 표준 편차 증가할 때, CAR[-1,+1] 기간(수익 발표 전후 1일) 동안 CAR이 26.3에서 32.5 베이시스 포인트(0.263%에서 0.325%) 낮아짐

  • 이 결과는 대부분의 기업이 비용 압력을 완전히 소비자에게 전가할 수 없다는 것을 의미

  • 기업들이 under perform 할 때 투자자의 주의를 돌리려고, 원가 상승에 대해 이야기할 수 있다는 점을 고려해야 함

  • 논문의 측정 방식은 기업의 실적 하락과 관련이 있을 수 있음

  • 하지만, 부정적인 반응은 인플레이션 노출이 아니라, 실적 하락 때문일 수도 있음

  • 그렇기 때문에 unexpected earnings surprises를 고려하고,

  • earnings call transcript의 감정과 불확실성과 같은 텍스트 기반 지표도 포함하였음.

  • 추가로, 우려되는 점은 earnings call transcript에서 생략된 수치 정보가 있을 수 있으며, 이 정보가 InflationExp와 상관 관계가 있을 수 있다는 점임.

  • 더 나아가 많은 양적 변수를 사용하여 causal forest analysis을 하고, 이러한 robustness test에서 결과는 여전히 유사하게 유지 됨.

4 page 정리

산업 분야별이나 기업의 가격 결정력에 따라 InflationExp 정도의 차이가 나타났음.
InflationExp과 CAR[-1,1]을 비교해 본 결과 의미있는 결과가 나타남.
하지만 earnings call transcript에서 중요하게 고려할 부분들이 많은데, 기업 실적을 돌려서 말하거나 quantitative information도 함께 고려할 수 있도록 해야함.

참고자료

Question

  • 어닝콜은 보통 Pre Market, After Market에 발표되는데, 주가와 비교를 해보려면 해당 시간대의 주가도 따로 가져올 필요가 있을 것 같음.

  • unexpected earnings surprises는 어떻게 통제한다는 건가?

  • 양적 변수를 사용하여 causal forest analysis한다는 게 무슨 말인가?

5 Page

  • 어닝콜 이후의 부정적인 추세도 관찰하였음

  • 특히 InflationExp의 std증가는 earnings call 이후 2일에서 90일 동안 CARs이 44.2bp 낮아졌고, 투자자들이 InflationExp에서 포착되는 인플레이션 노출을 완전히 가격화하지 않는다는 것과 earnings call 이후에 추세가 발생한다는 것을 의미

  • 다음으로, 기업의 가격 결정력이 가격 반응을 설명하는 데 어떤 역할을 하는지 가설검증 진행

  • 텍스트 기반의 가격 결정력 측정치를 수식화

  • output price 상승을 언급한 문장 수를 input price 상승을 언급한 문장 수로 나눈 값

  • 결과는 기업의 가격 결정력이 인플레이션 노출에 대한 부정적인 시장 반응을 완화시킬 수 있다는 것을 시사

  • 나아가, 기업의 인플레이션 노출과 원가와 영업현금흐름 같은 향후 fundamentals 간의 관계를 확인

  • 회귀분석 결과, 인플레이션 노출이 높은 기업들은 원가 증가와 향후 영업현금흐름 감소를 보여줌

  • 이러한 결과는 인플레이션 노출에 대한 부정적인 주식시장 반응을 명백히 설명 가능

  • 마지막으로, CPI 발표에 대한 주식 가격 반응의 다양성을 연구함

  • 인플레이션 노출이 높은 기업들은 특히 CPI가 현저한 경우 실적이 나쁘다는 가설을 세움

  • 회귀 분석 결과는 주로 인플레이션 수준이 높은 날 (CPI > 2%) 혹은 positive inflation shock (actual > consensus)인 경우 잘 드러남

5 Page 정리

인플레이션이 기업에 악영향을 미치지만, 가격결정력이 어느 정도 있는 기업은 충분히 방어가 가능하고 그렇기 때문에 가격결정력이라는 값도 수식화 하였음.
또한 인플레이션이 정말 주가에 영향을 미치는지도 회귀분석을 통해 확인하였음.

Question

첫 문장에서 CARs이 44.2bp 낮아진다는게 어떻게 저러한 의미를 도출 할 수 있나?

읽다가 그냥 드는 생각인데, 해당 논문은 주식시장의 주요 이슈가 인플레이션일 때의 움직임을 집중했다는 생각이 들어서 다른 기간의 backtesting도 필요하지 않을까라는 생각이 듦.

6 Page

  • 인플레이션과 자산가격의 관계에 대한 논문을 많이 참고

  • Fama & Schwert (1977)

  • Schwert (1981)

  • Stulz (1986)

  • Campbell & Vuolteenaho (2004)

  • Bekaert & Engstrom (2010)

  • Ang et al. (2012), Eraker et al.(2016)

  • Bhamra et al. (2021)

  • role of inflation in the cross-section of stock returns

  • cross-section : 일정한 시점에서 연구대상을 통제하고 비교 분석

  • 금융권에서 텍스트 분석 자료를 분석한 논문

  • Buehlmaier & Whited (2018) : 기업 연례 보고서의 텍스트 분석을 기반으로 기업이 재정적으로 제약을 받을 가능성을 예측

  • Li et al. (2021) : 기업 문화를 측정하기 위해 단어 임베딩 모델을 사용하여 culture dictionary 제작

  • Jha et al. (2020) : BERT 모델로 8개국의 Finance Sentiment 측정

  • Jha et al. (2021) : 자연재해에 대한 경제에 미치는 Finance Sentiment 분석

  • Chava et al. (2020) , (2021) : RoBERT Model

profile
개발 새발

0개의 댓글