경제학연구
랜덤 포레스트(Random Forest)의 시계열 적용에 관한 연구: 한국 물가상승률 예측 사례 분석
한희준(성균관대)발행년도 2023713
초록보기
본고는 한국과 미국의 물가상승률 예측에 랜덤 포레스트 모형을 적용할 때, Stationary Bootstrap이나 Moving Block Bootstrap 등 Block Bootstrap을 사용하 는 것이 통상적인 독립 부트스트랩(Independent Bootstrap)을 사용하는 것에 비 해 통계적으로 유의한 수준으로 예측력을 개선하지는 못한다는 것을 보인다. 그 리고 FRED-MD를 참고한 총 93개의 관련 국내외 거시경제/금융 변수들을 사용하 고, XGBoost, LSTM 등 다양한 머신러닝 방법을 활용하여 한국의 물가상승률을 예측하고 분석한다. 2004년 9월에서 2022년 3월까지의 표본을 이용하였고, 1개 월에서 12개월의 예측 대상기간(Forecast Horizon)을 고려하였다. 총 13개의 모 형 중 대부분의 예측 대상기간에 있어 예측력이 우수한 모형이 존재하는 것으로 나타났는데, 이는 보루타 알고리즘(Boruta Algorism)을 통해 중요한 변수로 분류 된 변수들만을 랜덤 포레스트에 적용하는 모형이다. Giacomini and White(2006) 와 Hansen et al.(2009)의 검정을 통해 대부분의 예측 대상기간에서 통계적으로 유의하게 예측력이 우수함을 확인하였는데, 특히 경제활동인구 및 취업자 수의 증가율 등 고용시장 관련 변수, 기업경기실사지수, 주택가격 변화율 등이 물가상 승률 예측에 중요한 변수로 선택되는 것으로 나타났다.