'물가' 전하는 뉴스기사 지수화해보니…"소비자물가지수 1~2분기 선행"

이윤화 기자I 2022.10.17 12:00:00

BOK이슈노트, 인공지능 언어모형 이용한 인플레이션 어조지수
2002년 이후 최근 20년 뉴스기사 중 임의 5000개 기사 선별 분석
인플레이션 어조지수, 물가지표와 유의미한 상관관계 나타내

[이데일리 이윤화 기자] 한국은행이 인공지능 언어모형을 통해 뉴스 기사 문장을 대상으로 ‘인플레이션 어조 지수’를 개발해 실제 소비자물가상승률과 비교한 결과 그 흐름이 2분기 이내의 시차를 가지고 선행하거나 동행하는 결과를 보였다.



한국은행이 17일 발표한 BOK이슈노트 ‘인공지능 언어모형을 이용한 인플레이션 어조지수 개발 및 시사점’에 따르면 인플레이션 어조지수의 변곡점은 소비자물가상승률 변곡점을 대체로 1~2분기 시차를 두고 선행하는 것으로 나타나 소비자물가상승률의 추세를 판단하는 데 활용 할 수 있는 것으로 나타났다.

인플레이션 어조지수는 인터넷 포털 사이트에서 물가 관련 키워드로 검색해 조회되는 지난 20여년간 뉴스기사 총 188만건(6406만개 문장)에서 임의로 추출한 5000개 뉴스기사 문장을 대상으로 만든 것이다. 5000개 각 문장에 담긴 현재와 미래 인플레이션 어조를 상승, 중립, 하락으로 분류해 어조분류 모형을 훈련한 뒤 이를 통해 측정한 각 뉴스기사 문장의 인플레이션 어조를 평균해 시산했다.



이렇게 만들어진 인플레이션 어조지수와 소비자물가상승률을 2002년~2022년까지 분기별로 나눠 변곡점 분석한 결과 인플레이션 어조지수의 변곡점은 소비자물가상승률 변곡점을 대체로 1~2분기 시차를 두고 선행했다. 변곡점 분석이란 각 분기의 값이 전·후 6분기(총 13분기) 이내 가장 큰 경우를 고점, 가장 작은 경우를 저점으로 정의하고, 어조지수 고점(저점)이 소비자물가상승률 고점(저점)을 선행 또는 동행하는지 점검한 것인데 두 지수간의 상관 관계가 있었단 뜻이다.

2002년 2분기부터 2022년 2분기까지 중 인플레이션 어조지수 변곡점은 총 8건 식별됐는데, 이 가운데 소비자물가상승률 변곡점이 어조지수를 1년 이내 후행한 사례는 7건이었다. 대체로 어조지수가 고점(저점)을 지나고 1~2분기 이후 소비자물가상승률도 고점(저점)을 지나는 모습을 보였다. 특히 코로나19 감염병 유행으로 경제 불확실성이 확대된 2020년 2분기에 어조지수와 물가상승률이 저점을 기록한 이후 전례 없이 빠르게 증가하는 모습이다.

이 같은 결과를 토대로 어조지수와 물가지수 간 교차상관계수를 추산한 결과 0.57를 기록했다. 약 5개월의 시차를 두고 가장 상관관계가 커지는 것으로 나타났다. 생활물가지수, 수입물가지수와 어조지수 교차상관계수는 2~3개월의 시차를 두고 0.6~0.7선을 기록했다.



한은 관계자는 “소비자물가지수는 서비스품목 비중이 큰데 생활물가, 수입물가는 농산물, 원자재 가격의 변동성 영향을 크게 받아서 상대적으로 상관계수가 높았던 것이며 수입물가가 소비자물가에 1~2개월 시차를 두고 반영되는 영향도 있다”고 설명했다.

또한 인플레이션 어조지수를 예측변수로 활용한 전망 모형은 기존의 과거 소비자물가지수 데이터만을 가지고 측정한 전망모형 결과보다 더 높은 전망 성과를 보였다. 전망시계별로 보면, 어조지수는 단기시계인 2분기에서, 원자재 및 공업제품 어조지수는 1년 이상 장기시계(4, 8분기)에서 모형의 예측력을 개선하는 효과를 나타냈다.

한은 관계자는 “이번 연구는 다소 간단한 인플레이션 전망모형을 구성했지만, 전망모형의 예측력을 개선하고자 한다면 품목별로 세분화된 어조지수와 소비자물가지수 간 관계를 검토하고, 변수 예측에 특화된 머신러닝 알고리즘을 적용할수 있을 것”이라고 말했다.

주요 뉴스

ⓒ종합 경제정보 미디어 이데일리 - 상업적 무단전재 & 재배포 금지