[똑똑!빅데이터]탈세·세금 환급 사기도 잡아내는 빅데이터

by이유미 기자
2017.04.01 08:00:00

[이데일리 이유미 기자] 탈세는 어느 정부나 골치거리 문제인 듯 합니다. 세계은행에 따르면 탈세 및 세금 환급 사기 관련 지구촌 지하경제 규모가 전체 GDP의 18%에 이른다고 합니다. 글로벌 금융위기로 인한 재정 위기 확산은 개인과 기업의 탈세로 낭비성 재정 지출 문제가 원인 중 하나라고도 합니다. 탈세만 방지해도 세금을 보다 효율적으로 사용할 수 있겠죠.

미국도 예외는 아닙니다. 미국의 탈세 금액은 2010년 기준으로 저소득층 의료보장 총액을 초과했다고 합니다.

미국 정부도 골치아픈 탈세 문제를 해결하기 위해 칼을 뽑아들었습니다. 빅데이터 분석을 통해 탈세나 세금 환급 사기를 막으려는 시도입니다.

미국 국세청(IRS)는 지난 2011년 글로벌IT기업인 SAS와 손을 잡고 탈세 및 사기 범죄 예방 시스템을 구축한 것이죠. 사기성 납세 신고 및 환급에 의한 탈세 유형 적발을 위해 운영하고 있는 RRP(Return Review Program)에 빅데이터 기반의 실시간 분석을 적용했습니다. 데이터마이닝, 모델링, 예측 분석, 사기 구조 감지, 실시간 사기 스코어링 등의 기술이 활용됐습니다.

IRS는 이미 엄청난 양의 데이터를 다루고 있기 때문에 빅데이터 기반의 솔루션을 적용하기엔 최적입니다. IRS는 2015년에 거둬들인 세금의 총액은 3조3000억 달러이며 4033억달러를 환급해줬습니다. 3억1900만명이 IRS 웹사이트를 방문하고 8300만건의 상담 전화가 이뤄지고 있습니다.

우선 SAS 정부기관 사기 방지 솔루션은 납세자들의 방대한 데이터에서 이상 징후를 찾습니다. 이상징후가 감지되면 예측 모델링을 통해 납세자들의 과거 행동 정보를 분석해 과거 사기패턴과 유사한 행동이 있는지 를 파악합니다. 만약 사기패턴과 유사한 양상을 보이는 경우 보다 철저하게 모니터링을 합니다.



또 소셜 네트워크 분석에 기반한 범죄 네트워크를 발견하기도 합니다. 계좌, 주소, 전화번호, 납세자 간의 연관관계 분석이나 페이스북, 트위터 등을 통해 범죄자와 관련된 소셜네트워크 분석으로 범죄자 집단에 대한 감시 시스템을 마련했습니다.

SNS을 통해 비슷한 유형의 사람들끼리 집단 네트워크를 이루듯이 범죄자 네트워크도 SNS 분석으로 어느정도 찾아낼 수 있는 것입니다. 그동안 알려지지 않았던 사기 조직의 관계나 연결고리를 찾아내기도 합니다. 또 소셜네트워크 분석을 통해 새로운 형태의 사기와 탈세 방식을 찾아내기도 했습니다. 세금 감면을 받기 위한 자녀 입양 사기부터 유령 세금신고자에 대한 수입 등도 찾아낼 수 있습니다.

(자료=SAS)
의심스러운 행동을 감지하기 위해 SAS의 텍스트마이닝은 콜센트 데이터와 같은 비정형 데이터도 활용합니다. 특별제작된 대시보드를 통해 이상징후가 발견되면 경고를 해줍니다.

이러한 다양한 기술을 활용한 탈세 및 사기 범죄 예방시스템을 통해 미국 국세청은 연간 3450억달러(약 388조원)에 달하는 세금 누락과 불필요한 세금 환급을 줄일 수 있을 것으로 예상했습니다.

실제로 미국 국세청(IRS)가 얼마나 탈세 및 세금 사기를 방지했는지 구체적인 액수는 발표하진 않았지만 어느정도 성과는 있었던 것으로 보입니다.

IRS의 딘 실버맨 선임고문은 2014년 미국매체 ‘연방뉴스라디오(Federal News Radio)’와의 인터뷰에서 데이터 분석을 통해 보다 공격적으로 세금 사기를 발견할 수 있었다고 말했습니다. 2011년 276건을 조사하고 218건이 기소됐지만 2013년에는 1492건에 대해 조사가 들어갔고 이 중 1257건이 기소됐습니다. 또 실버맨은 3년간 데이터 분석을 통해 20억달러 이상의 비용 절감을 할 수 있었다고 합니다. 더 효과를 보기 위해서는 시간이 좀더 걸릴 것으로 보입니다.

이러한 시스템은 탈세나 사기 뿐 아니라 향후 재정낭비, 부당 지출과 관련된 다양한 정부 사업에 응용할 수 있을 것으로 보입니다. 또 의료보험이나 복지프로그램 관련 사업에도 적용이 가능합니다.