“한달에 500만회 사용, 비용 감당못해” 부산대도 당한 AI ‘도둑 스크래핑’

by김혜선 기자
2023.07.06 07:26:53

[이데일리 김혜선 기자] 부산대가 무료로 공개하고 있는 맞춤법 검사기에 특정 IP가 수백만 번 접속을 반복하면서 엄청난 트래픽 비용이 발행하는 피해를 입었다. 최근 트위터에서도 인공지능(AI) 학습을 위해 정보를 긁어가는 ‘스크래핑’으로 서버에 무리가 생겨 이용자 접속 제한을 단행했는데, 부산대에서도 비슷한 일이 벌어진 것이다.

(사진=부산대 맞춤법 검사기 서비스 페이지)
6일 부산대 인공지능 연구실이 서비스하는 ‘맞춤법 검사기’ 페이지에는 “최근 우리 서비스를 이용한 특정 IP들에서 비정상적인 이용 패턴을 확인했다”며 “거대 언어 모델(LLM)의 학습을 위한 목적이 아닌가 의심된다”는 공지가 게시돼 있다.

부산대에 따르면, 인공지능 연구실이 제공하는 맞춤법 검사기는 아마존 클라우드 서비스를 이용하고 있다. 그런데 최근 특정 IP에서 한 달에 500만회 이상 검사기를 사용하면서 부산대가 감당하기 어려울 정도의 비용이 청구됐다고 한다.



부산대 측은 “만약 이런 대용량의 데이터 처리가 계속된다면 서비스 속도가 느려져 일반 사용자들이 선의의 피해를 입을 수밖에 없다”며 “또한 클라우드 서비스 유지 비용이 예상보다 늘어나 현재와 같이 웹 검사기 서비스를 무료로 제공하기가 불가능해진다”고 호소했다.

이어 “우리 웹 검사기 서비스는 개인이나 학생에게 비상업적 용도로만 무료로 제공하는 서비스”라며 “안정적인 서비스를 제공하기 위해, 서비스 이용 패턴을 꾸준히 점검하여 상업적 이용과 대규모 데이터 수집 목적의 이용을 제한하겠다”고 전했다.