국립중앙도서관, 28일부터 '텍스트 마이닝 활용' 온라인 교육

[이데일리 장병호 기자] 국립중앙도서관은 오는 28일부터 7월 1일까지 ‘텍스트 마이닝을 활용한 데이터 분석’ 교육 프로그램을 온라인으로 운영한다고 14일 밝혔다.

국립중앙도서관 ‘텍스트 마이닝을 활용한 데이터 분석’ 교육 프로그램(사진=국립중앙도서관)

이번 교육 프로그램은 최근 텍스트 데이터와 같은 다양한 유형의 데이터에 대한 분석 수요의 증가에 따라 파이썬 초급자를 대상으로 텍스트 데이터 분석 및 시각화 기초 역량을 강화하기 위해 마련했다.

총 4회차로 구성한 교육으로 텍스트 데이터의 수집과 처리부터 분석과 시각화까지 다룬다. △파이썬을 활용한 텍스트 마이닝의 개념과 환경 준비하기 △텍스트 데이터의 수집과 전처리(pre-processing) 방법 △텍스트 데이터 분석 △텍스트 데이터의 시각화 방법에 대해 학습한다.

특히 텍스트 데이터 분석 방법을 중점적으로 다루는 3차시에는 모든 분야 연구자에게 필수적인 빈도·군집·주제·감성 분석 방법을 학습해 교육 활용도를 최대화한다. 또한 프로그램 전체 과정에서 초보자들이 가장 쉽게 파이썬을 구현할 수 있는 구글 코랩(Google Colab)과 주피터 노트북(Jupyter Notebook)을 개발 환경으로 사용할 예정이다.

국립중앙도서관 관계자는 “올해 신설한 이번 프로그램을 통해 새로운 지식을 창출하는 연구 시사점을 얻을 뿐만 아니라 데이터 분석으로 통찰과 혜안을 얻는 기회가 되기를 기대한다”고 말했다.

이번 교육 프로그램은 무료이며 국립중앙도서관 이용자라면 누구나 도서관 홈페이지에서 접속해 신청할 수 있다. 참가자 신청은 14일부터 받는다. 수강 대상 60명은 서면 검토를 통해 선발해 오는 21일 발표한다.