포털 차세대 검색기술로 `시맨틱` 부각
by임일곤 기자
2009.10.05 16:03:31
기계가 사용자 질문의도 파악해 검색결과 도출
해외 검색엔진 줄줄이 도입..국내 포털도 관심
[이데일리 임일곤기자] 구글이나 야후, MS 등 해외 검색업체들을 통해 알려졌던 `시맨틱` 검색이 국내 포털 업계에서도 각광받고 있다.
지난달말 SK컴즈(066270)가 포털 네이트 첫 화면을 개편하면서 상용화를 시작했고, NHN(035420) 네이버도 영화정보에 시맨틱을 적용해 실험서비스를 진행 중이다.
시맨틱이 차세대 검색기술로 떠오르면서 국내 포털들은 검색품질 향상과 새로운 시장 선점에 더욱 적극적으로 나서고 있다.
시맨틱 검색이란 인공지능 컴퓨터가 자연어 처리 및 의미를 추출해 사용자 의도에 좀더 가까운 검색 결과를 보여주는 것을 말한다. 즉 기계가 사람이 원하는 정보를 파악해 보여주는 것이다. 현재 포털들이 제공하고 있는 `연관검색어`도 일종의 시맨틱 검색으로 볼 수 있다.
예를들어 `이순신`이라는 키워드를 입력할 경우 `이순신 장군은 서울 건천동에서 태어났다`란 웹문서를 찾아내 `이순신-인물`, `태어났다-출생`, `서울 건천동-장소와 지명`으로 쪼개서 분석하는 것이다.
이렇게 되면 `이순신 장군의 출생지는 곧 서울 건천동`이란 결과가 도출돼 이용자 검색 의도에 한걸음 다가갈 수 있게 된다. 검색엔진이 단어 하나에 초점을 맞추기 보다 그 단어가 들어간 문장 전체를 분석해 의미별로 분류하기 때문에 좀더 다양한 검색결과를 볼 수 있다.
| ▲ 네이트는 얼마전 첫화면을 개편하면서 시맨틱검색을 도입했다. `김연아`란 키워드로 검색할 경우, 출생일부터 경기기록, 라이벌, 수상대회 등 관련 정보가 보기쉽게 분류돼 제공되는 것이 특징이다. |
|
원래 시맨틱검색은 컴퓨터가 웹문서 내용을 이해하도록 웹을 구축하는 시맨틱웹 기반의 검색방식으로 소개됐다.
하지만 시맨틱웹 구현이 현실적으로 어려워 현재에는 HTML 기반에서도 의미분류에 따라 검색결과를 제시하는 제반 기술적 결과물들을 시맨틱검색으로 통칭하고 있다.
시맨틱웹 개념은 지난 1998년 `오라일리` 미디어 창업자 겸 CEO인 팀 오라일리가 제시하면서 알려졌다. 현재 시맨틱웹은 통계적 기법을 통한 방법과 자연어 분석에 의한 방법 등 두 가지로 나뉘어 활발히 연구되고 있다.
시맨틱 검색은 야후와 MS, 구글 등 해외 주요 검색사들이 개발해 속속 도입하는 가운데 국내 포털들도 동참하는 모습이다.
해외 검색업체의 경우 야후는 지난 5월경 이 기술을 접목해 검색을 크게 개선했으며, 마이크로소프트(MS)도 새 검색인 `쿠모`를 통해 선보일 것으로 알려졌다.
최근에는 `울프럼알파`라는 신생 검색 엔진이 등장해 구글을 위협하고 있으며, 구글도 지난 2006년 오리온(Orion)검색엔진을 인수하면서 시맨틱 검색을 발전시켜 오고 있다.
얼마전 구글 검색에 새로 추가된 `searches related to:(관련검색어)` 항목이 시멘틱검색의 일종이라 볼 수 있다.
국내에선 포털 네이트가 가장 적극적이다. 네이트를 운영하는 SK컴즈는 작년 8월 `코난`과 시맨틱검색 개발계약 체결하고 지난 9월 상용화를 시작했다.
네이트의 시맨틱 검색은 의미 분류와 예상 답변 결과를 제시했다는 점과 통합검색면에 플래시를 도입해 이용자환경(UI) 편의성을 도모했다는 점에서 눈길을 끈다.
네이버도 영화 정보에 시맨틱 검색을 적용해 실험차원에서 서비스 중이다. 현재 `네이버 랩`을 통해 선보인 네이버 시맨틱 영화검색은 영화 검색 데이터베이스(DB)를 대상으로 테스트하는 상황이다.
네이버 시맨틱 영화검색은 검색 데이터베이스(DB)에 축적된 고급정보를 보기 좋게 정렬한 방식으로 선보였다. 다양한 정보를 거미줄처럼 연결시켜 편리한 검색을 가능케 한다는 방침이다.