차세대 검색엔진 이렇게 달라진다

by한형훈 기자
2004.05.06 16:26:51

[edaily 한형훈기자] 미국 1위 검색업체 구글의 성공이 다른 검색엔진들을 자극하면서 성능 향상을 이끌어내고 있다. 현재 시험가동중인 차세대 검색엔진은 사용자별 맞춤 서비스를 제공하는가 하면 엑셀파일에 숨은 단어까지 찾아내고 있다. 지난 99년 인터넷 열풍이 처참하게 무너진 후 포털 업체들은 추가 투자를 꺼려왔다. 하지만 구글이 차별화된 검색엔진으로 뜨거운 관심이 받자, 다른 포털업체들도 희망의 메시지를 받아 검색엔진의 성능 향상에 돈을 아끼지 않고 있다. 비즈니스위크는 6일(현지시간) 마이크로소프트와 야후, IBM 등이 구글의 눈부신 기업공개에 고무돼 보다 고급스런 검색 엔진을 개발하는데 박차를 가하고 있다고 보도했다. ◆맞춤형 서비스 AOL과 야후는 이미 맞춤형 검색 엔진을 개발했다. 사용자가 검색어를 입력하면 자신의 취향에 맞는 걸러진 정보들을 얻을 수 있다. 예를 들어 우주 비행사가 `Saturn` 단어를 치면 차 종류인 `Saturn`은 걸러지고 행성과 관련, `Saturn`이 포함된 결과를 얻게 된다. 엔진이 사용자의 의도를 읽어내 광범위한 검색 자료 중 필요한 정보만 추려내는 것이다. 이 제품은 시험 단계를 거친 후 1~2년 뒤 상용화될 전망이다. ◆어려운 질문에도 대답 척척 검색 엔진의 지능이 더욱 높아진다. 도요타의 A라는 차량을 사고 싶은 소비자의 경우 정보를 구하기 위해 지금은 `도요타 A`란 검색어를 치는 것 이외엔 뾰족한 방법이 없다. 출력된 검색 결과 가운데 자신이 필요한 정보를 선별하는 것은 사용자의 몫이다. 하지만 차세대 검색엔진은 `지난 6개월간 도요타 A에 대한 소비자들의 의견은 어떻게 변화됐나?"란 질문에 그래프를 이용해 추이를 보여준다. 현재 IBM 연구진이 개발에 열을 올리고 있다. ◆어디에 숨어있든 찾는다 이제 엑셀로 저장된 파일도 검색을 비껴갈 수 없다. 지금까지는 사용자가 검색어를 입력한 뒤 웹상에 걸리는 문장이나 사이트를 결과로 얻게 된다. 하지만, 정작 원하는 정보는 워드나 파워포인트, 컴퓨터 하드에 꼭꼭 숨어있는 경우가 허다하다. 마이크로소프트에서는 작업중인 파일과 하드에 숨은 단어까지 이 잡듯이 찾아내는 "Stuff I"ve Seen" 프로젝트를 진행중이다. ◆검색결과 정리까지 현재 검색창에 입력되는 단어 수는 평균 2.5단어. 여러가지로 해석될 여지가 많아 사용자의 의도와는 무관한 결과물도 혹처럼 붙어 나온다. 이 문제를 해결하기 위해 비비시모(Vivisimo)나 아이엑스매치(IXmatch) 등은 검색된 결과를 주제별로 폴더를 만드는 기술을 적용하고 있다. 예를 들어 전 미국 대통령인 `지미 카터`를 입력하면 검색엔진은 `노벨상`과 `취임연설` 등의 항목을 만들어 결과를 분류해 준다.