다음, 검색엔진 자체 개발 완료

by류의성 기자
2007.05.14 10:04:49

검색 경쟁력 확대..올 6월 UCC검색 오픈
웹문서 적용..카페와 블로그 등 확대 예정

[이데일리 류의성기자] 다음(035720)은 검색서비스의 경쟁력의 핵심인 검색엔진을 자체 개발했다고 14일 밝혔다.

다음은 독자적인 검색 기술력을 보유하게 돼 성장 발판을 마련했으며, 테스트베드로서 웹문서 검색 베타사이트((http://ws.daum.net)를 통해 안정화 시범서비스에 돌입했다고 설명했다.

대용량 데이터를 효율적으로 처리할 수 있도록 중점을 둔 검색엔진은 우선 웹문서 영역을 시작으로 카페검색과 블로그검색 등 디렉토리로 점차 확대해 나갈 계획이다. 이를 위해 작년 초 엔지니어와 개발자로 구성된 개발엔진 TFT(테스크포스팀)를 구성했다.

특히 이번 웹문서 검색베타 사이트에서 첫 선을 보인 웹 검색로봇(웹크롤러)인 `다음오에이(Daumoa, 다음 오퍼레이팅 에이전트)`는 문서간의 연결 관계에 기반한 우선 순위 선정 방법을 기본으로 ▲정보량이 많은 문서별로 차등적인 가중치 부여 ▲실시간으로 문서 중요도에 대한 랭킹 계산 등을 통해 양질의 문서를 선별한다는 점이 특징이다. 문서 중요도의 기준은 해당 문서와 타 문서들과의 연계성 외에도 사용자들의 웹문서 사용 패턴을 분석해 적용된다.

기존 검색로봇은 웹문서 수집· 스팸 필터링· 데이터가공(검색엔진으로 로딩하기 좋은 포맷)· 검색엔진 로딩 등 여러 단계를 거쳐 최신 정보 업데이트가 된다.



반면 `다음오에이`는 수집과정에서 검색엔진으로 바로 로딩할 수 있도록 스팸 필터링과 순위 계산 등이 동시에 이루어져 신속한 검색 결과를 사용자에게 제공할 수 있도록 구현되었다는 점이 경쟁력으로 꼽힌다. 수집한 자료를 검색엔진으로 반영되는 주기를 국내 최단기로 설정해 최신의 검색 결과를 제공한다.

또 각기 다른 브라우저나 언어 환경에서도 사용자가 원하는 정보를 제공할 수 있도록 유니코드 인코딩을 지원했다. 사용자의 편의성 향상과 향후 외국어 및 사전서비스 등에 확장 적용이 가능하도록 구현했다.

다음은 이번 웹검색 서비스의 자체 운영을 시작으로 카페· 블로그· 동영상 등 대용량 UCC(손수제작물)콘텐트에 대한 효율적인 검색이 가능하도록 대용량 문서에 대한 시스템 확장의 용이성 및 자동화를 기반으로 한 리소스 관리의 최소화를 실현 할 계획이다.

손경완 다음 검색본부장은 "이번 검색 엔진 개발은 독자적인 기술력을 보유함으로써 차세대 검색시장을 주도할 수 있는 성장 기반을 다지게 되었다는 것에 의미가 있다"며 "다음이 보유한 30억건에 달하는 방대한 데이터를 중심으로 사용자 니즈에 가장 최적화된 검색 결과를 구현하는 등 차별화된 검색 서비스로 거듭날 것"이라고 말했다.

다음은 이르면 오는 6월 중 검색·블로그 등 다음의 집단지성을 활용한 검색 서비스 운영 노하우를 바탕으로 새로운 검색 패러다임을 이끌어 갈 `UCC검색`서비스를 전격 오픈할 예정이다.