(DIP통신) = 다음커뮤니케이션(www.daum.net)이 검색엔진의 자체 개발을 완료, 독자적인 검색 기술력을 보유하게 됐다.

이에 맞춰 다음은 웹문서 검색 베타사이트(ws.daum.net)를 통해 해당 엔진의 안정화를 위한 시범 운영에 들어갔다.

다음은 자체 개발한 검색엔진의 적용을 웹문서 영역을 시작으로 카페검색, 블로그 검색 등 각 디렉토리별로 점차 확대 한다는 계획이다.

이를 위해 지난 해 초 엔지니어, 개발자 등으로 구성된 개발 엔진 TFT를 구성했다.

이번 웹문서 검색베타 사이트에서 첫 선을 보인 웹 검색로봇(웹크롤러) '다음오에이'는 문서간의 연결 관계에 기반한 우선 순위 선정 방법을 기본으로 ▲정보량이 많은 문서별로 차등적인 가중치 부여 ▲실시간으로 문서 중요도에 대한 랭킹 계산 등을 통해 양질의 문서를 선별한다는 점이 가장 큰 특징이다.

문서 중요도의 기준은 해당 문서와 타 문서들과의 연계성 외에도 사용자들의 웹문서 사용 패턴을 분석해 적용된다.

기존 검색로봇의 경우 웹문서 수집, 스팸필터링, 데이터가공(검색엔진으로 로딩하기 좋은 포맷), 검색엔진 로딩 등 여러 단계를 거쳐 최신 정보 업데이트가 되는 반면 다음오에이는 수집과정에서 검색엔진으로 바로 로딩할 수 있도록 스팸 필터링과 순위 계산 등이 동시에 이뤄져 보다 신속한 검색 결과를 사용자에게 제공할 수 있도록 구현됐다.


또한 다음은 각기 다른 브라우저나 언어 환경에서도 사용자가 원하는 정보를 제공할 수 있도록 유니코드 인코딩을 지원해 사용자의 편의성 향상은 물론 향후 외국어 및 사전서비스 등에 확장 적용이 가능하도록 구현했다.

수집한 자료를 검색엔진으로 반영되는 주기를 국내 최단기로 설정해 최신의 검색 결과를 제공하는 점 역시 장점.

다음은 이번 웹검색 서비스의 자체 운영을 시발로 카페, 블로그, 동영상 등 대용량 UCC콘텐츠에 대한 효율적인 검색이 가능하도록 대용량 문서에 대한 시스템 확장의 용이성 및 자동화를 기반으로 한 리소스 관리의 최소화를 실현 할 계획이다.

한편 다음은 이르면 오는 6월 중 그 동안 검색, 블로그 등 다음의 집단지성을 활용한 검색 서비스 운영 노하우를 바탕으로 새로운 검색 패러다임을 이끌어 갈 'UCC검색'서비스를 오픈 할 예정이다.