12월 14일, KT 미래기술연구소에서 개발한 STARS(http://stars.paran.com/)라는 국내 최초 의미 기반의 검색엔진이 KTH의 파란(www.paran.com)에 시범 서비스로 오픈됐다.
STARS의 네이밍은 다음과 같다. Semantic Technology bAsed Retrieval System. 말그대로 시맨틱 기술 기반의 검색엔진이다. 언뜻 생각나는게 웹페이지의 어노테이션, 이를 위한 온톨로지와 relation 기반의 추론을 통한 검색?
STARS는 기존의 검색엔진이 갖는 몇가지 한계점과 비교되는 차별성을 갖으며, 그 자신도 기존의 모습을 유지하는 복잡한 엔진이다. 두드러지는 몇가지를 살펴보자면,
1. 새로운 UI의 시도
- 구글의 단순한 검색어 입력창이 아닌 비쥬얼 UI(CUBE)
- 새로운 User Experience(UX) 확장
2. 문장내의 Concept과 Relation 식별 및 검색
- 키워드의 Exact, Partial 매칭이 아닌 관계성 검색
- 문서단위의 링크가 아닌 개념간의 링크 존재
3. 결과 재구성
- Concept과 Relation으로 연결된 결과셋 제공(의미적 클러스터)
- 의미적 연관성으로 Micro content 조명
STARS를 잘 보려면, 검색 마인드부터 바꿔야 할 듯 하다. 단순히 키워드 매칭이 아닌 의미 기반 검색이라 익숙해지기 전까지는 당황스럽다. 그 만큼 큰 변화라 할 만하다. 역으로 단순 매칭을 기대하면서 검색어를 넣어보면 실망할터,,,여기저기 익숙한 트렌드도 보인다. 검색어 확장/한정, 결과 클러스터, 검색어 추천 등 .
이러한 속성을 가능하게 하려면, 문서 색인구조부터, 쿼리 처리 방식, 랭킹 모델 등이 기존과 많은 부분 차이를 갖을 것이다. 엔진 코어 부분의 온톨로지는 W3C의 시맨틱 웹 표준 기술을 이용하여 구현됐다고 하니. 앞으로의 확장면에서도 기대해 볼 만 하다.
차후에 기회가 있다면, 얼마전 Semantics Korea에서 언급한 독자적인 방식의 시맨틱 웹 검색 방법론과 빗대어 더 자세히 살펴볼 수 있을 것이다. (여기서, 한마디 하자면 SemanticKorea의 말에는 어패가 있다, 독자적 시맨틱 기술이라면 그게 시맨틱일까? -_-)
아쉬운 점이라면, 너무 한꺼번에 많은 것을 보여주려 했다는 점일까, 오히려 사용자의 포커스를 흐리는 느낌이 난다. 지금은 사라진 첫눈 엔진(snow rank)의 간단한 변화가 가져온 큰 파장을 생각해 보면, 너무 여러 곳에 집중한 느낌이 없지 않다. phase를 두고 적용할 부분도 없지 않아 보이고, 특히 큐브 UI는 사용자들이 바라던 하나의 모습인데 아쉬움이 많다.
사실 우리가 주목해야 할 것은, 시맨틱 기술이 사용되었든, 온톨로지가 사용되었든 기술이 아니라 얼마나 사용자가 원하는 결과를 찾아주는가, 얼마나 검색 서비스로써 매력도가 있는가가 아닐까 한다. STARS를 사용해서 정말 원하는 결과를 빠르게 찾았고, 검색할 때 재미가 있다면 STARS는 기술과 상관없이 성공 할 것이다. 이미 연구개발자 손을 떠나 고객의 손을 넘어간 것이다. gogo stars!
sb는 글의 제목처럼 긍정적인 생각을 하고 싶다. 시맨틱 기술의 구현으로 포털의 시범서비스가 걸리지 않았냐 말이다. 그들의 피땀 어린 노고에 찬사를 보낸다.
여하튼, 요사이 추천(Recommendation)을 하면서 시맨틱 웹은 오히려 명료하지 않나 하는 생각도 드는 이유는 멀까... 감이 떨어졌는지... 추천에서 너무 헤맸는지..
p.s: STARS의 기술 문서가 아닌 sb의 생각대로 읊조렸음.


qna_ICU 맹성현.pdf
