태터데스크 관리자

도움말
닫기
적용하기   첫페이지 만들기

태터데스크 메시지

저장하였습니다.

소년 Sb의 어른되기 프로젝트

'밝은 시맨틱 검색의 미래'에 해당되는 글 1건

  1. 2007/06/04 구글 메인화면 변경과 유니버셜 서치, 그리고 시맨틱 검색까지
에픽 슈미츠 구글 CEO가 한국에 왔다. 국내 R&D 센터가 설립되고 본격적으로 구글의 서비스를 국내에 적용할 듯 하다. 한가지에 눈에 띠는 것은 요며칠 사이에 구글의 단조롭던 메인화면이 변경되었다.

한개의 텍스트 검색 박스만 제공했던 구글은 이제 웹문서, 이미지, 뉴스, 블로그, 그룹스 등의 카테고리를 나누어 검색을 제공한다. 하단에는 약간의 디자인이 첨가된 부가서비스들의 아이콘들이 배치됐다.
사용자 삽입 이미지

2007년 구글 메인화면 - 코리아

통합검색이라는 방식이 네이버에서 처음나와 이제는 거의 대다수의 검색엔진이 이러한 총체적인 분류들에 대한 검색을 지원한다. (초기에 네이버에서 특허를 생각을 못했다는 후문)
네이버에서는 검색의 분리보다는 결과화면에서 나뉘어 보여주게 되지만 구글은 사용자가 선택한 카테고리에 대해서 충실하게 결과를 보여준다. 구글스럽다는 말처럼 글로벌하고 가용성이 넓은 방식으로 국내에서 어떤 서비스로 로칼라이징을 어떻게 할지 궁금하다. 이에 대한 첫걸음이라고 보면 될거 같다.

다른 한가지는 구글랩에서 보여준 Experimental Search라는 것이다. 아직은 단조로운 구글의 결과 페이지에 대한 다양한 실험으로 보이는데 간략하게 소개하자면...
사용자 삽입 이미지

타임라인 연동 검색 결과

사용자 삽입 이미지

맵과 연동 검색결과


 첫번째는 타임라인과 맵과 결과를 연동해서 보여주는 방식으로 시간별로 검색 키워드와 연관된 페이지는 타임라인에 요약해서 보여주고, 컨텐츠와 관련된 장소도 지도에 표시하게 된다. 국내 포탈에서는 이미 제공하는 방식이지만 구글의 컨텐츠와 서비스(구글맵)과 연동된다면 검색결과 이해에 있어 많은 도움이될 듯 하다.
사용자 삽입 이미지

숏컷


두번째는 검색 결과 리스트에 단축키를 활용하여 네비게이션을 도와주는 방식으로 쇼컷에 익숙한 유저에게정도 도움이 될 듯하다.
사용자 삽입 이미지

검색 네이비게이션


세번째는 Ask.com 등에서 이미 사용하고 국내 포탈에서도 관련검색어라는 형태로 보여지는 서비스로 사용자가 입력한 검색 키워드에 대해 연관된 검색어와 카테고리를 제안하는 검색 네비게이션이라는 방식이다.
사용자 삽입 이미지

컨텍스츄얼 검색 네비게이션


네번째는 검색 네이게이션과 유사하지만 검색 키워드에 컨텍스트를 고려하여 카테고리나 관련 검색어를 제안하는 방식으로 컨텍스츄얼 검색 네비게이션이라 한다.

페이지랭크라는 신뢰성 있는 검색 가중치 모델로 단순한 텍스트 창과 단조로운 결과 페이지만으로도 지금의 정상에 오른 구글, 이제는 다른 모습으로 변화하고 있는거 같다. 누가 그랬던가, '공룡은 잠자면서도, 꿈을 꾼다고'

그동안 보여주는 면에 있어서 국내서비스들이 잘해왔던게 사실이다. 그래서 구글도 국내시장에 설부른 진입을 못했던거 같고, 하지만 연구결과물과 분석이 이제야 쌓인듯 하다. 국내 검색 서비스 시장에 있어서 '제국의 역습'이 시작된 것이다. :)

그렇다면 여기서 한가지 고민을 해본다. 통합검색을 해주든, 사용자가 원하는 카테고리를 선택해서 검색을 해주든 간에, 검색 결과를 어떻게 보여주는것이 좋을가? 라는 고민이다. 물론 시맨틱한 관점에서 말이다.

예를들어 사용자가 'apple' 이라고 검색했을 때 웹 페이지에서, 블로그에서, 뉴스에서, 이미지에서 'apple' 이란 키워드가 나온 페이지를 통합해서 보여줄 것인가? 아니면 컴퓨터 apple사와 과일 apple을 구분해서 각각을 통합해서 보여줄 것인가? 잘할 수 만 있다면 후자가 당연히 좋을듯한데, 조금 보기에 복잡할 수 도 있겠다. (클러스트링 검색과 약간은 다르다.)

그럼, 문제를 좁혀서 뉴스 검색을 할려고 할 때는 어떻게 보여줄 수 있을까? '김승연' 이라는 키워드로 뉴스 문서를 대상으로 검색을 수행하면 어떻게 보여줄 수 있을까? 물론 김승연이란 키워드가 포함된 모든 뉴스 문서를 검색하고, 날짜순으로 기사 섹션별로 구분해서 보여주는것 ... 그 이상 머가 있을까라는 고민이다. 어떻게 보여주면 좀더 의미적이고 사용자에게 어필할 수 있을까라는 고민... 물론 기술적으로도 가능해야 할 것이다.

일단 의미적으로 태깅된 컨텐츠가 있다면 조금 더 잘 보여줄 수 있을거 같다. '김승연' 사건의 이슈들로 부터 생성된 기사들과 의미적인 태그들, 이들을 이용하면 한화 김승연 회장의 뉴스기사들을 사용자에게 좀더 효과적으로 전달할 수 있을것이다. 물론 사용자가 입력된 태그들과 자동으로 추출할 수 있는 태그들을 전부 이용해야 한다. 그럼 어떤것을 자동으로 뽑아낼 수 있을것인가? 현재의 정보추출 기술로 인물, 장소, 시간, 조직 정도를 뽑아낼 수 있다고 한다.

그럼 '김승연' 이란 키워드로 부터 검색된 뉴스 문서들을 앞서 말한 태그들로 구분해서 보여준다면? 결과는 '김승연'과 관련된 인물들, 장소들, 조직들, 시간순으로 보여주게 된다. 얼핏 상상해보면 그나마 시간 순과 카테고리별로 분류된 기사들 보다는 유익할 거 같다. 그렇다면 적용된 정보추출 기술이 글로벌 할 수 있을까? 그리고 모든 기사들에 공통적으로 적용될 수 있을까? 마지막으로 대용량으로 실시간으로 가능한가?

아직은 기술적으로 미비하다. 정보추출의 시간이 대용량 처리와 실시간으로는 부족하고, 사용자 태그와 자동추출 태그의 연결고리도 난해하다. 현 기술이 미비하고 난해하지만, 우리는 이러한 시맨틱 처리를 위한 인프라를 구축해야 한다. 태그들과 정보추출, 자동태깅을 연결할 온톨로지, 일련의 프로세스를 담당할 글로벌 플랫폼이 바로 그것이다.

아직은 시작단계이다. 하지만 sb는 시맨틱 검색 기술이 구글이 조금씩 변하듯 결과물이 쌓여서 국내 시장에 진출하듯이 조금씩 변하고 쌓여서 세상에 나오리라 생각한다.
크리에이티브 커먼즈 라이선스
Creative Commons License
Posted by terrie
연구하는 것/시맨틱 검색 l 2007/06/04 10:11
후, 많이 쉬었군요.

그동안, 회사 일에 집중하느라 방치된 블로그를 보면서도 엄두가 나지 않더군요. 그런데 이대로 방치하기에 나누어야 할 주제가 너무 많고, 다시 곱씹어야 할 경험도 많이 쌓여 버렸습니다. 앞으로 다룰 포스팅 주제는 원론적인 온톨로..

STARS : KT 의미기반 검색엔진에 대한 긍정적 생각

이번 포스트에서는 시맨틱 기술 연구의 결과물 하나를 소개하고자 한다. 12월 14일, KT 미래기술연구소에서 개발한 STARS(http://stars.paran.com/)라는 국내 최초 의미 기반의 검색엔진이 KTH의 파란(w..

Semantic Web Application - Twine, 과연 어떤 모습인가?

지난달 열린 Web 2.0 Summit에서 Radar networks의 Twine 데모가 있었다. 시맨틱 웹 어플리케이션으로 알려진 Twine, 현재로써 블로그에 올라온 글을 종합하여 어떤 모습인지 빠르게 살펴보자. (bet..

지식의 부족함
지식의 부족함 2007/10/21

요새들어 지식의 부족함을 느낀다. 한동안 마냥 쏟아내어 밑천이 다 떨어진 느낌이다. 큰 결심이 필요할거 같다. p.s: 두달만의 포스트에서 이런 헛소릴...

슈퍼맨? 'SUPER' 프로젝트

SUPER 'Semantic Utilised for Process Management within and between EnteRprises' http://www.ip-super.org 대략적인 내용은 기존의 웹 서비스(Web..

Search 2.0 세미나가 열립니다.

웹2.0에 영향에 이어서 검색에 있어서도 버져닝 바람은 분다? 단순한 버져닝은 아니겠고 검색 패러다임에 있어서 새로운 개념과 아이디어가 합쳐 질거 같습니다. 물론 시맨틱 방법론도 들어가겠죠? 솔트룩스에서 돌아오는 8월 29일..

1 

최근에 올라온 글

공지 사항

카테고리

분류 전체보기 (59)
일상적인 것 (14)
즐겨하는 것 (13)
연구하는 것 (32)

달력

«   2008/07   »
    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31    
Creative Commons License

이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-동일조건변경허락 2.0 대한민국 라이선스에 따라 이용하실 수 있습니다.