태터데스크 관리자

도움말
닫기
적용하기   첫페이지 만들기

태터데스크 메시지

저장하였습니다.

소년 Sb의 어른되기 프로젝트

Boemie 프로젝트에 대한 3번째 포스팅입니다. 처음에는 각 단계의 목적과 이슈를 살펴보고 구체적인 내용을 살펴볼려고 했는데, 개인적으로 포스팅하는데 소요되는 시간이 너무 많군요; 그래서 한번에 몰아서 요약하고 정리하겠습니다.

이번에는 boemie에서 사용되는 멀티미디어 컨텐츠에 대한 온톨로지에 대해 살펴보겠습니다. 온톨로지는 간략하게 말씀드려서 컨텐츠를 구성하는 리소스들의 관계와 그들의 보케블러리, 계층구조, 구성법칙등이 표현될 수 있습니다.

특히 boemie에서는 멀티미디어 컨텐츠를 대상으로 합니다. 즉, 텍스트, 이미지, 오디오, 동영상을 포함합니다. 그러므로 멀티미디어 온톨로지에는 각 포맷들간의 표준 정보(MPEG-7 등)와 멀티미디어의 대상 도메인 정보(운동경기), 도메인 정보를 명확하게 해주는 기반 지식(시간, 공간), 기 구축된 upper 온톨로지 같은 복합적인 온톨로지로 구성이 됩니다. 당연히 이러한 멀티미디어 온톨로지는 대상 컨텐츠를 의미 레벨까지 표현, 분석, 검색, 통합, 활용하기 위함입니다.
사용자 삽입 이미지

Boemie's Multimedia Ontology


온톨로지의 구축에 있어서는 보통 두가지 방식으로 나뉘는데, Top-down 방식과 Bottom-up 방식이 그것입니다. 탑 다운은 기본적인(Common sense) 상위 레벨의 지식과 계층구조를 모델링하고 여기에 개념들과 속성을 붙여 나가고 확장하는 방식입니다. 버텀업 방식, 혹은 data-driven 방식은 코퍼스나 데이터로부터 이를 분절하고 분석하여 온톨로지 레벨의 지식으로 사용될 개념과 속성을 추출하고 이를 확장하는 방식입니다. 두 방법에 있어서 장/단점이 모두 존재합니다. 이는 온톨로지 구축에 관련된 포스팅으로 다시 한번 다루겠습니다.

boemie에서는 두가지가 mixed되어 어느정도 개념과 속성을 정의하고 컨텐츠로부터 다시 정의된 모델을 변화시키는 방식입니다. 이러한 방법론으로 온톨로지 진화(Ontology Evolution)이라는 프로세스를 정의하고 이용하게 됩니다. (다음포스트 참조)

세부적인 스펙을 살펴보면 온톨로지는 OWL로 작성되었고, SUMO나 Wordnet 같은 Upper 온톨로지들이 이용되었습니다. 멀티미디어쪽으로는 MPEG-7의 멀티미디어의 구성요소를 description하는 사용되는 MDS(Mutimedia Description Schemes)가 계층구조와 관계를 갖고 온톨로지화 되었습니다.
사용자 삽입 이미지

온톨로지화 된 MPEG-7의 MDS


도메인은 운동경기중에서 육상의 뛰기와 관계된 컨텐츠를 대상으로 하여 한정하였습니다. 아쉬운 부분인데, 아무래도 아직은 시맨틱 웹은 한정된 영역에서 시도하는 프로젝트가 많습니다. boemie의 온톨로지는 각 멀티모달리티들에 대하여 1차적으로 정보추출된 미들레벨컨셉(MLCs)과 이들로부터 생성되는 하이레벨컨셉(HLCs)의 표현을 지원하게 됩니다. 예를들어 '운동선수와 수평바와 수직바가 있다면 장대높이 뛰기이다.' 처럼 미들레벨의 여러 조건의 조합이 미리 정의된 하나의 하이레벨의 컨셉이 되는식입니다.

즉, OWLSWRL을 이용한(지식표현과 규칙) 지식 모델링을 하고 있습니다. 아쉽게도 아직 온톨로지가 업데이트되어 있지는 않습니다. 링크는 걸려있는데 다운로드가 안되는군요. 몇 가지 example에서 파악한 바로는 도메인에서 꼭 필요한 요소들만 가볍게 구성되어 있는거 같습니다. 아무래도 멀티미디어에서 정보추출을 하고 이를 온톨로지에 매핑하려면 그 매핑될 종류와 수가 성능에 큰 영향을 끼치기 때문인거 같습니다.

그럼 다음 포스팅에서는 온톨로지의 진화에 대해서 boemie의 approach로 살펴보겠습니다.
크리에이티브 커먼즈 라이선스
Creative Commons License
Posted by terrie
연구하는 것/시맨틱 멀티미디어 l 2007/06/04 14:33
후, 많이 쉬었군요.

그동안, 회사 일에 집중하느라 방치된 블로그를 보면서도 엄두가 나지 않더군요. 그런데 이대로 방치하기에 나누어야 할 주제가 너무 많고, 다시 곱씹어야 할 경험도 많이 쌓여 버렸습니다. 앞으로 다룰 포스팅 주제는 원론적인 온톨로..

STARS : KT 의미기반 검색엔진에 대한 긍정적 생각

이번 포스트에서는 시맨틱 기술 연구의 결과물 하나를 소개하고자 한다. 12월 14일, KT 미래기술연구소에서 개발한 STARS(http://stars.paran.com/)라는 국내 최초 의미 기반의 검색엔진이 KTH의 파란(w..

Semantic Web Application - Twine, 과연 어떤 모습인가?

지난달 열린 Web 2.0 Summit에서 Radar networks의 Twine 데모가 있었다. 시맨틱 웹 어플리케이션으로 알려진 Twine, 현재로써 블로그에 올라온 글을 종합하여 어떤 모습인지 빠르게 살펴보자. (bet..

지식의 부족함
지식의 부족함 2007/10/21

요새들어 지식의 부족함을 느낀다. 한동안 마냥 쏟아내어 밑천이 다 떨어진 느낌이다. 큰 결심이 필요할거 같다. p.s: 두달만의 포스트에서 이런 헛소릴...

슈퍼맨? 'SUPER' 프로젝트

SUPER 'Semantic Utilised for Process Management within and between EnteRprises' http://www.ip-super.org 대략적인 내용은 기존의 웹 서비스(Web..

Search 2.0 세미나가 열립니다.

웹2.0에 영향에 이어서 검색에 있어서도 버져닝 바람은 분다? 단순한 버져닝은 아니겠고 검색 패러다임에 있어서 새로운 개념과 아이디어가 합쳐 질거 같습니다. 물론 시맨틱 방법론도 들어가겠죠? 솔트룩스에서 돌아오는 8월 29일..

1  ... 12 13 14 15 16 17 18 19 20  ... 59 

최근에 올라온 글

공지 사항

카테고리

분류 전체보기 (59)
일상적인 것 (14)
즐겨하는 것 (13)
연구하는 것 (32)

달력

«   2008/07   »
    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31    
Creative Commons License

이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-동일조건변경허락 2.0 대한민국 라이선스에 따라 이용하실 수 있습니다.