시멘틱 웹 [semantic web]  
  
요약
컴퓨터가 정보자원의 뜻을 이해하고, 논리적 추론까지 할 수 있는 차세대 지능형 웹.
 

본문
현재의 컴퓨터처럼 사람이 마우스나 키보드를 이용해 원하는 정보를 찾아 눈으로 보고 이해하는 웹이 아니라, 컴퓨터가 이해할 수 있는 웹을 말한다. 즉 사람이 읽고 해석하기에 편리하게 설계되어 있는 현재의 웹 대신에 컴퓨터가 이해할 수 있는 형태의 새로운 언어로 표현해 기계들끼리 서로 의사소통을 할 수 있는 지능형 웹이다.

원리는 사람들이 이해할 수 있도록 자연어 위주로 되어 있는 현재의 웹 문서와 달리, 정보자원들 사이에 연결되어 있는 의미를 컴퓨터가 이해할 수 있는 형태의 언어로 바꾸는 것이다. 이렇게 되면 컴퓨터가 정보자원의 뜻을 해석하고, 기계들끼리 서로 정보를 주고받으면서 자체적으로 필요한 일을 처리하는 것이 가능해진다.

2004년 현재 시멘틱 웹과 관련된 연구는 RDF(Resource Description Framework)를 기반으로 한 온톨로지 기술과 국제표준화기구(ISO) 중심의 토픽 맵(Topic Map) 기술이 주류를 이루고 있다.

전자는 현재의 웹에 자원(주어)·속성(술어)·속성값(목적어) 등 자원을 기술하는 언어인 메타데이터를 부여해 정보의 의미를 이해하고 처리할 수 있게 하는 기술이다. 후자는 ISO의 XML 기반 표준 기술언어인 XTM 언어를 이용해 정보와 지식의 분산 관리를 지원하는 기술로, 지식층과 정보층의 이중 구조를 띤다.

시멘틱 웹이 실현되면 컴퓨터가 자동으로 정보를 처리할 수 있어 정보시스템의 생산성과 효율성이 극대화된다. 컴퓨터 혼자 전자상거래를 할 수 있고, 기업의 시스템 통합(SI), 지능형 로봇 시스템, 의료 정보화 등 다양한 분야에 응용할 수 있다.


이 글 주소:
http://www.dal.co.kr/chair/semanticweb/sw0202.html


진정한 웹은 인류의 모든 지식이 하나로 연결되는 것이다.
반 세기 동안 수 많은 사람들에 의해 하이퍼링크가 연구되었고, 이렇게 축적된 기반이 마침내 팀 버너스 리의 웹으로 1차 완성을 봤다. 웹은 이후 10년이 되기 전에 인류의 생활을 바꿀 정도로 엄청난 영향을 미친다. 은행과 시장, 서점에 가지 않아도 상거래가 가능하고, 지역 경계와 나라의 경계를 허물고, 생활시간표를 완전히 바꾸었다. 전통적인 시공간 중심이 바뀌고, 권력의 중심이 전혀 다른 곳으로 이동했다. 의식주는 물론 습관의 변화까지 이끌어냈다. 20세기에 많은 발명과 발견이 있었고 이로 인해 사람들의 생활이 조금씩 달라지기는 했지만 웹처럼 짧은 시간에 생활시간표를 완전히 뒤바꾼 혁명적인 변화를 주도한 것은 없었다. 컴퓨터, 전축, 비행기, TV 등의 어떤 발명과 발견도 인류 전체의 일상생활을 완전히 뒤바꾸지는 못했다. 부분적인 면에서 조금씩 변화를 주도했을 뿐이다. 하지만 웹은 이런 수 많은 발명이 합쳐 1세기 동안 이루었던 일을 10년만에 이루어낼 정도로 큰 변화를 가져왔다.

그러나 웹은 이제 겨우 첫걸음을 내딛었을 뿐이다. 팀 버너스 리의 웹은 아직 완성까지 많은 여정을 남겨두고 있는 미완성의 웹이다. 지난 10년 간 우리가 접한 웹은 단지 하이퍼링크가 네트워크로 구현된 정도에 불과하다. 웹을 연구하는 사람들이 원하는 것은 우주만물이 하나의 그물로 엮어 서로 관계를 맺고 영향을 미치는 인드라(Indra)망과 같은 세계다. 홀로 존재하지 않고 그물의 한 부분으로 다른 사물과 관계를 형성할 때 비로소 그 의미를 가지는 것처럼 인드라망처럼 서로 연결되어 한 쪽 구슬의 흔들림이 다른 쪽 구슬의 흔들림으로 나타날 정도의 짜임새 있는 정보의 연결은 아직도 많은 연구가 필요하다. 어쩌면 세상 모든 지식이 그물처럼 연결되는 진정한 웹이 구현되기까지 수 백 년이 더 걸릴지도 모르며 끝내 미완성으로 남을지도 모른다.


초기 웹의 단순링크가 가진 단순함은 웹의 보급과정에서 큰 장점이었다.

초기 웹의 특징은 단순링크라는 점이다. 마우스 딸깍(click) 한 번으로 즉시 다른 문서로 이동할 수 있다는 하이퍼텍스트 기능은 매우 편리하다. 주소만 입력하면 원하는 사이트와 문서로 이동할 수 있다는 단순성이 웹의 보급에 기여한 바도 크다. 아직도 웹을 처음 배우는 지구의 많은 사람이 링크와 인터넷주소인 URI(Uniform Resource Identifier)의 개념을 이해하는데 꽤 오랜 시간을 투자하고 있는 사실을 생각하면 초기 웹의 단순함은 분명 큰 장점이다. 하지만 웹이 보급될수록 웹의 단순함은 점차 한계를 드러낸다.

[초기 웹의 하이퍼텍스트 방식이 지닌 문제점]
1. 문서를 읽기 전까지 문서에 대한 정보를 알 수 없다.
2. 정보의 생산과 관리에 비용이 많이 든다.
3. 컴퓨터끼리 자동화 처리가 불가능하다.
웹에 익숙해지면 제목만 보고 딸깍해야 하는 웹이 점차 불편해진다. 링크를 누르기 전에 '내가 원하는 글이 아니면 어떡하나? 문서 크기가 커서 한참 동안 문서를 읽으면 어쩌나?' 하는 온갖 두려움이 생긴다. 유인용 문서, 쓰레기 문서가 넘칠수록 점차 미지의 문서에 대한 두려움은 더욱 커지고 있다. 원치 않는 동영상이나 음악파일을 재생하는 문서 때문에 몇 분씩 꼼짝 못하는 경우를 당하면서 쓰레기 정보에 대한 두려움은 더욱 커지고 있다.

정보 생산자도 답답하다. 일일이 손으로 HTML 태그를 삽입하고 수정해야 하는 불편과 이로 인한 비용의 낭비는 정보량이 증가할수록 심각한 문제로 다가오고 있다. 이런 문제를 해결하기 위해서는 컴퓨터나 프로그램끼리 인공지능에 의해 알아서 처리하는 자동화 처리가 필요한데 이것이 불가능한 것이 초기 웹의 가장 큰 문제다.

단순링크가 지닌 이런 문제는 '1. 쓰레기 정보의 증가와 처리 문제. 2. 정보의 생산, 관리, 재활용 문제. 3. 정보 검색, 배포, 수집의 문제.'를 낳는다. 정보 생산과 배포, 관리에 돈은 더욱 많이 들어가는데 원하는 정보를 찾거나 활용하기는 갈수록 힘들어지는 구조를 보이는 것이다.


시맨틱웹(뜻살린웹)은 현재 웹의 확장으로 자동화처리를 강화시킨 웹이다.

시맨틱웹(Semantic Web, 뜻살린웹)은 초기 웹의 이런 문제를 해결하기 위해서 제안된 것이다. 시맨틱웹은 웹의 창시자인 팀 버너스 리에 의해 1998년에 제안되었으며 각종 회의와 연구를 통해 지속적으로 관련 규격과 기술이 개발되고 있다.

팀 버너스 리가 제안한 시맨틱웹은 웹 자체가 지식 기반으로 자동화될 수 있도록 거대한 정보 구조가 꽉 짜인 웹이다. 이를 위해 컴퓨터가 정보를 구성하는 자원의 뜻을 이해하고 추론할 수 있는 지능형 웹을 목표로 한다. 팀 버너스 리는 '시맨틱웹은 현재 웹의 확장으로 잘 정의된 의미를 제공함으로써 사람과 컴퓨터가 좀더 협력을 잘 할 수 있는 웹'이라고 설명하고 있다.

이 설명에 따르면 시맨틱웹은 컴퓨터끼리 정보를 주고받을 때 잘 정리된 좀더 많은 정보를 추가로 제공해 정보해석력을 높이고, 이를 통해 자동화처리를 향상시킨 웹이다. 더 간단하게 해석하자면 컴퓨터끼리 알아서 다 처리해주고 사람은 '예, 아니오'라는 선택만 해주면 되는 웹이다. 따라서 시맨틱웹이 구현될수록 사람이 할 일은 점차 줄어들고 대부분의 일은 기계들끼리 인공지능으로 알아서 다 처리하는 웹이 된다.


시맨틱웹은 자동화처리를 위해 숨은자료를 적극 활용하고 있다.

기계끼리 일을 처리하려면 기계끼리 서로 대화를 나누고 대화 내용을 이해할 수 있어야 한다. 이를 위해선 컴퓨터가 이해할 수 있는 언어로 웹을 구성해야 한다. RDF, 온톨로지(Ontology, 존재론), OWL(Ontology Web Language, 존재론 웹언어) 등은 이를 위해 논의되고 있는 기술이다. 현재 시맨틱웹은 W3C를 중심으로 숨은자료(meta data, 메타데이터)를 통해 정보의 의미를 이해하고 처리하도록 하는 자원 설명 기술과 지식 설명 기술이 결합된 연구방향이 한 줄기를 이루고 있다. W3C는 RDF 기반의 온톨로지(Ontology) 기술에 관심을 가지고 있다. 다른 한 줄기는 ISO를 중심으로 XTM 언어를 이용한 정보와 지식의 분산 처리, 통합 관리 등에 중점을 두는 방향이다. ISO 쪽은 토픽맵(Topic Maps) 기술에 중점을 두고 있다. 토픽맵은 ISO/IEC 13250 표준으로 XML 기반의 XTM(XML Topic Maps)이라는 언어를 사용해 정보와 지식의 분산 관리를 지원한다. 이 중에서 현재 가장 활발하게 논의되고 있고 실제로 사용하고 있는 기술은 숨은자료(메타데이터)를 이용한 자동화처리 부분이다.

시맨틱웹은 너무 이상적인 웹이라 실현까지 많은 어려움이 있을 것이다. 그러나 완벽한 구현이 아닌 일부라도 구현된다면 정보 활용의 효율성이 크게 향상될 것이다. 일부만 구현되어도 컴퓨터끼리 알아서 쇼핑도 하고, 업무도 보고, 은행일 보는 것이 가능해진다. 예를 들자면 네티즌이 일일이 온라인서점에 접속하지 않아도 컴퓨터가 알아서 내가 필요로 하는 책을 구매해주고, 극장에 가기만 하면 내가 볼 영화와 자리가 예약되어 있고, 기차역에 가서 자리에 앉기만 하면 되는 시대가 시맨틱웹의 시대다. 이러한 고도의 자동화처리 구현까지 많은 시간이 필요하거나 까다로운 기술이 필요한 것은 아니다. 시맨틱웹은 먼 미래가 아니고 RSS와 유비쿼터스 등의 모습으로 이미 우리의 웹 속에 구현되고 있는 현재의 이야기다.

시맨틱웹의 미래를 한 번에 그리기란 쉽지 않다. 이제 몇 년에 불과한 시맨틱웹에 대한 논의는 지금도 계속 진행형이기 때문이다. 2005년 3월에 시맨틱 기술 컨퍼런스가 열려 좀더 발전된 논의가 이루어졌지만 여전히 시맨틱웹은 진행형이며 앞으로도 당분간 계속 진행형일 것이다. 시맨틱웹은 워낙 거대한 분야이기 때문에 한 번에 그 모습을 드러내지 않고 분야 별로 조금씩 모습을 드러내고 있다. 예를 들면 다음과 같은 낱말들이 시맨틱웹과 관련된 낱말이다.

[시맨틱웹 관련 낱말]
Ajax, ATOM, BitTorrent, Blog, Conversations, CSS, Feed, Google, KRS, Logic Framework, MCF, Metadata, Ontology, Open Source, OPML, OWL, Platform, Proof, RDF, RSS, Social Network, SOAP, SparQL, Structured Blogging, SVG, Syndication, TAGS, Tagging, Topic Map, Trust, Ubiquitous, UDDI, Wikipedia, WSDL, XML, XMP, XTM.
잘 알려진 일부 낱말만 예를 든 것이지만 이들 낱말만 봐도 시맨틱웹이 거의 모든 분야에서 진행 중인 흐름임을 알 수 있다. 특히 인터넷 분야에서는 향후 몇 년 동안 가장 중요한 화두가 될 전망이다. 일반인을 대상으로 한 이 책에서 이들 낱말의 기술적 내용을 상세하게 설명할 수도 없지만 이들 낱말이 지닌 의미를 쉽게 전달하고자 할 것이다.

시맨틱웹은 현재 많은 사람에게 생소한 낱말이겠지만 관심을 기울일 필요가 있다. 서점에 웹을 도입해 아마존이라는 온라인서점을 만든 것처럼, 자신이 일하는 분야에서 시맨틱웹을 도입할 경우 일어날 변화는 혁명적일 수 있기 때문이다. 시맨틱웹은 곧 다가올 미래이자 이미 구현중인 기술이므로 더 이상 준비를 늦출 수 없다. 미래를 준비하는 사람이 새로운 성장의 기회를 잡을 가능성이 높다는 사실을 잊지 말자.

'IT Story' 카테고리의 다른 글

용어정의 - 매쉬업(Mash Up)  (0) 2007.06.24
프로그래머의 위기지학  (0) 2007.06.19
시맨틱 웹(Semantic Web)  (0) 2007.06.18
Agile 방법론 세미나 ( with 김창준 )  (1) 2007.06.17
Web 2.0 과 한국의 인터넷 트렌드  (0) 2007.06.16
iPod, 그 성공 스토리  (0) 2007.06.16
댓글을 달아주세요!
이름 암호 홈페이지