시맨틱 미디어 위키

이미지미디어위키 확장기능의 한가지로 시맨틱 미디어 위키(Semantic MediaWiki)라는 것이 있어요. 미디어위키의 활용성을 많이 개선해 줄 수 있는 확장기능이 아닌가 싶습니다.

저도 아직 사용자 매뉴얼을 보면서 조금씩 알아가고 있는 상황인데, Hostinger 무료 계정이 SMW 관련하여 디비 업데이트하는 과정에서 문제가 생기는 것을 보고나니 그쪽 계정에 올리려고 하던 글을 블로그에 옮겨 놓습니다.

위키백과(미디어 위키)의 약점 

미디어위키를 사용하는 위키백과는 마크다운 문법을 이용하여 Text와 이미지를 포함한 문서들을 만들고 정보를 공유할 수 있지만 링크를 따라가며 글을 읽는 것은 몰라도 아쉬울 때 검색을 통해서 어떤 것을 찾는 데는 한계가 있더라구요.

어쩌면 미디어 위키도 이런 모습이 아닐까? ㅋㅋㅋ

어쩌면 미디어 위키도 이런 모습이 아닐까? ㅋㅋㅋ

예를 들어서 1945년에 태어난 정치가를 위키백과에서 찾고자 할 때 아래의 두가지 방법을 생각해 볼 수 있는데 어느 쪽도 제가 찾고 싶은 것을 알려주지 못하네요. (어쩌면 이런 것을 찾을 방법이 있는데 제가 모르고 있는 것일지도 몰라요)

더구나 미디어위키 자체의 검색은 한글에 좀 약한 모습을 보이기도 하구요.

또 다른 측면에서 위키백과에 굉장히 많은 문서들이 들어있지만, 그것들을 묶어서 보여주는 것은 굉장히 어려운 것 같아요. 누군가의 굉장한 삽질로 만들 수는 있겠지만 신뢰도가 낮고, 원하는 사람들의 수요를 모두 충족시킨 다는 것도 불가능하겠지요.

시멘틱 미디어 위키가 뭘까요? 

이런 미디어위키의 약점을 보완하기 위해서 일단의 사람들이 기존 미디어위키에 사용된 주요 키워드 들을 기계가 알아먹을 수 있도록 만들어 보려고 했고 그것이 시맨틱 미디어위키(Semantic MediaWiki)인 것 같더라구요. 데이타베이스에는 어떤 일이 생기는 지 모르지만 표면적으로는 미디어위키의 분류(Category)와 비슷한 Property 라는 것이 추가되고, 검색 쿼리가 추가된 것이 특징인데요, SMW쪽의 설명에 따르면 시맨틱미디어위키에서 아래와 같은 질문에 답을 할 수 있다고 합니다

What are the hundred world-largest cities with a female mayor?

미디어위키에 확장기능으로 SMW가 설치된 다음에 디비 업데이트가 되면 SMW를 사용할 수 있게 되는데요, 뭐가 달라지는지 보면

검색 기능이 좀 달라져요

SMW를 설치하면 [[특수기능:묻기]]를 통해서 쿼리 검색을 사용할 수 있습니다. 그냥 미디어위키에 비해서 가장 마음에 드는 부분인데요, 위에서 이야기한 “1945년에 태어난 정치인”을 찾기 위해서 쿼리에 [[분류:1945년에 태어난 사람]], [[분류:정치가]]를 넣고 돌리면 두가지 분류에 공통적으로 포함된 문서를 보여줍니다.

여기까지만 되어도 검색에서 한결 좋아진 것이지만,  만약에 분류가 충분히 되어있지 않다면 별로 나아질 것은 없어 보입니다. 

추가적인 정보를 넣을 수 있어요

SMW을 설치한 다음에 제일 크게 달라지는 것은 Property라는 것을 사용하게 된다는 점이에요. 어쩌면 미디어위키의 분류와 같은 개념이기는 하지만, 분류는 사람만 알아볼 수 있는 것인데 비해서 Property는 기계가 알아들을 수 있도록 정형화된 것인데 string, number, email, date, text, url, quantanty  등의 Type 중 한가지 형태여야 해요.

미디어위키에서 내부 문서들의 링크는 [[internal link]] 이런 식으로 표시하는데요, Property는 [[Property name::property value]] 이런 식으로 표시해요. 실제 문서에 보이는 것은 [[property value]]와 같은 결과를 보여주죠.

예를 들어 위키 문서에서 A라는 문서에는 가격이 ‘5천원’이라고 표시되어 있고, B라는 문서에는 ‘5000원’이라고 표현되어 있다면 사람은 A와 B의 가격이 같다는 것을 알지만 기계는 알 수 없지요.  양쪽의 표현을 ‘[[price::5,000]]원’ 또는 ‘[[price::5000|5천]]원’이라고 넣어주고, price라는 property의 type을 Number로 지정해 놓으면 기계도 A, B의 price가 같다는 것을 이해할 수 있겠다 뭐 그런 얘기입니다.

What are the hundred world-largest cities with a female mayor?

이 질문에 답을 하기 위해서 미디어 위키에는 적당한 Property 값들이 들어가 있어야 해요.

개별 도시를 표현하는 문서에는 아래와 같은 property가 들어 있어야 해요.

  1. 그 도시의 인구를 표시하는 [[population::14,258,256]] (여기 숫자는 Number type)
  2. 그 도시의 면적을 표시하는 [[Area::123,456m2]] (면적은 단위를 포함하는 Quantity type)
  3. 도시의 시장 이름을 나타내는 [[Major is::나시장]] (여기 나시장은 Sting type)

그리고 ‘나시장’과 같은 문서에는 성별을 나타내는 property가 들어있어야겠지요.

그러면 쿼리에서 [[분류:도시]] + “시장의 성별을 확인하는 쿼리”를 조합해서 미디어위키에 들어있는 도시 문서들을 불러올 수 있고, 이것들을 인구나 면적 순으로 정렬할 수 있는거죠.

비슷한 사례로 인구/면적별 아프리카 국가 목록이 있군요.  이 목록을 구현하기 위해 적어 놓은 것은 아래와 같이 간단하죠.

{{#ask: [[Category:Country]] [[located in::Africa]]
| ?Area#km²
| ?Name
| ?Population
| sort = population
| order = descending
}}

대략보면 “특수기능:묻기”에서  [[분류:국가]]이고, [[Located in::아프리카]] Property를 가진 문서 들 검색하고, Area, name, population 등의 칼럼을 넣어서 리스트로 만들고, 순서는 Population 기준으로 내림차순으로 한다는 것이네요.

이것이 제대로 돌아가기 위해서는 각각의 국가들 문서에 적당한 property가 들어있어야 한다는 전제가 있기는 하지만, 들어가 있는 정보들은 이런 방식을 통해서 활용도가 높아질 수 있을 것 같아요.

다른 것들은? 

이제 막 SMW 매뉴얼을 보고 있는 단계라서 저도 잘 몰라요. Property 들을 어떻게 만들어야 활용도가 높아질 지? 쿼리 검색하는 것들에 대한 부분 등은 좀 더 살펴보고 내용을 추가해 볼랍니다.

그래서 미디어위키를 쓰려구요.

개인용으로 사용하기에는 도큐위키가 훨씬 더 간편하고 좋은 모습을 보여줍니다. 핸드폰에서 열어도 잘 보이고 만들어 놓은 문서들에서 뭔가를 찾아주는 것도 아주 잘할 것 같아요. 그래서 미디어위키로 만든 위키를 도쿠위키로 이전할까 생각도 해봤지만, 제 수준에서 삽질로 이전하는 것은 아니다 싶어서 그만두었어요. (웹스크립트?로 자동화할 수 있다면 그리 어렵지 않게 이전도 가능할 것 같은데, 제가 할 수 있는 일이 아니라서…)

최근에 미디어위키 업데이트하고 SMW를 깔아보면서 위키에 만들어 놓은 문서들을 이렇게 구조화?해서 사용할 수 있다면 이쪽이 더 좋겠다 싶습니다. (도쿠에 비해서 마크다운 문법이 익숙하다는 것을 빼고 처음 찾은 장점입니다. ㅋㅋㅋ)

무료 호스팅 계정은 SMW 관련해서 디비 업데이트하는 것도 오남용이라고 계정을 정지시켜버리니… 유료 계정으로 가면 괜찮을까요?

Advertisements
이 글은 위키 카테고리에 분류되었고 , 태그가 있습니다. 고유주소 북마크.

시맨틱 미디어 위키에 1개의 응답

  1. 핑백: 미디어위키 업그레이드 성공 | Memo 5

  2. 핑백: Semantic Mediawiki 1.9.0 | Memo 5

  3. 핑백: 머신러닝이 시멘틱 미디어위키를 대체할 수 있을까? | Memo 5

  4. 핑백: 머신러닝이 시멘틱 미디어위키를 대체할 수 있을까? | Memo 5

  5. 핑백: SMW, SubObject | Memo 5

답글 남기기

아래 항목을 채우거나 오른쪽 아이콘 중 하나를 클릭하여 로그 인 하세요:

WordPress.com 로고

WordPress.com의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Twitter 사진

Twitter의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Facebook 사진

Facebook의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Google+ photo

Google+의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

%s에 연결하는 중