w

CIVET – od kontentu do Linked Open Data

CIVET – nowe rozwiązanie stworzone przez Knowledge Hives pozwala przekształcać zwykły tekst w dokument RDF, połączony ze słownikami opublikowanymi jako Linked Open Data.  Rozwiązanie wykorzystuje m.in. OpenVocabulary – usługę służącą do publikowania słowników jako Linked Open Data z użyciem standardowej ontologii SKOS, która definiuje relacje pomiędzy pojęciami w słownikach używanych przez CIVET, jak i inne powstające na całym świecie usługi semantyczne.

Jak mówi dr Sebastian Kruk, jeden z twórców systemu CIVET: „Aby określić słowa kluczowe w dostarczonym tekście wykorzystywane są techniki przetwarzania języka naturalnego (NLP). Ponadto – te słowa i frazy są analizowane aby określić najbardziej stosowne znaczenie. CIVET wiąże znalezione słowa i frazy kluczowe z pojęciami ze słowników takich jak WordNet i polskiej wersji OpenThesaurus, oraz innych słowników opublikowanych w postaci grafu RDF/SKOS jako Linked Open Data”.

CIVET pozwala także na odnalezienie i powiązanie w nazwisk osób oraz nazw miejsc i wydarzeń. Używa do tego celu inne źródła LOD, takich jak DBpedia lub GeoNames, aby przypisać pojęcia do tych nazwisk i nazw. Dzięki temu zwykły tekst staje się dokumentem RDF ze słowami kluczowymi, frazami i nazwami oraz nazwiskami odnoszącymi się do pojęć Linked Open Data.

Jedną z kluczowych zalet CIVET jest to, że działa nie tylko z angielskimi tekstami, ale jako jeden z nielicznych pozwala na pracę w języku polskim. Jego  architektura   umożliwia rozszerzenie funkcjonalności na inne języki.

Dr Sebastian Kruk tłumaczy, że „CIVET używa grafu opisującego poprzednio analizowane teksty aby rekomendować dokumenty podobne do obecnie analizowanego tekstu. Używamy tej właściwości do budowania indeksu semantycznego (który niedługo zostanie uruchomiony) i silnika rekomendacyjnego dla polskiej blogosfery”.

Unia Europejska wspiera budowanie biblioteki semantycznej

Nowy biurowiec już działa