CIVET - od kontentu do Linked Open Data

CIVET – nowe rozwiązanie stworzone przez Knowledge Hives pozwala przekształcać zwykły tekst w dokument RDF, połączony ze słownikami opublikowanymi jako Linked Open Data. Rozwiązanie wykorzystuje m.in. OpenVocabulary – usługę służącą do publikowania słowników jako Linked Open Data z użyciem standardowej ontologii SKOS, która definiuje relacje pomiędzy pojęciami w słownikach używanych przez CIVET, jak i inne powstające na całym świecie usługi semantyczne.

Jak mówi dr Sebastian Kruk, jeden z twórców systemu CIVET: „Aby określić słowa kluczowe w dostarczonym tekście wykorzystywane są techniki przetwarzania języka naturalnego (NLP). Ponadto – te słowa i frazy są analizowane aby określić najbardziej stosowne znaczenie. CIVET wiąże znalezione słowa i frazy kluczowe z pojęciami ze słowników takich jak WordNet i polskiej wersji OpenThesaurus, oraz innych słowników opublikowanych w postaci grafu RDF/SKOS jako Linked Open Data”.

CIVET pozwala także na odnalezienie i powiązanie w nazwisk osób oraz nazw miejsc i wydarzeń. Używa do tego celu inne źródła LOD, takich jak DBpedia lub GeoNames, aby przypisać pojęcia do tych nazwisk i nazw. Dzięki temu zwykły tekst staje się dokumentem RDF ze słowami kluczowymi, frazami i nazwami oraz nazwiskami odnoszącymi się do pojęć Linked Open Data.

Jedną z kluczowych zalet CIVET jest to, że działa nie tylko z angielskimi tekstami, ale jako jeden z nielicznych pozwala na pracę w języku polskim. Jego architektura umożliwia rozszerzenie funkcjonalności na inne języki.

Dr Sebastian Kruk tłumaczy, że „CIVET używa grafu opisującego poprzednio analizowane teksty aby rekomendować dokumenty podobne do obecnie analizowanego tekstu. Używamy tej właściwości do budowania indeksu semantycznego (który niedługo zostanie uruchomiony) i silnika rekomendacyjnego dla polskiej blogosfery”.

Załączniki

d0e0b9c7f3f82ae71b11fbfe3197500a (10 kB)

CIVET – od kontentu do Linked Open Data

Załączniki

Napisane przez Chilli Public Relations

Nagradzany czeski film „Dyrygent” wchodzi do polskich kin. Pokazuje milczenie młodych w sytuacjach przekraczania granic

Znamy laureatów MocArtów RMF Classic 2025!

Paryski klimat w sercu Bydgoszczy. Galeria Pomorska zaprasza do świata „Emily w Paryżu”

Wystartowała siódma edycja konkursu Design by Śliwka Nałęczowska 2026 pod hasłem: „Śliwka Nałęczowska – na małe i wielkie chwile”

Gen Z wchodzi w dorosłość bez instrukcji obsługi ubezpieczeń. Nowe badanie pokazuje lukę kompetencyjną między wiedzą a praktyką

Zyxel Group w ścisłej światowej czołówce rankingu S&P Sustainability Yearbook 2026

INWESTUJĄCE KOBIETY. JAK APLIKACJE INWESTYCYJNE WSPIERAJĄ RÓWNOŚĆ FINANSOWĄ?

Europejskie centra obsługi stawiają na konsolidację i więcej AI

Zyxel Networks rozszerza ofertę produktów zgodnych z OpenWiFi o cztery punkty dostępowe WiFi 7 dla ISP

Diamenty Forbes 2026 pokazują, gdzie dziś rodzi się wzrost. Dane i analityka jako fundament rozwoju firm

Unia Europejska wspiera budowanie biblioteki semantycznej

Nowy biurowiec już działa

Załączniki

Zaloguj się

Zaloguj się

Nie pamiętasz hasła?

Link do zmiany hasła jest nieprawidłowy lub wygasł.

Zaloguj się

Polityka Prywatności

Dodaj do kolekcji

Brak kolekcji