8 stycznia 2003 Od metadanych do inteligentnego Internetu Mariusz Olko [email protected] 1 Metadane Informacja o informacji (sic!) Rnorakie informacje o dokumencie Data utworzenia Sowa kluczowe Autor Schemat bazy danych Powizania klucz gwny/klucz obcy Typy i rozmiary pl
Wizy integralnoci 2 Skd si bior metadane? Zdania wypowiedzianie (zapisane) niezalenie od dokumentu Wyrnione elementy w dokumencie
Pan Tadeusz 3 Zdania o dokumencie
http://www.empolis.pl/dok.htm ma autora o nazwie Mariusz Olko Podmiot subject Orzeczenie predicate Dopenienie object autor http://www.empolis.pl/dok.htm Mariusz Olko 4 Resource Description Framework
Zdania s zapisane w postaci trjek (subject, predicate, object) Podmiotem (subject) w trjce s zasoby (resources), ktre Mog by adresowalne w internecie np. dokument HTML Mog te oznacza koncepty abstrakcyjne np. osob lub dziedzin sztuki Predykat w trjce jest zawsze konceptem abstrakcyjnym okrelajcym wasno Dopenieniem trjki moe by Inny zasb abstrakcyjny lub rzeczywisty Bd te litera czyli napis nie podlegajcy interpretacji w ramach RDF 5 Universal Resource Identifier Zasoby s identyfikowane przez URI URI nie musi by URL, tzn. nie musi oznacza lokalizacji internetowej http://www.w3.org/1999/02/22-rdf-syntax-ns#label
Indetyfikator przestrzeni nazw Nazwa lokalna Uywajc przestrzeni nazw w serializacji XML mona zdefiniowa prefix rdf dla URI przestrzeni nazw http://www.w3.org/1999/02/22-rdf-syntax-ns# Zapisa pene URI zasobu w postaci skrconej rdf:label 6 Interpretacja trjek RDF Zbir zda RDFowych reprezentuje graf skierowany Wzy z ktrych wychodz uki reprezentuj zasoby uki reprezentuj wasnoci kompozytor Symfonia 8
L. Van Beethoven utwr dyrygent Pyta DG-439005-2 H. Von Karajan Specyfikacja RDF definiuje sposb serializacji grafu do XMLa Grafy RDFowe mona w sposb prosty czy 7 Narzdzia do modelowania RDF definiuje podstawowy zestaw poj, ktry moe by uyty do modelowania informacji i budowy ontologii Wasnoci dotyczce zasobw label (krtka etykieta nadana zasobowi) description (duszy opis zasobu)
type (okrelenie typu zasobu) Wasnoci dotyczce klas subClassOf (podzia klasy na podklasy) Wasnoci dotyczce wasnoci subPropertyOf domain (klasa obiektw, ktre mog by podmiotem zda z danym predykatem) range (klasa obiektw, ktre mog by dopenieniem zda z danym predykatem) 8 Inferencje w RDFach Nadanie interpretacji jzykowi oraz predykatom sucym do budowania modeli pozwala na skonstruowanie regu zwanych reguami inferencji. Regua dotyczca podklas Jeeli A jest podklas B i a jest obiektem typu A To a jest te obiektem typu B (A, rdfs:subClassOf, B) (a, rdf:type, A)
=> (a, rdf:type B) 9 Reguy inferencyjne Regua dotyczca podwasnoci Jeeli P jest podwasnoci B i zachodzi (a, P, b) To zachodzi te (a, R, b) (P, rdfs:subPropertyOf, R) (a, P, b) => (a, R, b) Regua dotyczca dziedziny wasnoci Jeeli dziedzin P jest klasa A oraz a ma wasno P o dowolnej wartoci To a jest typu A (P, rdfs:domain, A) (a, P, x) => (a, rdf:type, A) 10
Reifikacja Nie mona w prosty sposb wypowiada zda na temat innych zda! Aby mona byo si wypowiedzie na temat jakiego zdania, musi ono zosta zreifikowane tzn. zamienione na zestaw zda (metazda) Prawdopodobiestwo faktu, e 9 stycznia bdzie temperatura 20 stopni celsjusza jest bliskie zeru 0,01 subject Dzie 9/01/2004 prawdopodobiestwo object predicate Temperatura 11
20 stopni Dublin Core Dublin Core Metadata Initiative (DCMI) jest organizacj ktrej celem jest promowanie stosowania standardw metadanych i rozwj specjalizowanych sownikw poj do opisu zasobw Zdefiniowane zostay podstawowe i rozszerzone sowniki poj Okrelono standardy uycia np. w HTMLowych tagach META Okrelono schematy zapisu metadanych w postaci grafw RDF Namespace URI http://purl.org/dc/elements/1.1/ 12
Sownik poj Title Creator Subject Description Publisher Contributor Date Type Format Source Language Rights RDF Site Summary (RSS) Powsta dla potrzeb portalu my.netscape.com syndykacji informacji XMLowa lista hiperczy do zasobw internetowych razem z metainformacjami dotyczcymi tych
zasobw Zazwyczaj pliki RSS s pobierane przez programy agregujce przetwarzane i wywietlane jako hiperlinki do oryginalnych zasobw Listy mog zawiera: Wiadomoci z ostatniej chwili List ostatnich wpisw w blogu lub najnowszych artykuw w serwisie List ofert pracy Wyniki poszukiwa Namespace URI http://purl.org/rss/1.0 13 Sownik poj Channel Item Title Description
RSS example 14 Friend-Of-A-Friend (FOAF) W jaki sposb jednoznacznie zidentyfikowa osob? Uy jej adres email! Osoby publikuj swoje pliki FOAF Pliki mog zawiera informacje np. nt. miejsca pobytu projektw na ktrych pracuj osb ktre znaj Roboty lub aplikacje agreguj informacje z wielu rde Zagregowane informacje mog zosta wykorzystane do prezentacji np. Kogo ze znajomych mog spotka w miecie w ktrym odbywa si
konferencja na ktr jad? 15 Sownictwo Agent Person name nick Mbox knows depiction publications homepage organization group project http://xmlns.com/foaf/ 0.1/
czenie grafw RDFowych name name "M. Olko" mbox mbox Jan Kowalski [email protected] [email protected] knows contact:nearestAirport mbox [email protected]
airport:iataCode WAW 16 czenie grafw RDFowych Warto wasnoci mbox indentyfikuje jednoznacznie osob! name name "M. Olko" mbox mbox Jan Kowalski [email protected]
[email protected] knows contact:nearestAirport mbox [email protected] airport:iataCode WAW 17 czenie grafw RDFowych Warto wasnoci mbox indentyfikuje jednoznacznie osob! name mbox "M. Olko" [email protected]
knows name mbox Jan Kowalski [email protected] contact:nearestAirport airport:iataCode WAW 18 OWL Web Ontology Language 19 Sownictwo OWL Definicja klasy
owl:oneOf przez wyliczenie przynalenych instancji owl:restriction i owl:onProperty przez podanie ograniczenia na wasnoci instancji owl:allValuesFrom wszystkie wartoci wasnoci s w podanej klasie owl:someValuesFrom przynajmniej jedna w wasnoci jest w podanej klasie owl:minCardinality i owl:maxCardinality Przez wykonanie operacji teoriomnogociowej na innych klasach owl:intersectionOf owl:unionOf owl:complementOf 21 OWL sownictwo owl:sameAs stwierdza tosamo dwch obiektw owl:equivalentProperty
ta sama dziedzina i ten sam zakres mog mie cakowicie inne znaczenie Owl:TransitiveProperty przechodnio wasnoci Owl:FunctionalProperty Wasno P, ktra moe mie tylko jedn unikaln warto dla kadej instancji obiektu Inaczej jeeli dwa obiekty maj jako t sam warto P to oznacza, e obiekty s tosame owl:differentFrom Dwa URI odnosz si do dwch rnych bytw 22 OWL - trzy poziomy jzyka OWL full Pozwala miesza sownictwo RDFSchema oraz OWL Pozwala na dowolno w opisywaniu obiektw, klas i wasnoci OWL DL Stawia ograniczenia na uywanie sownictwa RDFSchema
Wymaga rozdzielenia klas, wasnoci, instancji Pozwala na zastosowanie istniejcych ju silnych narzdzi do wnioskowania opartych na Description Logic OWL Lite Stawia te same ograniczenia co OWL DL na uycie sownictwa RDFSchema oraz na rozdzielenie klas, wasnoci i instancji Wybiera prosty podzbir sownictwa umoliwiajcy atwy start uytkownikom oraz zapewniajcy prostot implementacji narzdzi 23 Semantic Web "The Semantic Web will bring structure to the meaningful content of Web pages, creating an environment where software agents roaming from page to page can readily carry out sophisticated tasks for users." Scientific American, May 2001 Internetowa infrastruktura publikacji danych neutralna (niezalena od aplikacji) umoliwiajca przetwarzanie informacji przez programy w celu
automatyzacji agregacji wielokrotnego uycia 24 Semantic Web - aplikacje Poprawienie jakoci wyszukiwania informacji Umoliwienie wyszukiwania usug sieciowych Automatyzacja czynnoci codziennych Rezerwacja wizyty u lekarza, w urzdzie Przygotowanie podry Uwaga To jest cigle wizja Technologie si pojawiaj ale Zdania nie oznaczaj faktw URI nie identyfikuj bytw rzeczywistych Potrzebna jest kodyfikacja wiedzy codziennej Pojawiaj si problemy zwizane z etyk oraz bezpieczestwem
25 Projekt SWAP Kombinacja dwch techonologii Peer-to-Peer Semantic Web Zarzdzanie informacj i wiedz w rodowisku rozproszonym Konwencjonalny systemy zarzdzania wiedz Trudne w obsudze Narzucaj wasne widzenie wiata (ontologie) Wymagaj "oddania" dokumentw Systemy peer-to-peer Duo efektywniejsze w wymianie informacji Wyszukiwanie informacji jest zbyt proste - sowa kluczowe Nie umoliwiaj dzielenie si "wiedz" (ontologiami) 26 Korzyci pynce ze SWAPa
Think big! Start small! Grow step by step! Benefit SWAP System P2P based KM System Sophisticated, but conventional KM System Investment 27 Scenariusz Ontologia jest budowana ze struktury informacji przechowywanych na
komputerze takich jak: Dokumenty Bookmarki Poczta Zostaj automatycznie sklasyfikowane i udostpnione innym uytkownikom Uytkownicy mog podawa zapytania dotyczce ontologii przechowywanej w wle Komputer moe gromadzi "wiedz" przechowywan na innych wzach poprzez intergracj wynikw zapyta Uytkownicy mog pobiera dokumenty zgromadzone na odlegych wzach 28 SWAP Architecture Informer
Local Node Repository (Adapter) User Interface Advertisement Discoverer Visualizer Query Query Formulator SWABBI Edit Query Replier Knowledge Source Integration
Query Rewriter Ontology Merger Answer Peer Selector Metadata Integrator Communication Adapter Ontology Integrator Message Request Resource Statements Ontology Extractor Resource Retrieval
Knowledge Sources External Knowledge Source Adapter Resource Sharing 29 JXTA Network Referencje Resource Description Framework Resource Description Framework na serwerze W3C OWL Web Ontology Language Strony inicjatych opartych o RDF Inicjatywa Dublin Core Projekt Friend-Of-A-Friend Artykuy
Scientific American nt. Semantic Web Tutorial RSS 30