Web semantico

Torre di Babele

(leggi il documento del W3c[ i ] in lingua inglese su W3C Semantic Web News)

Il web semantico è nato da un'idea di Tim Berners Lee.

Web semantico

Da Wikipedia, l'enciclopedia libera.

"Con il termine Web Semantico si intende la trasformazione del World Wide Web in un ambiente dove è possibile pubblicare non più solo documenti (pagine HTML[ i ], file office, immagini, file multimediali,...) ma anche informazioni e dati in un formato adatto alla interrogazione, interpretazione e, più in generale, elaborazione automatica.

Per la sua costruzione/definizione si utilizza l'XML[ i ] che, lo ricordiamo, consente di descrivere semanticamente (e con il dettaglio desiderato) le diverse parti di un documento. Un documento così descritto può poi essere elaborato per usi diversi: estrazione di informazioni secondo specifici criteri, riformulazione più o meno parziale per adattarlo ad altri formati, visualizzazione in funzione delle capacità del terminale."

Se vuoi approfondire http://it.wikipedia.org/wiki/Web_semantico



Il web semantico è un'estensione dell'attuale web, nel quale l'informazione è data ben definita, permettendo a computer e persone di lavorare in una migliore cooperazione. Il web semantico permetterà ai dati presenti sul web di essere definiti e collegati in un modo tale da essere utilizzati da macchine non solo per visualizzare, ma anche per un'automazione, integrazione e riutilizzo dei dati fra varie applicazioni. Le organizzazioni che adottano elementi del web semantico saranno in grado di aumentare il loro pubblico allorquando questa nuova tecnologia sarà sviluppata.



Cenni sul semantic web

Articolo tratto dal libro, di Domenico Capano "E-Learning: un esperimento via web su corsi di Fondamenti di Informatica. Progettare in modalità elearning con focus sul discente" Il download del libro è effettuabile sito: www.comunedasa.it/elearning/index.asp

Ogni giorno milioni di persone nel mondo accedono ai siti web per cercare informazioni. Per la presenza, nei server della rete[ i ] delle reti (Internet), di miliardi di pagine web indicizzate attraverso gli spider dei motori di ricerca, sta diventando complicato ottenere in breve tempo e senza ambiguità le informazioni cercate.
Il web attuale basato sull’HTML pone notevoli problemi di “rumore”, quando si devono cercare informazioni nel web attraverso i motori di ricerca, essendo notevole la quantità di pagine create e visitabili attraverso la rete Internet, ed ambiguo il significato di alcuni termini che utilizziamo per la ricerca. Ad esempio se volessimo cercare il termine “Aida” inteso come l’aria del compositore Giuseppe Verdi, non vi è modo per i motori di ricerca, (così come oggi sono organizzate le pagine web e che in genere basano la ricerca su delle parole chiave da confrontare con quelle introdotte nelle pagine web dai progettisti), di effettuare tale ricerca in modo univoco. In generale ci forniscono delle pagine non pertinenti (rumore) in quanto le macchine non comprendono se ci si riferisce con Aida ad un nome comune od all’opera del compositore Verdi o ad altro.

Con il web semantico ci si propone principalmente di superare tali problemi oltre che di avere dati sul web definiti e collegati in modo che possano essere utilizzati per l’automazione, l’integrazione ed il riutilizzo attraverso varie applicazioni.

Tim Berners-Lee il creatore del web semantico lo definisce come «un’estensione del web attuale in cui alle informazioni sono date un senso, un significato ben definito, migliorando in questo modo la cooperazione tra i computers e le persone (marzo 2001)».

Corrado Petrucco pensa al web semantico «come l’evoluzione di Internet da semplice sistema di recupero di documenti, ad un sistema “intelligente” in cui l’informazione sarà compresa da specifici software in grado di assistere l’utente a localizzarla e a rielaborarla in modo personalizzato e adattato alle proprie esigenze.

L’e-learning ed anche la didattica tradizionale dovranno necessariamente tenerne conto, proprio per i vantaggi che questa flessibilità può fornire al processo d’apprendimento».

Il web semantico deve avere tre livelli fondamentali; al livello più basso vi sono i dati (“learning objects”), poi vi sono i metadati che riportano questi dati ai concetti di uno schema (schema che è l’ontologia), nell’ontologia si esprimono le relazioni fra i concetti, che diventano classi di dati. Per integrare la semantica nel web si utilizzano principalmente le annotazioni. Esse rappresentano un sistema per descrivere il contenuto di una risorsa web, rappresentando un metodo per inserire od associare metadati ad una risorsa. Le annotazioni sono in grado di stabilire delle relazioni tra un oggetto esistente e la classe di una ontologia, attraverso la dichiarazione di triple (oggetto, concetto, attributi) in linguaggi basati sullo XML (RDF[ i ]: Resource Description Framework, RDFschema, DAML+OIL, OWL: Web Ontology Language).

Prima di trattare brevemente dei linguaggi del semantic web, rileviamo che un URI serve ad identificare gli oggetti e/o risorse mentre la URL (Uniform Resource Locator) identifica e localizza una risorsa. In generale un URI non dà istruzioni al computer su come trovare una risorsa dà ad esso maggiori informazioni su una risorsa. Ad esempio con http://www.comunedasa.it/mimc/index2.asp si indica un URL che identifica e localizza la risorsa “home page del mio sito web”.

Il linguaggio XML, la cui prima bozza è del 1996, è un linguaggio di Markup[ i ] pensato per scambiare in modo semplice documenti via web; consente a chiunque di progettare il proprio formato dei documenti e di scrivere poi in quel formato. Le componenti di XML sono: il contenuto (XML); le specifiche che riguardano gli elementi ossia la struttura (DTD[ i ], Document Type Definition o XMLSchema) e le specifiche che riguardano la visualizzazione ossia lo stile (XSL eXtensible Style Language).

Vediamo a titolo esplicativo un esempio di contenuto XML: titolo del libro nome dell’autore data pubblicazione codice libro nome editore Un documento o contenuto XML è un insieme correttamente annidato di tag aperti e chiusi (elementi): titolo del libro. In XML gli elementi possono avere un numero qualunque di coppie attributo-valore: Ricordanze della mia vita. Un documento XML che sia sintatticamente corretto è detto ben formato. In XML il namespace è una collezione di nomi identificati da URI. Il W3C (World Wide Web Corsortium) attraverso il gruppo Web-Ontololy (WebOnt) con una Reccomendation del 14 febbraio 2004 crea il linguaggio OWL (Web Ontology Language) basato sui linguaggi DAML+OIL. OWL è il linguaggio su cui sta convergendo la comunità scientifica del settore per descrivere le ontologie in quanto si propone adatto a superare i problemi dei precedenti linguaggi.