giovedì, febbraio 14, 2008

Open Calais, il web semantico visto da Reuters

Open calaisOpen Calais è un progetto un po' complicato per la maggior parte dei lettori di light tech ma ne sentirete parlare presto, quindi vale la pena di armarsi di pazienza.

Calais è un progetto open source finanziato dalla famosa agenzia di stampa Reuters e realizzato dal team di ClearForest. In soldoni è un progetto gratuito, accessibile e modificabile da chiunque finanziato dall'azienda che ha la maggior influenza sdul panorama mondiale delle notizie.

La differenza tra Calais è gli altri progetti è quella che passa tra il parlare di una cosa (web semantico, rdf et) e il finanziare la ricerca su quella cosa con soldi veri, stabili e votati all'uso reale (dove uso reale può essere anche la prova che quella tecnologia non può fare nulla di buono). Ma andiamo con ordine.

Cosa fa Open Calais?

Dalle Faq del sito: Dal punto di vista di un utente, quando si ha un testo non strutturato semanticamente ma pronto per il web (come un post, una news etc) lo si da in pasto a Calais e il sistema restituisce il testo con i metadati semantici formattati in rdf (quel che succede tecnicamente è un po' più complicato). Per avere un'idea di cosa è il web semantico date un acchiata all'immagine).

web semantico

Per chi volesse qualche informazione ulteriore può visitare una sezione con qualche esempio per capire le potenzialità.
Per capire invece la direzione in cui si sta muovendo il progetto si può consultare la sezione Roadmap - scoprendo purtroppo che l'italiano non sarà supportato almeno per tutto il 2008 :-( -

Per gli sviluppatori infine è disponibile anche una sezione dedicata ed un forum per scambiarsi qualche idea.

Una curiosità: tra le applicazioni più promettenti provenienti dalla community c'è quella scritta in Ruby da Abhay Kumar. E' una form web in cui basta copiare e incollare un testo per vederlo riformattato semanticamente. Si può provare qui.

Rubisti italiani muovetevi!

Nekuia

1 commenti:

Anonimo ha detto...

Presto l’analisi semantica “for free” per il web 2.0 e il content 2.0 anche in italiano e in Italia.
Infatti a breve, sulla falsa riga di Calais, sarà disponibile un servizio “beta” analogo che consentirà gratuitamente di generare metadati semantici sui propri documenti tramite un web service.
Alla base del servizio c’è la tecnologia OpenEyes di Alethes, (http://www.alethes.it), azienda italiana specializzata nel text analytics e content management che ha deciso di rendere pubblica e “utilizzabile” la sua tecnologia, quindi in linea con la scelta di ClearForest, per promuovere l’uso e la diffusione della semantica applicata ai contenuti digitali.
Il servizio sarà disponbibile alla fine di marzo e si partirà con i primi “TAG” che prevedono il riconoscimento di Persone, Luoghi, Aziende, Valute, Date, Espressioni temporali, indirizzi, recapiti telefonici, istituzioni e alcuni “eventi”. A breve verrà resa nota la roadmap di sviluppo del servizio che prevede anche un forum per gli sviluppatori. Su richiesta è possibile richiedere TAG specifici per le proprie esigenze, o consulenze sul text analytics per le proprie esigenze di business. Infine sono previsti innovativi servizi di analisi del testo finalizzati alla ricerca sul web e alla condivisione di informazioni tra i navigatori del web.

Tenete sott’occhio il sito Alethes (http://www.alethes.it) per gli aggiornamenti ed il lancio del servizio.

Scrivetemi per ulteriori informazioni.
Riccardo

Questi sono i miei riferimenti:
r.dimarcantonio@alethes.it
+39 348 1545792