logocalais.gif

Il progetto Calais, patrocinato dalla Reuters e realizzato dalla ClearForest, si propone di fornire una base di sviluppo semplice e versatile per costruire applicazioni in grado di aggiungere ai contenuti del Web un livello di metadati semantici.

Più precisamente:

The Calais initiative seeks to help make all the worlds content more accessible, interoperable and valuable via the automated generation of rich semantic metadata, the incorporation of user defined metadata, the transportation of those metadata resources throughout the content ecosystem and the extension of it’s capabilities by user-contributed components.

Il progetto si compone di tre componenti principali:

  • Il Calais Web Service, che si occupa di generare automaticamente metadati in formato RDF
  • Una serie di semplici applicazioni che servono come punto di partenza per dimostrare le potenzialità di Calais e come stimolo agli sviluppatori per la creazione di nuove applicazioni. Il progetto Calais è infatti completamente gratuito e open. Basta registrarsi e richiedere una developer key per ottenere le API. Una sintetica ma utile documentazione consente di mettersi subito al lavoro per creare applicazioni e plugins per piattaforme di blogging e per CMS
  • Un supporto attivo per gli sviluppatori tramite un forum.

 

Per quanto riguarda il semplice utente l’utilizzo delle applicazioni sviluppate a partire da Calais estremamente semplice: basterà inviare un testo (un articolo, un post, un paper, per ora solo in inglese) per vederselo restituito dopo pochi secondi “rivestito” di uno strato semantico. Cosa succeda esattamente “dietro le quinte” non è ancora chiarissimo. Nelle FAQ viene detto che:

Using natural language processing and machine learning techniques, the Calais web service looks inside your text and locates the entities (people, places, products, etc), facts (John Doe works for Acme Corp) and events (Jane Doe was appointed as a Board member of Acme Corp) in the text. Calais then processes the entities, facts and events extracted from the text and returns them to the caller in RDF format.

Un esempio dell’output ottenibile a partire da un semplice documento HTML dopo la trasformazione operata dal Calais Web Service è disponibile alla fine della documentazione.

Viene anche reso disponibile un viewer molto semplice in grado di visualizzare i metadati semantici di un file RDF , il Calais Document Viewer.

Il progetto, che certamente piacerà a Matteo, è sicuramente interessante. L’iniziativa della Reuters di mettere a disposizione di tutti la sua tecnologia semantica aziendale è una mossa in linea con le filosofie di apertura e condivisione che stanno contagiando sempre più il mondo dell’informazione e dell’IT e consentirà, se intorno a Calais si formerà una nutrita comunità di sviluppatori (magari attirati anche dai contests in programma), di nutrire il Web con un’abbondante iniezione di contenuti ricchi di “semanticità”.

via Smart Mobs

RDFizers

3 febbraio 2008

Dopo la lettura dell’articolo sul semantic web pubblicato sul numero di febbraio di Le Scienze ho iniziato una breve sessione “tematica” di navigazione sul web. Tra le altre cose mi sono imbattuto negli RDFizers. Nati all’interno del progetto SIMILE dell’MIT sono strumenti che consentono la traduzione in RDF di vari formati di dati: quelli che nascono già altamente strutturati come l’Exif delle foto digitali o il MIME dei messaggi email possono venire tradotti in maniera automatica mentre per altri è necessario l’intervento dell’utente.

Lo scopo degli RDFizers — molti dei quali creati da Stefano Mazzocchi — è quello di ampliare la base di risorse RDF nel web fino ad arrivare — insieme ad altre iniziative come quella dei microformati — a quella “massa critica” in grado di favorire lo sviluppo su vasta scala di applicazioni e progetti legati al web semantico.

PEaCE

23 gennaio 2008

marine2md.jpg

Image produced with FoodWeb3D, written by R.J. Williams and provided by the Pacific Ecoinformatics and Computational Ecology Lab (www.foodwebs.org, Yoon et al. 2004)

Ho scoperto l’esistenza del PEaCE Lab (Pacific Ecoinformatics and Computational Ecology Lab) da un post di Sylvie. Si tratta di un istituto di ricerca non-profit fondato a Berkley nel 2004 che si propone di studiare struttura, funzioni e dinamiche delle reti eco/biologiche di organismi, le loro interazioni interne e quelle con l’ambiente esterno. L’approccio metodologico è multidisciplinare ed orientato all’utilizzo di tecnologie informatiche per raccogliere ed analizzare dati sui sistemi ecologici.

Più precisamente:

l’ecoinformatica si riferisce alle tecnologie ed alle pratiche per raccogliere, analizzare, visualizzare, archiviare, recuperare e gestire conoscenze ed informazioni ecologiche

l’ecologia computazionale riguarda tutte quelle ricerche focalizzate su una descrizione quantitativa e sull’analisi dei sistemi ecologici, ricerche che si avvalgono di dati empirici, di modelli matematici e statistici e di tecnologie informatiche

Tra i progetti attualmente aperti due sono particolarmente interessanti:

  • il progetto di ricerca Spire si propone di indagare su come le tecnologie del semantic web (e quindi linguaggi di markup come RDF e OWL) possano essere utilizzate per supportare la scienza in generale e l’ecoinformatica in particolare. L’obbiettivo è quello di creare un framework — ontologie, protocolli, agenti e strumenti — in grado di agevolare e migliorare la ricerca e l’integrazione dei dati e delle informazioni tra i documenti sparsi nel web facendo emergere nuove conoscenze attraverso l’utilizzo, per esempio, di tecniche inferenziali. Direi che in parte il progetto si ricollega a quanto ho scritto nel post della soffitta digitale.
  • Il progetto WoW (Webs on the Web) vuole sviluppare una base di conoscenza web based in grado di descrivere ed analizzare le catene alimentari (o meglio le reti alimentari) dei sistemi ecologici fornendo anche uno strumento per la visualizzazione 3D della rete di relazioni che si viene a creare in un ecosistema (vedi figura).

Oltre sourceforge.net

29 agosto 2007

ITerating è una guida striki-based* per software open source e commerciali. Allo stato attuale contiene quasi 18.000 software, recensiti e giudicati dagli utenti. I contenuti del sito sono sotto licenza Creative Commons ma testi e recensioni rimangono proprietà dei rispettivi autori. Per gestire la mole di informazioni e l’aggiornamento dei dati il software di ITerating utilizza una tecnologia semantica basata su RDF che automaticamente si collega a repositories ed altre fonti informative. Un’ottima interfaccia permette di filtrare e comparare più prodotti, creando una matrice di comparazione personalizzata. E’ possibile abbonarsi ad un feed RSS che tenga aggiornati su determinate categorie di prodotti.

* Uno striki è un wiki strutturato.

[via Tectonic]

Iscriviti

Ricevi al tuo indirizzo email tutti i nuovi post del sito.