Il tagging modellato
3 luglio 2009
Su Scienza 7 leggo di uno studio italo francese sul tagging che racconta di come i ricercatori abbiano messo a punto un modello che ricrea con sufficiente accuratezza le caratteristiche – già evidenziate in precedenti ricerche – di questo tipo di classificazione di contenuti, come per esempio la legge di Heaps, che similmente a quanto si verifica nei testi, mostra come all’aumentare del numero di tag diminuisce il tasso di introduzione di nuovi tag.
La ricerca è stata pubblicata su PNAS ed è consultabile a pagamento. Fortunatamente ne trovo una copia su HAL, un archivio open access francese gestito dal CNR francese.
E’ bene chiarire che nell’ articolo – tratto quasi integralmente dal comunicato stampa dell’Istituto Nazionale di Fisica della Materia – l’utilizzo del termine “post”, non ha il significato consueto caro a noi blogger ma, come chiarito nel paper, definisce un set di tag utilizzati da un utente per definire un certo contenuto.
In definitiva viene dimostrato che “il processo di social annotation può essere visto come un’esplorazione collettiva ma non coordinata del sottostante spazio semantico (ndr: ovvero dell’insieme di significati che possono essere associati a un contenuto), rappresentato come un grafo, attraverso una serie di cammini casuali.”
Avere un modello che simuli adeguatamente il comportamento reale degli utenti è importante perché permetterà di creare sistemi migliori per combattere lo spam (che si allontana dai modelli individuati) e per catalogare grandi quantità di dati, di affinare i sistemi di ricerca e raccomandazione e di realizzare applicazioni innovative per i social network.
La legge dei tag
11 marzo 2009
Uno degli aspetti più interessanti della folksonomy, la categorizzazione condivisa e distribuita tramite tag, è che riesce a creare piuttosto rapidamente un set di etichette stabili per ogni contenuto, evidenziato dall’apparire di una legge di potenza: pochi tag sono utilizzati da moltissimi utenti, moltissimi tag sono utilizzati solo da qualche utente. Questo accade a dispetto di diversi problemi che tale tipo di tecnica comporta: differenze culturali e linguistiche, ambiguità dei termini, acronimi, parole multiple, difficoltà di etichettare dati strutturati come le date, solo per citare i più rilevanti.
Le cause che determinano la stabilizzazione dell’insieme dei tag e l’apparire di una power law non sono del tutto chiare: i sospetti principali ricadono su un possibile background culturale comune agli utenti e soprattutto sul meccanismo di imitazione, che spinge gli utenti a confermare etichette già presenti. Alcune ricerche si spingono ad ipotizzare che la curva di potenza non apparirebbe se non fosse data agli utenti la possibilità di vedere l’ insieme di tag già definito da altri.
Una ricerca appena pubblicata sembra però smentire tale ipotesi: la legge di potenza emerge anche nel cosiddetto blind tagging, il tagging senza suggerimenti dando più credito alla spiegazione sul background comune degli utenti. Ciò che comunque ancora manca, secondo gli autori della ricerca, è la comprensione dei modelli cognitivi che guidano la capacità di categorizzazione umana, ed in particolare quella tramite il tagging.
Creare una tag cloud
14 ottobre 2007
Trovo che la tag cloud sia una delle invenzioni più riuscite del Web 2.0 per la sua efficacia comunicativa e per costruire nuovi sistemi di catalogazione delle informazioni, più liquidi, meno strutturati. Così come piace a David Weinberger…
Cercavo un servizio online che mi consentisse di creare al volo “nuvolette di etichette” a partire da un testo o da una serie di parole.
Ho trovato questi due tools: TagCrowd (essenziale) e Tag Cloud Generator (con più possibilità di personalizzazione)
update nov. 2008: impossibile ora non citare Wordle, un servizio di grande successo che permette di creare bellissime nuvole…








