Il tagging modellato

3 luglio 2009

Su Scienza 7 leggo di uno studio italo francese sul tagging che racconta di come i ricercatori abbiano messo a punto un modello che ricrea con sufficiente accuratezza le caratteristiche – già evidenziate in precedenti ricerche – di questo tipo di classificazione di contenuti, come per esempio la legge di Heaps, che similmente a quanto si verifica nei testi, mostra come all’aumentare del numero di tag diminuisce il tasso di introduzione di nuovi tag.

La ricerca è stata pubblicata su PNAS ed è consultabile a pagamento. Fortunatamente ne trovo una copia su HAL, un archivio open access francese gestito dal CNR francese.

E’ bene chiarire che nell’ articolo – tratto quasi integralmente dal comunicato stampa dell’Istituto Nazionale di Fisica della Materia – l’utilizzo del termine “post”, non ha il significato consueto caro a noi blogger ma, come chiarito nel paper, definisce un set di tag utilizzati da un utente per definire un certo contenuto.

In definitiva viene dimostrato che “il processo di social annotation può essere visto come un’esplorazione collettiva ma non coordinata del sottostante spazio semantico (ndr: ovvero dell’insieme di significati che possono essere associati a un contenuto), rappresentato come un grafo, attraverso una serie di cammini casuali.”

Avere un modello che simuli adeguatamente il comportamento reale degli utenti è importante perché permetterà di creare sistemi migliori per combattere lo spam (che si allontana dai modelli individuati) e per catalogare grandi quantità di dati, di affinare i sistemi di ricerca e raccomandazione e di realizzare applicazioni innovative per i social network.

La legge dei tag

11 marzo 2009

Uno degli aspetti più interessanti della folksonomy, la categorizzazione condivisa  e distribuita tramite tag, è che riesce a creare piuttosto rapidamente un set di etichette stabili per ogni contenuto, evidenziato dall’apparire di una legge di potenza: pochi tag sono utilizzati da moltissimi utenti, moltissimi tag sono utilizzati solo da qualche utente. Questo accade a dispetto di diversi  problemi che tale tipo di tecnica comporta: differenze culturali e linguistiche, ambiguità dei termini, acronimi, parole multiple, difficoltà di etichettare dati strutturati come le date, solo per citare i più rilevanti.

Le cause che determinano la stabilizzazione dell’insieme dei tag e l’apparire di una power law non sono del tutto chiare: i sospetti principali ricadono su un possibile background culturale comune agli utenti e soprattutto sul meccanismo di imitazione, che spinge gli utenti a confermare etichette già presenti. Alcune ricerche si spingono ad ipotizzare che la curva di potenza non apparirebbe se non fosse data agli utenti la possibilità di vedere l’ insieme di tag già definito da altri.

Una ricerca appena pubblicata sembra però smentire tale ipotesi: la legge di potenza emerge anche nel cosiddetto blind tagging, il tagging senza suggerimenti dando più credito alla spiegazione sul background comune degli utenti. Ciò che comunque ancora manca, secondo gli autori della ricerca, è la comprensione dei modelli cognitivi che guidano la capacità di categorizzazione umana, ed in particolare quella tramite il tagging.

web-20.jpg

La sensazione che ho provato leggendo Web 2.0. Internet è cambiato. E voi? I consigli dei principali esperti italiani e internazionali per affrontare nuove sfide” (a cura di Vito Di Bari, Edizioni Il Sole 24 Ore, 2007) è stata quella di trovarmi di fronte un feed RSS cartaceo. Non è un’affermazione con connotazioni negative. E’ solo che ormai la mia percezione delle cose nella realtà fisica viene influenzata dalle mie esperienze online. E comunque visto l’argomento e la struttura del libro non escludo sia un effetto voluto.

Un libro è un collage, realizzato da quarantasei esperti nazionali ed internazionali, ricco di pensieri, analisi, case studies, considerazioni (anche critiche) sullo stato dell’arte del Web attuale e sulle possibili evoluzioni della Rete nel prossimo futuro. Ottimo per chi, nativo analogico o immigrato digitale appena sbarcato nell’Altro Continente, vuole conoscere quel grande esperimento sociale (e tecnologico) di massa che è il Web 2.0. Un rapporto ricco di spunti interessanti per i cittadini proattivi (professionisti, manager, imprenditori, investitori, esperti di comunicazione e di media) del reame digitale.

Tra le tante possibili definizioni di questa fase della vita di Internet, Di Bari nella sua lunga introduzione ne sceglie una sintetica ma particolarmente efficace:

[il Web 2.0 è] un insieme di relazioni indirizzate e organizzate tra loro mediante strumenti (tecnologici) [...] disponibili a tutti e legati tra loro.

Tra i molti contributi interessanti — che compensano ampiamente qualche intervento banale o confusionario (come quello, persino irritante, dell’ex vj di MTV Andrea Pezzi) — ne indico solo qualcuno.

Il divertente ed istruttivo intervento di Stefano Quintarelli sui blog, che, come si legge in una nota finale:

[...] è stato scritto mimando nell’esposizione dei contenuti l’esposizione cronologica di un blog: leggendo i suoi capoversi dalla fine all’inizio si passa dal contenuto più puntuale alle considerazioni più generali.

L’articolo di Luca Rosati su folksonomie e tagging, quello di Antonio Dini su Second Life e l’ “antropologia del Learning 2.0″ che Michael Wesch illustra prendendo spunto dalla citaziione di Kevin Kelly:

Ogni volta che creiamo un link tra parole, di fatto insegniamo un’idea.

Menzione d’onore per il mini saggio di Alberto Abruzzese sulla condivisone. Cosa significa “condivisione”? Significa:

[...] avere in comune. Come dire, fare società o comunità? Sì e no: con condivisione diciamo qualcosa di più intimo, qualcosa che riguarda le modalità specifiche, profonde, con cui si costruiscono comunità e società. [...] Cè di mezzo il dia-logare. Allora c’è di mezzo la comunicazione? Per forza. La condivisione è un sinonimo di comunicazione.

Di Bari si riserva il capitolo finale, in cui getta uno sguardo al web del 2015 e 2020: il primo caratterizzato da una coda ancor più “lunga” di quella di Anderson, la longer tail, che coinvolgerà i miliardi di persone che non hanno l’inglese come lingua madre. Intercettare le innumerevoli nicchie che accolgono lingue, culture e stilemi diversi da quelli oggi dominanti rappresenterà l’obbiettivo strategico del futuro prossimo del web. Più in là, una realtà fatta di uomini e spimes sempre più connessi ed interconnessi genererà un coda ancor più lunga, una longest tail.

Una notazione finale: strano che in questa raccolta manchi un contributo dedicato al semantic web.

Type-to-tag o click-to-tag?

13 novembre 2007

Il tagging è un’attività che richiede un certo sforzo cognitivo. Quando devo etichettare un post od una notizia per del.icio.us, quando su Anobii devo trovare i tag che possano “descrivere” un libro che ho letto svolgo un esercizio mentale.

Devo rileggere, rielaborare, sintetizzare e quindi filtrare mentalmente i contenuti che ho letto per ottenere le parole chiave, le “pennellate” di significato che tratteggiano e riassumono l’unità informativa di livello superiore. Questa pratica, oltre che portare benefici di ordine sociale, favorendo la condivisione della conoscenza, aiuta anche, proprio come effetto collaterale del nostro sforzo, ad organizzare e memorizzare meglio le informazioni, inserendole in modo più efficace nella nostra architettura mentale.

Il tagging ha però un costo legato all’interazione, alla necessità di digitare le parole che abbiamo eletto a tag. Cercare di minimizzare questo costo (fastidio, se volete) può portare benefici alla collettività, inducendo sempre più individui ad esercitare questa pratica.

Questo è il motivo per cui è stato sviluppato Click2Tag, un sistema molto semplice per effettuare il tagging sviluppato al Palo Alto Research Center (PARC) dall’Augmented Social Cognition Research Group durante la progettazione di un nuovo sistema di social bookmarking denominato SparTag.us. In pratica con la nuova interfaccia cliccando sulle parole del testo promosse a tag esse verranno automaticamente inserite nell’elenco delle parole chiave.

I ricercatori del gruppo si sono però chiesti se questo automatismo non attenuasse i benefici cognitivi di cui ho accennato in precedenza.

Una loro (piccola) ricerca sembra dimostrare che le due diverse tecniche influiscano in maniera diversa, ma sempre positiva, sui processi di memorizzazione delle informazioni

Il tagging by typing è un processo top down che promuove l’elaborazione dei contenuti e favorisce la contestualizzazione delle informazioni apprese all’interno dei propri schemi e categorie mentali.

Il tagging by clicking è un processo bottom-up che, grazie alla ripetuta lettura delle parole rilevanti, permette una più facile memorizzazione “grezza” ed oggettiva delle informazioni, tenendole sostanzialmente slegate dalle proprie ontologie.

Il primo approccio favorirebbe quindi l’organizzazione delle informazioni nel proprio quadro soggettivo, il secondo l’apprendimento guidato dal contenuto.

C’è da notare che spesso i termini più appropriati per rappresentare un testo non sono contenuti all’interno del testo stesso. Quindi la procedura click-to-tag ha una limitazione che il type-to-tag non ha. D’altronde la ricerca ha evidenziato come la procedura più semplice — e veloce — induca ad inserire un numero maggiore di tag per classificare un contenuto.

Scrivendo questo post mi sono tornati in mente i vari sistemi che noi ragazzi, a scuola o all’università, utilizzavamo per studiare e per memorizzare nozioni e concetti attraverso la lettura dei libri di testo.C’era chi sottolineava le frasi più significative (forse analogo, come risultato finale, al click-to-tag?), chi scriveva a latere o sul blocco degli appunti commenti e riflessioni (type-to-tag?) e chi, come me, non scriveva nulla o quasi ma si affidava a letture ripetute con diversi livelli di attenzione e di dettaglio (read-to-tag?)

Creare una tag cloud

14 ottobre 2007

Trovo che la tag cloud sia una delle invenzioni più riuscite del Web 2.0 per la sua efficacia comunicativa e per costruire nuovi sistemi di catalogazione delle informazioni, più liquidi, meno strutturati. Così come piace a David Weinberger…

Cercavo un servizio online che mi consentisse di creare al volo “nuvolette di etichette” a partire da un testo o da una serie di parole.

Ho trovato questi due tools: TagCrowd (essenziale) e Tag Cloud Generator (con più possibilità di personalizzazione)

update nov. 2008: impossibile ora non citare Wordle, un servizio di grande successo che permette di creare bellissime nuvole…

Iscriviti

Ricevi al tuo indirizzo email tutti i nuovi post del sito.