Hakia, domandare è lecito

Hakia è un motore di ricerca meaning based, basato su una teoria linguistica del significato del linguaggio naturale chiamata Ontological Semantics (Ontosem). Le ricerche possono essere effettuate nel modo tradizionale oppure tramite la formulazione di semplici domande, come ad esempio: “La vita intelligente è giunta sulla Terra dallo spazio?”

Che cos’è l’Ontological Semantics?

Si tratta di una teoria che fa parte di quelle discipline note sotto il nome di semantiche linguistiche. In quest’approccio, detto rappresentazionale, l’obbiettivo è lo studio del significato di frasi e testi così come essi sono intuitivamente compresi dagli esseri umani. L’emulazione dei metodi naturali del processo di comprensione avviene attraverso la costruzione di un robusto framework teorico. La risorsa centrale è rappresentata dalla costruzione di un’ontologia che fornisca le chiavi per estrarre e rappresentare il significato da testi in linguaggio naturale.

Come funziona il motore di ricerca?

Gli hakia-Lab ci spiegano che il primo ad entrare in azione è il sistema QDEX™ che – offline – si occupa di analizzare il contenuto di ogni pagina Web e di estrarre da ogni paragrafo tutte le possibili domande (sequenze) che possono essere formulate sulla base del suo contenuto. Questo set di domande diventa il riferimento di quella particolare pagina Web durante l’operazione di recupero delle informazioni, quando cioè un utente formula una domanda. Se pensiamo che da una frase di otto parole è possibile ottenere miliardi di combinazioni comprendiamo come il punto critico sia proprio quello di sfoltire in maniera drastica lo spazio delle sequenze, selezionando solo quelle che hanno “un significato” nel linguaggio naturale. Qui entra in gioco l’ Ontological Semantics; è possibile utilizzare un sistema interattivo per visualizzare alcuni aspetti del funzionamento dell’Ontosem all’interno di Hakia. La densità dei dati risultato dell’elaborazione del QDEX™ risulta essere significativamente più alta rispetto ad una tradizionale index table.

A questo punto entra in gioco l’algoritmo denominato SemanticRank™ che si occupa di classificare i risultati secondo la loro rilevanza rispetto alla domanda posta dall’utente. Per ogni paragrafo viene confrontata la domanda con la combinazione di parole più significativa restituita dal QDEX™. Vengono effettuate analisi morfologiche e sintattiche e viene presa in considerazione anche l’autorevolezza (come?) e l’età della pagina Web. Non sono effettuati confronti tra parole chiave e non viene utilizzata l’algebra booleana.

hakiaSchema

Visualizzazione dei risultati

I risultati vengono visualizzati in diversi modi; per parole singole particolarmente “importanti” o per personaggi famosi i risultati vengono raggruppati in sezioni che cercano di offrire un quadro completo dell’argomento oggetto di ricerca. In questo caso viene anche fornito un indice dei contenuti. In testa ai risultati, quando disponibili, sono presenti delle news fresche di stampa, se mi si passa l’espressione… .Vi è una linea di ricerca che tenta di fornire i risultati all’utente in forma colloquiale.

Valutazione

Ho provato molti motori di ricerca per trovare non dico un’alternativa ma perlomeno un sistema che potesse affiancare ed integrare Google. I risultati sono sempre stati deludenti. Hakia invece mi ha sorpreso. Certo, occorre farne un utilizzo continuativo per un lungo periodo per effettuare una valutazione completa ma i primi test hanno fornito risultati incoraggianti. Ho provato a ripetere ricerche già fatte in passato su Google, ho costruito frasi semplici ed altre più sottili ottenendo voci rilevanti nella maggior parte dei casi. In diversi casi il motore di ricerca riesce a identificare sinonimi e modi di dire risalendo al significato od alla parola effettivamente ricercati. Qui è possibile confrontare al volo i risultati di Hakia e di Google. Per il momento il motore funziona solo con la lingua inglese ma si stanno costruendo ontologie anche per altre lingue.

One thought on “Hakia, domandare è lecito

Lascia un commento

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...