Qualità, affidabilità, influenza, etc: nei blog

Nelle settimane passate si è discusso molto, in rete, a seguito di due post di Paolo Valdemarin e Giuseppe Granieri che criticavano l'approccio seguito nel rapporto . La discussione si è sparsa secondo l'usuale andamento epidemico in altri blog (a memoria: Simone Morgagni, Schegge e Riflessi, Remix su Terrorpilot, etc). Io ho partecipato prevalentemente nei commenti. Per deformazione professionale, in tutte le discussioni mi è mancata la bibliografia, le spalle degli eventuali giganti, o nani, che ci hanno già lavorato su queste cose: non sono temi di cui ci stiamo per primi ed improvvisamente occupando in Italia, esiste sicuramente ricerca, e non sarebbe male saperne qualcosa di più. Ho perso quindi solo qualche minuto a guardarmi in giro.

Per esempio, nell'ultimo congresso del W3C c'è stato un 2nd Annual Workshop on the Weblogging Ecosystem, all'interno del quale è stato presentato un lavoro dal titolo "The EigenRumor Algorithm for Ranking Blogs" (Ko Fujimura, che sul tema ha scritto anche altro); e almeno un altro paper è interessante. Nel 1998 Kleinberg ha cominciato a prendere in considerazione il grafo del web per effettuare misurazioni (The Web as a Graph: Measurements, Models, and Methods); ancora, nel 2000 Amento et al. discutevano di autorità e qualità nei siti web (Does" Authority" Mean Quality? Predicting Expert Quality Ratings of Web Documents, SIGIR 2000); i blog sono qualcosa di più specifico, ma certe basi sono simili.

Chiaramente una base sarà l'articolo che descrive il PageRank (almeno nella sua prima versione).

Poi ho trovato un articolo di N. VAn House intitolato "Weblogs: Credibility and Collaboration in an Online World", del 2004; la tesi di D.A.Gibson (Communities and Reputation on the Web); un articolo di Cameron Marlow, "Audience, structure and authority in the weblogcommunity", che immagino sia quello citato da G.G. nei commenti al suo stesso post; sulla reputazione, un articolo forse un po' troppo di ricerca di Goldbeck e Hendler (Accuracy of Metrics for Inferring Trust and Reputation in Semantic Web-Based Social Networks), ed altre cose. Volendo ampliare la visuale, l'International Journal of Scientometrics, Informetrics and Bibliometrics è online. Sono online anche i congressi del W3C, che non ho controllato più di tanto, ma qualcosa di utile ci sarà.

Una sola nota: queste cose non le ho prese dalla blogosfera. Ho cercato usando Google Scholar e Citeseer. Va bene lo stesso? ;-)

UPDATE: dimenticavo l'ottimo blog di Paolo Massa, dottorando che si occupa di social recommender systems.

Venerdì 03 Febbraio 2006 at 11:55 am | | riCercare

sette commenti

remix

Ottimo lavoro.
Adesso devo trovare il tempo di leggere tutto.
Poi, quando ci troveremo di persona alla prossima pizza, ne parliamo a voce.
Grazie!
:-)

remix, () - 03-02-’06 12:52
Simone Morgagni

Grazie per il lavoro di ricerca delle fonti! Io mi sono ora spostato in effetti sull’analisi delle prospettive e dei limiti del web semantico per completare il mio ultimo documento e presto tutto sarà postato sia nel forum che in alcune pagine wiki in collaborazione con Enrico di Schegge e riflessi.
Alcune cose che segnali le ho già trovate via Google Scholar molto più tradizionalmente via biblioteca, ma le altre le segno volentieri e le studio appena posso. Spero di saperti tra i nostri, a breve, quando pubblicheremo i contenuti per la discussione.
Rigrazie e buona giornata…

Simone Morgagni, () (URL) - 03-02-’06 13:57
Enrico Lanzara alias scheggiadipensiero

Noto che con piacere una casuale aggregazione di discussione è diventato un interessante crescita di citazioni e riflessioni. Buono il tuo contributo. Sto predisponendo i documenti con il contributo di Simone per lo spazio forum e wiki. Così chi vorrà potrà nel tempo avere uno spazio per ragionare su questo tema.
Ah! interessante e stimolante il volume di poesie “Verso i bit – poesia e computer” presentato il 31 gennaio scorso.

Enrico Lanzara alias scheggiadipensiero, () (URL) - 05-02-’06 20:07
Dree

ma quindi riassumendo senza andare a leggersi tutto, tu che ne pensi?

Dree, () - 06-02-’06 22:44
matteo fantuzzi

per la peppa… anche io mi ci metto… (spero di capirci)

matteo fantuzzi, (URL) - 07-02-’06 09:56
Vincenzo

Comincio dal facile: Dree, Matteo, il succo è che è complicato fare classifiche sensate. Io personalmente non sono convinto servano; servirebbe di più un buon modo per trovare, per affinità di interessi o altro, ciò che interessa.
Grazie Enrico (doppio grazie), ci vedremo anche con Simone sul wiki.
Remix: davanti alla pizza parlerei d’altro, comunque…

Vincenzo, () (URL) - 07-02-’06 17:31
paolo

Grazie al tuo link ho trovato la discussione. Grazie! E’ una discussione molto interessante. Qui sotto il commento che ho inserito sui blog di paolovaldemarin e giuseppegranieri. Cancellalo pure se pensi che esagerare col copia e incolla sia un male ;-)

——-

“All’inizio di questo post ho linkato sia Grillo che Casaleggio, e non li considero per niente affidabili.”
Una possibilita’ e’ di usare il microformato Votelinks. Con esso puoi esprimere se linki una pagina perche’ l’approvi (rev=“vote-for”), perche’ la vuoi criticare (rev=“vote-against”) o semplicemente come referenze (rev=“vote-abstain”, ad esempio le enciclopedie potrebbero linkare in questa maniera).

E’ evidente che considerando i link come voti (alla pagerank) e’ possibile solo ottenere una lista che cattura l’“attenzione” ricevuta da una certa pagina (ad esempio una pagina molto offensiva potrebbe essere linkata da tanti, cosi’ come i siti dei politici specie sotto elezioni ricevono molti link ma mica tutti sono link di apprezzamento). Viceversa considerando solo i “vote-for” link si potrebbe catturare una lista che rappresenta maggiormente l’“apprezzamento”.

Ho fatto dei test su un grande dataset reale (tratto da Epinions.com) che dimostrano come applicare PageRank sul grafo di tutti i link e applicare PageRank sul grafo dei soli link positivi produce risultati diversi. Essenzialmente una validazione empirica di un fatto intuitivo: attenzione != apprezzamento.
La presentazione (in formato S5) si trova a http://moloko.itc.it/paoloblog/presentat...
html mentre il link all’articolo “Page-reRank: using trusted links to re-rank authority” lo trovi a http://moloko.itc.it/paoloblog/archives/..

Ovviamente il discorso “adozione di un nuovo formato e raggiungimento della massa critica” e’ tutto un altro paio di maniche che lasciamo per qualche altro commento.

Detto questo, io sono per le liste di “authority” personalizzate. Non mi interessa essere 11esimo nella lista globale di tutti i blog nel mondo, preferirei essere nei primi posti delle liste personalizzate delle (necessariamente poche) persone che io stimo. “In the future everyone will be famous to 15 people”, no? ;-)
E poi l’oggettivita’ secondo me e’ una chimera e non puo’ esistere. E’ oggettivamente vero quello che scrive CNN? O AlJazeera? O Indymedia? La domanda non ha senso. Se io mi “fido” (orientato link di fiducia) di Indymedia, mi fidero’ in maniera indiretta di coloro di cui si fida “Indymedia”. Quindi il PageRank personalizzato per me di GWBush e’ probabilmente molto basso. Se uno si “fida” di FoxNews, ad esempio, ricevera’ un PageRank predetto per GWBush probabilmente molto alto. E’ la differenza tra quelle che io chiamo Global and Local Trust Metrics. Chiaramente non ha senso delegare la computazione di una local trust metric ad un ente centralizzato (google, technorati o altro search engine) ma devi far girare la computazione su una macchina sotto il tuo controllo, nel breve futuro probabilmente il tuo cellulare.

paolo, () (URL) - 22-02-’06 16:48
Emoticons

Questa domanda serve per prevenire commenti spam da parte di programmi (chiedo scusa per l'imbecillit della cosa).
 

Mantenere le informazioni personali?
Nascondi email
Note: Tutti i tag HTML eccetto <b> e <i> saranno rimossi dal commento. Puoi inserire link semplicemente scrivendo l'url o l'indirizzo di e-mail.