Le persone possono prevedere ciò che scriverai sui social anche se non sei sui social

Ormai molti sanno che viviamo in un’epoca di raccolta dati. Internet e tutte le tecnologie connesse alla rete (dagli smartphone ai nuovi agli elettrodomestici di casa) forniscono ai giganti del web (con Google, Facebook, Microsoft schierate in prima fila), terabyte di dati ogni secondo che rivelano ogni aspetto delle nostre vite.

Sebbene ormai questa sia cosa abbastanza nota, quante persone sono davvero coscienti di quanto questi dati possano rivelare di ciascun cittadino?

La quantità e la qualità dei dati sono così importanti che, oltre ad alimentare un vero e proprio mercato delle informazioni, in cui pacchetti di dati sono poi venduti da un’azienda a un’altra per fini commerciali, alimenta anche un mercato clandestino nel dark web dove tra la moltitudine di dati, quelli riguardanti lo stato di salute delle persone sono quelli più costosi, ancor più di user e password di conti bancari.

Ma non tutti sono interessati ai dati per trarne un profitto, diretto o indiretto.

Sono soprattutto i Governi a essere interessati ad analizzare e “lavorare” i dati raccolti dai grandi giganti del web, poiché da questi possono ricavare un quadro abbastanza preciso di ciascun cittadino.

Che ciò accade sistematicamente e che questa tendenza sia in aumento lo dimostrano i report, pubblicati periodicamente dai vari social, delle richieste di accesso ai dati ricevuti dai vari governi (liste nelle quali è il “democraticissimo e garantista” Governo a stelle e strisce a fare la parte del leone).

In articoli di alcuni anni fa, ho già fornito evidenza di come già solo attraverso i dati raccolti sui social, si può tracciare facilmente il profilo di un’utente individuando con precisione il suo orientamento politico, sessuale, religioso, ecc., in modo rapido e automatizzato.

Negli ultimi anni, sempre più utenti ne hanno avuto abbastanza, limitando il loro uso dei social media o eliminando completamente i loro account, pensando che questo sia sufficiente a sfuggire a questa costante profilazione coatta.

Tuttavia questa non è garanzia di privacy, come ha confermato un nuovo studio compiuto dai ricercatori dell'Università del Vermont di Burlington .

Dai risultati di questo studio è emerso che è molto più facile di quanto sembri capire il carattere, le abitudini e le idee di una persona da una “sorveglianza di seconda mano". Ma di cosa si tratta?

I ricercatori dell'Università del Vermont di Burlington hanno provato a profilare utenti che non avevano più account social, monitorando l’attività e il contenuto di altri utenti a lui collegati. Il loro obiettivo è stato quello di provare a prevedere il contenuto di nuovi messaggi (su Twitter).

Sostanzialmente hanno messo appunto degli algoritmi in grado di anticipare le parole future che un utente avrebbe scritto nei suoi successivi twitter, usando una misura nota come entropia. Più entropia significa più casualità e meno ripetizioni.

Se è vero che qualcosa di simile è già presente nelle “tastiere virtuali” degli smartphone, che spesso “suggeriscono” la parola che vorremmo scrivere ancor prima di digitare la prima lettera, a differenza di questi sistemi già esistenti (che utilizzano le sequenze di parole che abbiamo già digitato in precedenza per fornire il suggerimento), i nuovi algoritmi messi a punto dall’equipe di ricercatori anglo-statunitensi, utilizzano invece le informazioni delle altre persone che sono in contatto con l’utente sotto esame.

Per valutare l’attendibilità della previsione dei nuovi algoritmi, i ricercatori hanno prima esaminato i flussi Twitter di 927 utenti, ognuno dei quali aveva da 50 a 500 follower, prestando particolare attenzione ai primi 15 utenti con cui ciascuno di loro aveva twittato di più. Nel flusso di ciascuno dei 927 individui, hanno calcolato la quantità di entropia (casualità) contenuta nella sequenza di parole. Hanno quindi inserito quel numero in uno strumento, un’equazione, dalla teoria dell'informazione chiamato "disuguaglianza di Fano" per calcolare quanto bene il flusso di dati di una persona potesse predire la prima parola nel suo prossimo tweet. L’accuratezza è stata in media, del 53%, ma la percentuale scendeva nel prevedere ogni parola successiva alla prima.

Una volta ottenuto un parametro di riferimento, hanno calcolato l’accuratezza della previsione in base non solo allo stream dell'utente, ma anche a quello dei 15 contatti più vicini. La precisione è salita al 60%. Quando hanno rimosso il flusso dell'utente dall'equazione, lasciando soltanto i tweet dei contatti, tale cifra è scesa a circa il 57%.

Nello studio pubblicato su Nature Human Behaviour, i ricercatori hanno concluso che osservare i flussi dei contatti di un utente è quasi altrettanto valido, o addirittura meglio che sorvegliare direttamente l’utente stesso.

Con questo studio quindi, non solo si è dimostrata l’attendibilità del famoso adagio “dimmi con chi vai e ti dirò chi sei”, ma addirittura hanno dimostrato che non è necessario sorvegliare una persona per tracciarne il profilo.

È sufficiente “monitorare” le persone, gli amici o gli individui con cui interagisce maggiormente per riuscire addirittura a prevedere le parole che utilizzerà in futuro e dunque, volendo estenderne sommariamente il concetto, sebbene per ora soltanto in modo circoscritto, i pensieri.

Ciò che i tuoi contatti scrivono sui social può rivelare una quantità sorprendente di informazioni su di te.

Sono stati sufficienti solo 10 contatti per superare la precisione predittiva derivante dal proprio flusso Twitter individuale.

Per fare un confronto, la previsione di ciò che qualcuno scriverà basandosi su un assortimento casuale di tweet di estranei produce una precisione massima del 51%. Ciò rappresenta pressoché la stessa prevedibilità (53%) che si ottiene usando i tweet della persona stessa (anche perché c'è molta regolarità nella lingua inglese e in quello di cui parlano le persone.)

“I risultati mostrano quindi che, in linea di principio, si potrebbe approssimativamente prevedere cosa twitterebbe qualcuno che non è nemmeno su Twitter, o su un altro social” ha affermato James Bagrow, uno degli autori dello studio.

È sufficiente scoprire chi sono gli amici di una persona offline e poi trovare i feed di quegli amici sui social.

Come ho già fatto notare in un articolo del 2015 dal titolo “Smartphone o smartspy”, ma molte App (anche quelle preinstallate) richiedono l'accesso a molte funzioni del telefono che non rientrano nella diretta esigenza di quell’applicazione. In particolare molte richiedono accessi alla galleria delle foto, al registro delle chiamate e agli elenchi di contatti.

Oggi sappiamo, a seguito dei numerosi scandali che sono emersi negli ultimi anni, che alcune App, acquisiscono dati per poi condividerli e utilizzarli per profilare l’utente.

Facebook (App spesso preinstallata su tutti i telefoni), ad esempio, ha utilizzato le liste di contatti degli utenti per creare “profili ombra”, vale a dire pagine di persone che non si trovano nemmeno sulla rete.

In altri studi, altri ricercatori hanno già dimostrato come si posano utilizzare i tweet delle persone (o qualunque altro dato messo in rete) per prevedere la personalità, segni di depressione e orientamento politico, religioso e sessuale.

I tweet ipotetici basati sui tweet degli amici, come dimostrato da questa ricerca, potrebbero consentire le stesse conclusioni.

"Abbiamo appena scalfito la superficie di quali tipi d’informazioni possono essere rivelate in questo modo", ha affermato Joanne Hinds, altra coautrice della ricerca.

Ciò che dovrebbe essere preoccupante per tutti in termini di privacy, è che ci sono così tanti modi in cui i giganti del web stanno acquisendo dati, che la possibilità di controllo della popolazione sembra non avere limiti.

La gente non si rende conto di quanto tutto ciò comporti, comporterà (o potrebbe comportare) in termini di minaccia alla democrazia e alla libertà individuale.

Un'altra cosa che le persone non comprendono e non prendono neanche in considerazione, è che quando inseriscono i propri dati, le proprie abitudini ecc, nella rete attraverso la moltitudine di dispositivi “smart” che ormai ci circondano, non solo stanno mettendo a rischio o addirittura rinunciando alla propria privacy, ma stanno compromettendo anche quella dei propri amici.

Ciò che tutti pensano sia una scelta individuale, in realtà in un mondo interconnesso, non lo è.

Stefano Nasetti

© Tutti i diritti riservati. E' vietata la riproduzione, anche solo parziale dei contenuti di questo articolo, senza il consenso scritto dell'autore

Ti potrebbero anche interessare: