Come Facebook utilizza l’IA per scoprire chi inganna

L’azienda sta rivelando i dettagli su come usa l’apprendimento automatico per combattere i truffatori che utilizzano account falsi per diffondere spam, collegamenti di phishing o malware. 

di Karen Hao

Nel 2019, Facebook ha registrato in media quasi 2 miliardi di account falsi al trimestre. È un business redditizio che può essere devastante per tutti gli utenti che cadono nella trappola. Il gigante della tecnologia distingue tra due tipi di account falsi. 

In primo luogo ci sono “account classificati erroneamente dall’utente”, profili personali di aziende o animali domestici che vengono interpretati come pagine Web. Le violazioni degli account, invece, sono molto più serie. Si tratta di profili personali che coinvolgono truffe e spamming o che infrangono in altro modo i termini di servizio della piattaforma. È necessario rimuovere gli account violati il più rapidamente possibile prima che si diffondano e impadroniscano anche di account reali.

Per fare ciò, Facebook utilizza regole codificate a mano e machine learning per bloccare un account falso prima che venga creato o prima che diventi attivo. In altre parole, prima che possa danneggiare gli utenti reali. Il problema è se un account falso diventa operativo. Il rilevamento diventa molto più complicato. Il nuovo sistema di apprendimento automatico, noto come Deep Entity Classification (DEC), vuole risolvere queste situazioni.

Andando in profondità

Il DEC differenzia tra utenti falsi e reali in base ai loro schemi di connessione attraverso la rete. Chiama queste “caratteristiche profonde” e includono aspetti come l’età media o la distribuzione di genere degli amici dell’utente.
Facebook utilizza oltre 20.000 funzioni profonde per caratterizzare ciascun account, fornendo un’istantanea di come i singoli profili si comportanoper rendere difficile agli attaccanti cambiare tattica.

Il sistema si avvia utilizzando un numero alto di etichette a bassa precisione generate automaticamente, rispettando un mix di regole e altri modelli di apprendimento automatico che stimano se gli utenti sono reali o falsi. Una volta che questi dati vengono utilizzati per addestrare una rete neurale, il modello viene messo a punto con un piccolo lotto di dati ad alta precisione etichettati a mano, generati da persone in tutto il mondo che hanno una comprensione delle norme culturali locali.

Il sistema di classificazione finale può identificare uno dei quattro tipi di profili falsi: account illegittimi non rappresentativi della persona, account compromessi di utenti reali ormai in mano agli hacker, spammer che inviano ripetutamente messaggi che generano entrate e truffatori che manipolano gli utenti allo scopo di divulgare informazioni personali. Da quando DEC è stato implementato, dice Facebook, il volume di account falsi sulla piattaforma si è attestato intorno al 5 per cento degli utenti attivi mensili.

Le preoccupazioni principali sono legate alle possibili manipolazioni nelle imminenti elezioni presidenziali degli Stati Uniti, in particolare per quanto riguarda i deepfake. A dicembre, il “New York Times” ha riferito di una campagna di disinformazione coordinata che utilizzava deepfake per creare account falsi in massa con immagini di profilo convincenti.

A difesa delle elezioni

Il team di Facebook ha affermato che i tempi della sua uscita sono stati solo una coincidenza. “Si tratta solo di individuare le violazioni in generale; non è specificamente mirato a nessun tipo di tematica elettorale”, afferma Daniel Bernhardt, direttore tecnico del team di Community Integrity di Facebook. Ma il DEC è complementare agli altri tentativi della piattaforma di evitare la falsificazione delle elezioni. Poiché il sistema si basa su funzionalità profonde per classificare ciascun profilo, sarà difficile ingannarlo con i deepfake.

Aviv Ovadya, che ha fondato il Thoughtful Technology Project senza scopo di lucro e studia il design e la governance della piattaforma, afferma che la politica di Facebook volta alla ricerca della trasparenza è encomiabile. “Può essere davvero utile parlare della struttura e dei modi in cui funzionano i sistemi di sicurezza, che possono essere emulati da altre aziende”, afferma Ovadya. “Dato che aziende come Facebook hanno molte più risorse da investire rispetto alle aziende più piccole, è utile condividere questa conoscenza”.

Ma i tentativi di pulizia hanno anche molta strada da fare. Con 2,5 miliardi di utenti attivi mensili, il 5 per cento significa ancora 125 milioni di account falsi. Anche l’apprendimento automatico non riuscirà mai a scovare ogni account falso con la massima precisione. La piattaforma probabilmente dovrà rivolgersi ad altre combinazioni di umani e macchine per ottenere risultati migliori.

Immagine: Ms Tech

(rp)

Related Posts
Total
0
Share