DarkBERT: l'arma AI nella lotta alla cybercriminalità
Un modello di linguaggio avanzato addestrato sul dark web promette di rivoluzionare la difesa contro le minacce informatiche
Il settore dell'intelligenza artificiale (AI) ha registrato una crescita impressionante negli ultimi mesi, con i modelli di linguaggio di grande dimensione (LLM) che si fanno largo sulla scena. Il caso emblematico è ChatGPT, un chatbot AI, capace di generare contenuti di vario genere - testi, immagini, audio - grazie all'analisi di un database esistente e all'apprendimento di specifici schemi. Questi strumenti sono stati usati per generare contenuti tramite AI generativa, ma ora i ricercatori hanno sviluppato un LLM unico nel suo genere, pensato per valutare e contrastare le minacce alla cybersecurity. Curiosamente, questo modello è stato addestrato solo su informazioni provenienti dal dark web.
DarKBERT: un nuovo modello per combattere la cybercriminalità
DarkBERT è un modello di codifica che si basa sull'architettura RoBERTa. A differenza degli altri modelli, DarkBERT non è stato addestrato sul web in senso generale, ma su un vasto database di pagine del dark web, integrando informazioni provenienti da fonti internet criminali come forum di hacker e siti di truffe. I suoi creatori, in un articolo intitolato "DarkBERT: a language model for the dark side of the internet" pubblicato su arxiv.org, affermano che DarkBERT può rivoluzionare la lotta alla cybercriminalità, individuando e analizzando le aree più nascoste della rete, non rilevabili dai motori di ricerca.
Il processo di creazione di DarkBERT
Il dark web è normalmente nascosto e inaccessibile al pubblico generale, ma i ricercatori hanno utilizzato la rete Tor per accedere e raccogliere dati dalle sue pagine. Questi dati sono poi stati sottoposti a vari processi, come la deduplicazione, l'equilibrio delle categorie e la pre-elaborazione, per creare un database raffinato del dark web. Questo è stato infine alimentato a RoBERTa, portando alla creazione di DarkBERT in un periodo di 15 giorni.
Le potenziali applicazioni di DarkBERT nella cybersecurity
Addestrato su un database di pagine del dark web, DarkBERT può avere un'ampia gamma di applicazioni nel campo della cybersecurity. Può monitorare le attività illecite e rafforzare le misure di sicurezza cibernetica. Secondo i ricercatori, può "contrastare l'estrema diversità lessicale e strutturale del Dark Web che può essere dannosa per la costruzione di una rappresentazione adeguata del dominio". DarkBERT può automatizzare il monitoraggio dei forum del dark web, dove vengono solitamente condivise informazioni illegali, rilevare siti web che diffondono dati sensibili o riservati e che vendono ransomware. Inoltre, utilizza la funzione "fill-mask" del modello di linguaggio della famiglia BERT per rilevare e filtrare le espressioni legate alle attività criminali, contribuendo così all'identificazione e alla gestione delle nuove minacce informatiche.
Seguici su Instagram per altre pillole come questa20/06/2023 07:55
Marco Verro