Recensioni

L'Eleganza matematica dietro l'apprendimento delle macchine

Copertina del libro Perché le macchine imparano
di Alessandro Frandi

Nel luglio del 1958, il New York Times annunciava la nascita di un "computer elettronico che si prevede sarà in grado di camminare, parlare, vedere, scrivere, riprodurre sé stesso ed essere consapevole della propria esistenza". Quell'annuncio, intriso di un’iperbole che oggi definiremmo imbarazzante, riguardava il Perceptron di Frank Rosenblatt. Il saggio “Perché le macchine imparano” (Apogeo) di Anil Ananthaswamy parte da questo momento storico per smontare il misticismo dell'Intelligenza Artificiale e rivelare l'elegante architettura matematica che permette oggi a sistemi come i Large Language Models (Llm) di funzionare 

Pubblicato il

Il volume “Perché le macchine imparano” (Apogeo) dedica un approfondimento cruciale alle radici biologiche e logiche del machine learning. L’autore, Anil Ananthaswamy, traccia un parallelo affascinante tra l’imprinting studiato da Konrad Lorenz e la capacità delle macchine di individuare modelli. Come gli anatroccoli riescono a formare nozioni astratte di somiglianza e dissomiglianza dopo una brevissima esposizione a stimoli sensoriali, così i ricercatori di AI hanno cercato di replicare questa efficienza algoritmica nei dati. Il primo capitolo evidenzia il passaggio fondamentale dal neurone biologico al primo neurone artificiale (o "neurodo"), teorizzato nel 1943 da Warren McCulloch e Walter Pitts. Questo modello era basato sulla logica proposizionale: se la somma degli input superava una certa soglia 'θ', il neurone "sparava" un segnale. Tuttavia, come sottolinea l'autore, questo era un dispositivo di puro calcolo e non di apprendimento, poiché i parametri dovevano essere impostati manualmente dall'uomo. 

Il vero punto di svolta, approfondito nella seconda parte del primo capitolo, è il Perceptron di Rosenblatt. A differenza dei modelli precedenti, questo algoritmo era in grado di apprendere i valori dei propri pesi partendo dai dati. L'autore illustra questo concetto attraverso l'esempio della separabilità lineare: immaginate di dover classificare una persona come "obesa" o "non obesa" basandosi su altezza e peso. 

Il Perceptron cerca di tracciare una "linea di separazione" (o un iperpiano in dimensioni superiori) che divida correttamente i dati in due cluster distinti. Attraverso un processo iterativo di "punizione" dell'errore - regolando i pesi e il bias - la macchina converge verso una soluzione che le permette di fare previsioni su dati mai visti prima. Uno dei meriti principali del libro, discusso nel prologo, è la demistificazione della matematica necessaria per comprendere l'AI. Citando Ilya Sutskever di OpenAI, l'autore sottolinea il carattere "miracoloso" della semplicità dei concetti di base: algebra lineare, calcolo infinitesimale, probabilità e statistica. 

Il percorso didattico tracciato dall'indice mostra una progressione rigorosa: il ruolo dei vettori come ossatura della rappresentazione dei dati (capitolo 2); l'ottimizzazione tramite la metafora del "fondo della scodella" (discesa del gradiente) per minimizzare l'errore (capitolo 3); del Teorema di Bayes e della distribuzione gaussiana nella gestione dell'incertezza (capitolo 4).; la rivoluzione della retropropagazione (Backpropagation), l'algoritmo che ha permesso alle reti neurali profonde di superare i limiti storici del Perceptron (capitolo 10). Il testo non è solo un manuale tecnico, ma un invito alla consapevolezza civile. Poiché le macchine oggi prendono decisioni critiche -dall'approvazione di un mutuo alla diagnosi di un tumore - l'autore sostiene che la comprensione del loro funzionamento non possa essere delegata solo agli esperti. 

La struttura stessa del libro riflette il processo di apprendimento di una rete neurale: l'autore adotta una tecnica di ripetizione intenzionale, riformulando concetti e formule in contesti diversi per permettere ai neuroni del lettore di "rafforzare le connessioni" e assimilare la materia. “Perchè le macchine imparano” è un saggio indispensabile che accetta il "disagio intellettuale" della matematica per restituire al lettore una visione lucida sulla tecnologia del futuro. Dalla LeNet per il riconoscimento ottico alla AlexNet, fino ai moderni Llm, il libro offre una bussola per orientarsi in un mondo dove l'Intelligenza Artificiale sta riscrivendo le regole della scienza e della società. 

Titolo: Perchè le macchine imparano 
Categoria: Saggi 
Autore: Anil Ananthaswamy 
Editore: Apogeo 
Pagine: 384 
Prezzo: 27,55 euro