In un recente esperimento ChatGPT non è riuscita a vincere nemmeno una partita a scacchi contro un computer del 1977, dimostrando chiaramente i limiti del’AI

L’intelligenza artificiale continua ad evolversi a un ritmo impressionante, lasciando a bocca aperta gli utenti grazie a nuove funzioni che, quasi ogni giorno, incrementano ulteriormente le potenzialità di questi strumenti. Tuttavia, anche i tool più avanzati in certi casi mostrano dei limiti inaspettati e di recente ChatGPT 4o, il modello più evoluto tra quelli sviluppati da OpenAI, è stato battuto a scacchi da un Atari 2600 del 1977.

ChatGPT e i problemi con gli scacchi

L’esperimento in questione è stato documentato dall’ingegnere Citrix Robert Caruso su LinkedIn, dove si vede l’impietoso confronto tra ChatGPT 4o con Atari Chess, un gioco di scacchi pubblicato nel 1979 per Atari 2600.

Si tratta di una disparità tecnologica è abissale che vede da un lato ChatGPT, uno dei più avanzati strumenti AI sul mercato e, dall’altro un programma decisamente primitivo, in esecuzione su un computer che, davvero, rappresenta il passato remoto dell’informatica, un periodo in cui spesso macchine del genere occupavano intere stanze.

Eppure, di fronte a questa tecnologica arcaica, anche ChatGPT ha dovuto gettare la spugna e non solo non è riuscita a vincere nemmeno una partita ma ha mostrato anche delle allucinazioni dopo le sconfitte.

Eppure Atari Chess non è un avversario così temibile e, addirittura, il software pensa solo a una o due mosse in anticipo, utilizzando metodi di calcolo estremamente primitivi. Interessante, invece, il comportamento di ChatGPT durante le partite che nonostante le ripetute sconfitte ha continuato a promettere di migliorare il suo gioco se “avesse ricominciato da capo”.

Nonostante la buona volontà, però, il risultato non è mai cambiato e l’AI ha continuato a commettere errori anche molto gravi, come mosse non consentite e poca attenzione verso il proprio re, nonostante le evidenti minacce di Atari Chess.

Gli scacci come metro di giudizio dell’AI

La capacità di giocare a scacchi è da tempo considerata un punto di riferimento cruciale per l’intelligenza artificiale. Il caso più famoso risale al 1997, quando il supercomputer IBM Deep Blue sconfisse l’allora campione del mondo di scacchi Garry Kasparov, superato da una potenza di calcolo che oggi risulterebbe davvero ridicola ma che, al tempo, fu sufficiente per battere un vero fuoriclasse.

I risultati dell’esperimento di Caruso con ChatGPT e l’Atari 2600, però, non sono un caso isolato e già da diverso tempo gli scienziati stanno testando le capacità dell’AI nelle partite a scacchi. Da questa ricerca emergono dati interessanti con la maggior parte dei modelli linguistici che fa fatica a “comprendere il funzionamento della scacchiera”, a riconoscere le mosse consentite e addirittura a seguire le strategie più semplici, quelle che i più apprendono facilmente sin dalle prime partite.

L’ironia di questa situazione sta nel fatto che ChatGPT possiede una vasta conoscenza scacchistica teorica e il chatbot è, addirittura, in grado di spiegare le teorie di apertura, analizzare partite famose e fornire spiegazioni dettagliate delle regole del gioco.

Tuttavia, quando si tratta di applicare queste conoscenze a una situazione di gioco concreta, il sistema sembra fallire clamorosamente. Questo evidenzia una distinzione fondamentale tra la capacità di memorizzare e richiamare informazioni testuali e la capacità di ragionamento strategico, pianificazione a lungo termine e riconoscimento di pattern visivi in un ambiente dinamico e strutturato come quello degli scacchi.

La debolezza di ChatGPT, dunque, suggerisce che, nonostante la sua sofisticazione linguistica, manca ancora delle capacità di “pensiero” e “comprensione” spaziale e logica necessarie per eccellere in compiti che vanno oltre la semplice elaborazione del linguaggio naturale.