Chain of Thought (CoT)
Cos'è il Chain of Thougth e come funziona?
Il Chain-of-Thought (CoT) è una tecnica utilizzata nei modelli di intelligenza artificiale, come quelli linguistici, per potenziare le loro capacità di ragionamento e risoluzione dei problemi. In pratica, anziché dare una risposta immediata e diretta, il modello segue una serie di passaggi intermedi che rispecchiano il processo logico di un essere umano quando affronta una questione complessa.
L'idea alla base del CoT è semplice: esplicitare i ragionamenti del modello per ottenere risposte più precise e coerenti, soprattutto quando ci si trova di fronte a problemi che richiedono vari passaggi o concetti astratti, come quelli matematici o linguistici. È come se il modello "pensasse ad alta voce", permettendo di seguire i singoli step che lo conducono alla soluzione finale.
Ad esempio, se viene chiesto di risolvere un problema matematico, il modello non si limita a dare il risultato, ma mostra ogni calcolo e ragionamento lungo il percorso. Questo approccio è particolarmente utile per gestire questioni complesse, migliorando non solo l'accuratezza, ma anche la trasparenza del processo decisionale.
Immagina di chiedere a un modello di risolvere un'equazione matematica. Invece di fornire solo il risultato, il modello spiega passo dopo passo il procedimento, partendo dalla semplificazione dei termini fino al calcolo finale. Questo rende la soluzione più comprensibile e permette di verificare che non ci siano errori logici o di calcolo lungo il percorso.
Un esempio pratico
Per applicare questa tecnica sugli LLM basta aggiungere frasi come "Descrivi il tuo ragionamento in passaggi" o "Spiega la tua risposta passo dopo passo". Queste richieste incoraggiano il modello a scomporre la soluzione di un problema in una serie di passaggi intermedi, invece di limitarsi a fornire direttamente la risposta finale.
Supponiamo che l’utente stia cercando di risolvere un problema complesso che richiede un ragionamento logico.
Prompt
Giulia stende 5 magliette al Sole e queste si asciugano completamente in 1 ora. Supponendo che le condizioni rimangano le stesse, quanto tempo impiegherebbero ad asciugarsi 15 magliette? Spiega il tuo ragionamento passo dopo passo.
Ecco il ragionamento passo dopo passo seguito dal LLM per affrontare il problema utilizzando la tecnica Chain-of-Thought (CoT) e rispondere a questa domanda:
Risposta LLM
- Passo 1: Considerare il tempo di asciugatura per 5 magliette
Sappiamo che Giulia stende 5 magliette e queste si asciugano completamente in 1 ora. Questo tempo si riferisce al processo di asciugatura sotto il sole, indipendentemente dal numero esatto di magliette, poiché il sole può agire su tutte le magliette contemporaneamente. - Passo 2: Verificare l'ipotesi che il tempo non dipenda dal numero di magliette
Dato che le condizioni rimangono le stesse e il sole agisce su tutte le magliette nello stesso momento, l'aggiunta di altre magliette (finché lo spazio per stenderle è sufficiente) non aumenta il tempo di asciugatura. Ogni maglietta riceve la stessa quantità di esposizione al sole come se fossero solo 5 magliette. - Passo 3: Applicazione alle 15 magliette
Poiché 5 magliette si asciugano in 1 ora e il tempo di asciugatura dipende dalle condizioni ambientali e non dal numero di magliette (sempre che ci sia spazio per tutte), possiamo concludere che 15 magliette si asciugheranno nello stesso tempo, cioè in 1 ora. - Conclusione:
Anche se Giulia stende 15 magliette invece di 5, il tempo di asciugatura rimane invariato, ossia 1 ora, poiché l'azione del sole avviene contemporaneamente su tutte le magliette e le condizioni rimangono le stesse.
Questo ragionamento mostra che il numero di magliette non influisce sul tempo di asciugatura, a patto che siano tutte esposte al sole contemporaneamente. In questo modo, il modello LLM scompone il problema in piccoli passaggi logici, assicurandosi che ogni dettaglio sia considerato e organizzato in modo chiaro.
L'aggiunta di istruzioni per chiedere una spiegazione passo dopo passo è ciò che attiva la modalità Chain-of-Thought in un modello linguistico. Questo tipo di prompting non solo guida il modello verso una risposta più ragionata e articolata, ma permette anche di esaminare in dettaglio come il modello elabora le informazioni, portando a soluzioni più accurate e trasparenti.
In generale, il Chain-of-Thought ti consente di affrontare problemi articolati con maggiore affidabilità, facendo emergere il ragionamento che porta alla risposta.