Post

Perché i Transformer hanno cambiato il modellamento del linguaggio

Immagine
Dalle frequenze osservate alle rappresentazioni latenti, e perché gli LLM possono generare frasi sensate mai incontrate prima. Quando si prova a spiegare un Large Language Model, una delle immagini più immediate è quella di un immenso archivio di frasi già incontrate. Il modello avrebbe letto quantità sterminate di testi e, nel momento in cui produce una risposta, recupererebbe sequenze simili a quelle osservate durante l’addestramento. Questa intuizione contiene una parte di verità, poiché gli LLM apprendono effettivamente dai testi. Diventa però fuorviante quando suggerisce che il modello funzioni come una gigantesca tabella di frasi, oppure come un sistema che si limita a contare quante volte certe parole compaiono insieme. Per comprendere la differenza, conviene partire dalla storia del modellamento linguistico. Prima delle reti neurali moderne, una parte rilevante della linguistica computazionale e del trattamento automatico del linguaggio naturale affrontava il problema mediant...

Tra pappagalli stocastici e macchine coscienti c’è una terza via?

Immagine
La scienza ha una validità oggettiva inequivocabile e, nella sua forma più ortodossa, esclude la prospettiva interna dell'osservatore, fino al punto da cercare interpretazioni alternative, operanti in «terza persona», del possibile ruolo dell'osservatore nella misura di un'osservabile quantistica. Il dominio delle scienze fisiche vuole, ancora oggi, conservarsi come studio, descrizione e sintesi di modelli teorici predittivi dell'oggetto, escludendo in qualsiasi modo il ruolo cognitivo del soggetto e la relativa posizione prospettica privilegiata rispetto all'oggetto di indagine. Tuttavia, l'esclusione del soggetto è un artificio della teoria sintetizzata come modello del mondo, un mondo, quindi, senza soggetti. Eppure, i soggetti ci sono eccome e partecipano al «game» della scienza come generatori di ipotesi esplicative, mediante inferenza abduttiva, come direbbero i filosofi della scienza. In discipline come la psicologia la presenza del soggetto è lapalissian...

Oltre il prompt. Dai Large Language Models all’IA agentica nella professione dell’ingegnere

Immagine
  Quando si parla oggi di intelligenza artificiale, il rischio più frequente consiste nel ridurre un campo vastissimo a una singola esperienza d’uso, quella della conversazione con un sistema linguistico tramite interfaccia web. È comprensibile che ciò accada. Milioni di persone hanno incontrato l’IA anzitutto in questa forma, ponendo domande, ottenendo risposte, chiedendo sintesi, immagini, codice, spiegazioni. Eppure, se vogliamo comprendere con lucidità la fase storica che stiamo attraversando, dobbiamo ampliare lo sguardo. Dobbiamo cioè distinguere tra il modello linguistico usato come interlocutore e l’orizzonte più ampio entro cui esso oggi si colloca, quello dei sistemi agentici, dei workflow cognitivi automatizzati, della delega parziale di compiti complessi e della progressiva integrazione tra linguaggio, strumenti, memoria, pianificazione e azione. Per entrare correttamente nel tema, conviene partire da alcune definizioni storiche dell’intelligenza artificiale. Marvin M...

Cognizione artificiale, mente e attribuzione di senso nell’epoca dei sistemi generativi

Immagine
  Da quando i modelli generativi e i grandi modelli linguistici hanno mostrato una sorprendente capacità di produrre linguaggio coerente, di risolvere problemi complessi e di coordinare azioni in ambienti digitali, il termine «cognizione» è tornato al centro della discussione. La sua ricomparsa non è un fatto marginale. Quando si dice che una macchina «ragiona», «apprende», «ricorda», «pianifica» oppure «comprende», non si sta semplicemente scegliendo un lessico suggestivo. Si sta toccando uno dei nodi più delicati della cultura contemporanea, vale a dire il modo in cui interpretiamo il rapporto tra mente, informazione, tecnica e comportamento intelligente. Una parte della comunità scientifica ritiene legittimo usare il lessico cognitivo per descrivere i sistemi artificiali. Un’altra parte invita alla prudenza, osservando che parole come «comprensione», «intelligenza» o «cognizione» rischiano di importare nelle macchine contenuti semantici e ontologici che appartengono originariame...