OpenAI GPT-5.4: il nuovo modello per il lavoro agentico

58

(Adnkronos) – OpenAI ha presentato GPT-5.4 come la sua architettura più avanzata, progettata specificamente per gestire compiti reali attraverso un'integrazione profonda tra capacità di ragionamento, programmazione e flussi di lavoro agentici. La release, disponibile nelle versioni standard, Pro e tramite le API di Codex, punta a ridurre la necessità di interazioni ripetitive da parte dell'utente, offrendo output di qualità superiore in ambiti critici come l'analisi di dati e la creazione di documentazione complessa. Sotto il profilo delle prestazioni, i dati forniti evidenziano un salto qualitativo significativo. Nei test GDPval, che misurano l'efficacia in 44 diversi domini professionali, GPT-5.4 ha eguagliato o superato gli esperti del settore nell’83% dei casi. Rispetto al predecessore GPT-5.2, il nuovo modello manifesta una maggiore efficienza computazionale, risolvendo problemi articolati con l’utilizzo di un minor numero di token, il che si traduce in risposte più rapide e costi operativi ridotti.    Anche l'affidabilità è stata incrementata: le analisi sui prompt critici segnalati in precedenza dagli utenti mostrano un tasso di errore inferiore del 18% e una riduzione del 33% delle probabilità di generare informazioni false. 
La vera innovazione tecnologica risiede però nelle funzionalità operative. GPT-5.4 è il primo modello general-purpose a supportare l'utilizzo nativo del computer, permettendo agli agenti di interagire direttamente con browser e software per completare task multi-step.  Questa capacità è supportata da una finestra di contesto sperimentale che raggiunge il milione di token e dalla nuova funzione di "ricerca degli strumenti", che consente all'IA di navigare autonomamente in ecosistemi complessi di connettori. In ChatGPT, l'esperienza utente è stata arricchita con la modalità "GPT-5.4 Thinking", che mostra un piano preliminare del processo logico durante l'elaborazione, consentendo una supervisione umana in tempo reale. Parallelamente, il debutto dell'app Codex per Windows segna l'arrivo di un'esperienza nativa dedicata agli sviluppatori per la distribuzione di software tramite agenti basati sui modelli di coding più evoluti della casa di San Francisco. 
—tecnologiawebinfo@adnkronos.com (Web Info)