
OpenAI ha fet un pas rellevant en l'evolució de la intel·ligència artificial amb la presentació de GPT-5.4, el seu primer model dissenyat per manejar ordinadors de manera autònoma. Lluny de limitar-se a generar text o codi, aquest sistema està pensat per desenvolupar-se dins aplicacions reals i dur a terme processos complets gairebé com si fos una persona davant del teclat i el ratolí.
L'empresa dirigida per Sam Altman situa aquest llançament com la seva proposta més avançada per a entorns de treball professionals, amb especial focus en automatització de fluxos, programació i tasques llargues que requereixen planificació per fases. Sense grans estridències, OpenAI planteja amb GPT-5.4 un canvi de rol per a la IA: d'assistent conversacional a operador digital capaç d'intervenir directament al programari corporatiu.
Un model enfocat a controlar l'ordinador
La principal novetat de GPT-5.4 és la seva capacitat per interactuar amb el sistema operatiu i les aplicacions sense supervisió constant. El model pot obrir programes, navegar per llocs web, moure's per menús i introduir ordres mitjançant accions equivalents a l'ús de teclat i ratolí, cosa que us permet completar fluxos de treball complexos dins d'entorns d'escriptori.
Aquesta habilitat estava fins ara condicionada a integracions externes oa scripts específics, però amb GPT-5.4 el control de l'ordinador passa a ser una funció nativa del model. D'aquesta manera, els agents d'IA poden executar tasques de principi a fi en eines d'ofimàtica, plataformes de desenvolupament, aplicacions empresarials o panells web, sense que l'usuari hagi d'intervenir a cada pas.
Perquè això sigui viable, el sistema incorpora una finestra de context que suporta fins a un milió de tokens. A la pràctica, això us permet manejar documentació extensa, processos de diversos passos i projectes de llarga durada sense perdre el fil entre una fase i la següent, cosa especialment rellevant en àmbits tècnics o administratius on es manegen gran quantitat de dades.
A més, OpenAI ha afegit una funció de cerca automàtica d'eines que ajuda el model a localitzar quina aplicació o recurs necessita a cada moment. Així, l'agent pot decidir per si mateix si heu d'obrir un editor de codi, un full de càlcul, un gestor de projectes o un navegador, i encadenar accions en diferents plataformes per completar una mateixa tasca.
Aquest enfocament està alineat amb l'estratègia de la companyia d'impulsar els anomenats agents d'IA, sistemes que no només responen a preguntes, sinó que actuen com una mena de “empleat digital” dins de la infraestructura de programari d'una organització.
Raonament reforçat i més capacitat per programar
Paral·lelament a les capacitats de control de l'ordinador, OpenAI ha introduït millores substancials en raonament i programació. Segons l'empresa, GPT-5.4 supera el seu predecessor especialitzat en codi, GPT-5.3-Codesa, tant en precisió com en rendiment en entorns de desenvolupament i eines professionals.
Això es tradueix en una major solvència per a escriure, revisar i depurar codi en diferents llenguatges, així com per integrar-se en fluxos dintegració continua, automatització de proves o anàlisi de repositoris. El model està pensat per desenvolupar-se en escenaris exigents, com ara projectes d'enginyeria de programari, anàlisi de dades avançades o automatització de scripts en sistemes corporatius.
Al costat de la versió estàndard, OpenAI ha llançat GPT-5.4 Pro, orientat als qui necessiten un plus de capacitat i estabilitat per a càrregues de treball intensives. Aquesta variant està disponible tant a ChatGPT com a via API i apunta sectors com les finances, l'enginyeria, la consultoria tecnològica o l'analítica de negoci, on es requereixen respostes consistents i maneig de grans volums d'informació.
A la pràctica, GPT-5.4 Pro ofereix un millor comportament en tasques complexes, amb més marge per a processos extensos i un rendiment més predictible en operacions que exigeixen alts nivells de càlcul o de gestió de context.
Funció Thinking: veure el pla de la IA i canviar-lo sobre la marxa
Un dels elements més cridaners daquesta generació és la integració de la funció Pensar, heretada de GPT-4.5 però ampliada per treballar amb GPT-5.4. A la interfície de ChatGPT, aquest mode permet visualitzar anticipadament l'esquema de raonament que el model pretén seguir per resoldre una tasca, especialment útil en processos llargs o delicats.
En lloc de limitar-se a rebre un resultat final, l'usuari pot veure com la IA descompon el problema, quins passos té previst executar i quines eines planeja utilitzar en cada fase. D'aquesta manera, és possible aturar l'execució a meitat del flux, corregir instruccions, matisar objectius o canviar prioritats abans que el sistema completi tot el procés.
Aquesta capacitat d'“obrir” el raonament resulta especialment rellevant en consultes complexes o investigacions tècniques, per exemple en cerques avançades, anàlisi de grans bases de dades o revisions de documentació jurídica i científica. L'usuari guanya marge de maniobra per orientar el resultat cap a allò que realment necessita, sense haver de repetir la petició des de zero.
OpenAI assenyala a més que la manera Thinking incorpora millores en tasques de recerca i cerca en profunditat, mantenint el context entre diferents consultes relacionades. Això ajuda a construir més continus processos de treball, on la IA no perd la referència del que s'ha fet en passos anteriors.
Més eficiència, menys errors i millor navegació que la mitjana humana
Un altre dels punts en què OpenAI posa l'accent és la eficiència de GPT-5.4 a l'hora de consumir tokens. El model, segons la companyia, necessita menys context textual per arribar a una solució vàlida en comparació amb versions anteriors com GPT-5.2, fet que es tradueix en un ús més ajustat de recursos, rellevant per a empreses que depenen de l'API a gran escala.
En termes de qualitat de resposta, OpenAI afirma que GPT-5.4 és un 33% menys propens a generar afirmacions incorrectes i que les respostes completes mostren un 18% menys d'errors davant de la generació anterior. Tot i que aquestes xifres provenen de proves internes, apunten a una reducció significativa de les al·lucinacions i fallades de precisió, un aspecte clau en usos professionals.
La companyia ha destacat també que GPT-5.4 ha superat per primera vegada el rendiment mitjà humà en tasques de navegació descriptoris. Al benchmark OSWorld, el model va aconseguir una taxa d'èxit del 75% en executar accions en entorns de sistema operatiu, per sobre del 72,4% assignat a la mitjana humana i molt per davant del 47,3% que registrava GPT-5.2.
Aquest tipus de proves mesuren la capacitat de la IA per manejar finestres, cercar opcions en menús, completar formularis, obrir i tancar aplicacions o fer canvis en la configuració del sistema, entre altres accions habituals en el dia a dia d'un ordinador.
De cara a les organitzacions, aquests avenços suposen més fiabilitat a l'hora de delegar tasques crítiques en agents d'IA, tant en programació com en manipulació de fulls de càlcul, gestió documental o administració de sistemes, i reduir el risc d'errors costosos.
Plans, variants i accés a Europa
GPT-5.4 s'integra a l'oferta de productes d'OpenAI com la seva model de referència per a treball professional. Està disponible per als que compten amb subscripció a ChatGPT als plans Plus, Pro i Team, cosa que obre la porta al seu ús per part d'autònoms, pimes i equips de treball distribuïts a Espanya i la resta d'Europa.
A més, tant GPT-5.4 com GPT-5.4 Pro es poden utilitzar a través de la API d'OpenAI per a integracions directes en aplicacions i serveis. Això permet a empreses europees incorporar agents capaços de controlar ordinadors, automatitzar fluxos interns o assistir empleats dins de les pròpies eines de negoci, sense necessitat de desenvolupar un model des de zero.
La companyia situa aquest llançament com la peça central de la seva estratègia per automatitzar processos de treball complexos, des de la gestió de projectes de programari fins a operacions financeres, passant per l'administració de sistemes i l'elaboració d'informes. La combinació de control descriptori, gran finestra de context i millores en raonament busca cobrir una àmplia gamma de casos dús en el teixit empresarial europeu.
Amb GPT-5.4, OpenAI consolida la idea d'agents que no només responen a allò que se'ls pregunta, sinó que prenen la iniciativa dins de l'entorn digital, es coordinen amb múltiples eines i completen tasques de principi a fi. Per a organitzacions i professionals que treballen diàriament amb ordinadors, això suposa la possibilitat de delegar a la IA bona part de les tasques repetitives o de baixa complexitat, mantenint el control sobre les decisions clau.
Tot i que encara queda recorregut per veure com es regulen i s'integren aquest tipus de sistemes a tots els sectors, el nou model marca un punt d'inflexió: la intel·ligència artificial deixa de ser únicament un generador de contingut i es consolida com operador autònom dins de l'escriptori, amb implicacions directes en la forma de treballar d'empreses i professionals a Espanya ia la resta d'Europa.