GPT-5.3-Codex d'OpenAI: així és la nova IA que programa programari gairebé sola

  • GPT-5.3-Codex és el model de programació més avançat d'OpenAI, un 25% més ràpid i eficient que els predecessors.
  • El sistema actua com a agent de desenvolupament: entén repositoris complets, crea apps i jocs web i cobreix tot el cicle de vida del programari.
  • OpenAI va fer servir versions primerenques del model per depurar el seu propi entrenament, fet que converteix GPT-5.3-Codex en una IA que ajuda a crear-se a si mateixa.
  • Ja està disponible als plans de pagament de ChatGPT ia la plataforma Codex (app d'escriptori, web, terminal i extensions per a IDE), amb focus també en seguretat i ciberdefensa.

Model GPT-5.3-Codex d'OpenAI

La nova generació de models de programació d'OpenAI ja té un nom propi: GPT-5.3-Codex. Es tracta d'un sistema pensat per anar molt més enllà del típic assistent que completa línies de codi, i aspira a convertir-se en un agent de desenvolupament capaç de treballar durant hores sobre projectes complexos, des del primer commit fins al desplegament.

En aquest context, la companyia amb seu a San Francisco presenta el seu model com un salt important davant de GPT-5.2 i GPT-5.2-Codex, combinant les capacitats de programació de la línia Codex amb el raonament avançat del model general GPT-5.2. L'objectiu declarat és clar: que tant equips d'enginyeria com professionals no tècnics puguin delegar a la IA bona part del treball rutinari que avui absorbeix la major part del temps.

Què és GPT-5.3-Codex i per què suposa un canvi d'etapa

GPT-5.3-Codex és el darrer model especialitzat en programació d'OpenAI, dissenyat com un agent que no sols genera fragments de codi, sinó que assumeix tasques llargues que impliquen investigació, ús de ferramentes i execució complexa. La pròpia empresa ho descriu com una IA capaç de fer gairebé tot el que un professional pot fer davant d'un ordinador, des d'escriure codi fins a documentar i monitoritzar serveis.

Enfront de generacions anteriors, la clau és que aquest model entén repositoris complets: podeu analitzar l'estructura de carpetes, dependències, proves automatitzades i documentació abans de modificar res. Gràcies a això, es redueix el risc de canvis que trenquin el projecte i es facilita que l'agent respecti l'estil, les convencions internes i les decisions de disseny que ja hi ha al codi.

Segons les dades aportades per OpenAI, GPT-5.3-Codex ofereix un rendiment un 25% superior els seus predecessors en tasques de programació, alhora que consumeix menys tokens per produir resultats equivalents. Aquesta combinació de precisió i eficiència us permet treballar durant més temps sobre un mateix projecte, mantenir el context i encadenar decisions sense perdre el fil.

Més enllà de l'escriptura de codi, el model està dissenyat per acompanyar tot el cicle de vida del programari: depuració, implementació, supervisió, proves, anàlisi de mètriques i documentació. A la pràctica, s'acosta al paper d'un desenvolupador autònom que, això sí, ha de continuar treballant sota supervisió humana, tal com insisteix la companyia.

Un dels aspectes que més crida l'atenció és la manera com es comunica amb l'usuari. En lloc de limitar-se a tornar una resposta final, GPT-5.3-Codex explica què està fent, va enviant actualitzacions d'estat i accepta correccions o canvis de rumb mentre treballa. Aquesta interacció continua redueix la sensació de “caixa negra” i facilita que els equips mantinguin el control sobre les decisions importants.

Interfície de Codex amb GPT-5.3

Un agent que entén repositoris i crea jocs, webs i aplicacions complexes

Un dels grans canvis pel que fa als models Codex anteriors és la capacitat per comprendre repositoris de codi complets. Abans de tocar una línia, GPT-5.3-Codex recorre l'arbre de fitxers, identifica mòduls clau, revisa els tests i llegeix la documentació disponible. Amb aquesta visió global, podeu plantejar plans de treball coherents, evitar regressions i proposar refactoritzacions àmplies sense desfer decisions prèvies de l'equip.

Aquesta comprensió d'alt nivell es tradueix en tasques concretes com refactoritzar grans blocs de codi, detectar bugs complexos que apareixen només en determinats escenaris, o adaptar una base de codi a nous requisits sense haver de reescriure-ho tot des de zero. El model també és capaç de revisar el seu propi treball, executar proves i corregir errors que detecta a les seves pròpies propostes.

OpenAI ha mostrat exemples pràctics que il·lustren aquesta capacitat, com la creació de videojocs i aplicacions web des de zero en qüestió de dies. En una de les demostracions internes, es va demanar al model que desenvolupés un joc de busseig i una versió millorada d'un joc de carreres ja existent. Amb instruccions força genèriques, del tipus “corregeix l'error” o “millora el joc”, GPT-5.3-Codex va anar iterant sobre milions de tokens de codi fins a deixar tots dos projectes funcionals.

En qualsevol altre cas, l'empresa va comparar la creació de dues pàgines web similars amb GPT-5.2-Codex i amb la nova versió. Mentre el model anterior resolia la petició de manera més bàsica, GPT-5.3-Codex va afegir per iniciativa pròpia elements com un pla anual de preus amb descomptes o un carrusel de testimonis, demostrant una millor comprensió del que sol esperar-se en un producte web professional.

A més d'escriure codi per a backend i frontend, el model també es maneja amb tasques que orbiten al voltant del desenvolupament pur, com ara generar documentació tècnica, redactar PRDs, preparar presentacions en formats com PowerPoint o PDF, o muntar fulls de càlcul amb mètriques i informes. La idea de fons és que l'agent no només programi, sinó que participi a la part més àmplia del treball digital que envolta un projecte de programari.

Desenvolupament de programari amb GPT-5.3-Codex

Resultats en benchmarks: menys tokens i més precisió

Per donar suport a les seves promeses, OpenAI ha publicat resultats en diversos benchmarks de referència utilitzats a la indústria per mesurar la capacitat dels models de programació. A SWE-Bench Pro, una bateria de proves que agrupa incidències reals de projectes de codi obert en diversos llenguatges, GPT-5.3-Codex arriba a xifres que la firma descriu com a nivells rècord per al seu catàleg de models.

En Terminal-Bench 2.0, un conjunt de tasques centrades en el treball de consola -instal·lació de dependències, gestió d'arxius, execució de scripts i operacions habituals de sistemes-, el model obté al voltant d'un 77% d'encerts, molt per sobre de GPT-5.2-Codex i per davant de competidors directes en aquest tipus de proves. Aquest avantatge suggereix que, en fluxos de treball a través de la terminal, Codex 5.3 se sent particularment còmode.

A benchmarks més orientats a l'ús d'un entorn d'escriptori complet, com ara OSWorld, el model manté un rendiment sòlid, encara que aquí la foto de conjunt mostra un repartiment de fortaleses entre diferents proveïdors. En qualsevol cas, la tendència general és clara: més precisió amb menys tokens, cosa que es tradueix en costos inferiors i en una experiència més àgil quan es treballa amb tasques llargues.

OpenAI també cita resultats destacables a GDPVal, una avaluació interna centrada en feines de coneixement ben definides que abasten desenes d'ocupacions diferents. En aquestes proves, GPT-5.3-Codex actua com a professional capaç de combinar programació amb redacció, anàlisi de dades i tasques d'oficina digital.

Cal recordar, però, que la major part d'aquestes xifres provenen de la pròpia companyia i s'han d'interpretar amb certa prudència. Tot i que els benchmarks ajuden a comparar models, les diferències reals depenen molt del tipus de projecte, el llenguatge, la qualitat del repositori i la claredat de les instruccions que se li donen a l'agent.

Agent de programació GPT-5.3-Codex

Una IA que ajuda a desenvolupar-se a si mateixa

Més enllà dels números, un dels punts més cridaners de l'anunci és que GPT-5.3-Codex ha estat instrumental en el seu propi desenvolupament. OpenAI explica que va utilitzar versions primerenques del model per depurar el procés d'entrenament, analitzar resultats i proposar millores a l'arquitectura ia les dades utilitzades.

Això no vol dir que la IA s'hagi programat sola sense presència humana, però sí que marca un canvi d'enfocament: el mateix sistema s'ha emprat per identificar patrons de fallada, suggerir ajustaments i revisar part del treball d'enginyeria. En certa manera, l'eina ha servit com a suport per construir-ne la iteració següent, escurçant els cicles d'experimentació i reduint l'esforç manual en algunes fases.

Aquest tipus d'autosuport planteja, això sí, reptes addicionals. Quan un model participa a la seva pròpia avaluació, és imprescindible comptar amb controls externs, verificacions independents i criteris de seguretat estrictes per evitar biaixos i errors que passin desapercebuts. OpenAI assegura haver mantingut una supervisió humana constant durant tot el procés, amb equips dedicats a revisar tant el comportament del model com la qualitat de les dades.

La companyia emmarca aquesta estratègia dins una línia de treball més àmplia, on els models es converteixen en eines internes per als seus propis creadors. Des de la revisió de codi fins a l'automatització de certes tasques de desplegament, GPT-5.3-Codex ha estat utilitzat com un company d'equip més dins de l'organització.

Aquest enfocament casa amb la idea que fa temps que l'empresa defensa: la IA com a eina que amplifica el treball humà, també dins dels propis laboratoris que la desenvolupen. A la pràctica, això es tradueix en cicles de prova més ràpids, però també en una responsabilitat més gran a l'hora d'establir límits i protocols clars.

Seguretat i ciberdefensa: potencial i límits

Una altra dimensió en què GPT-5.3-Codex destaca és la ciberseguretat. OpenAI afirma que aquest model és el primer del catàleg classificat com a “alta capacitat” per a tasques relacionades amb la detecció de vulnerabilitats de programari, d'acord amb el seu propi marc de preparació interna.

El sistema ha estat entrenat específicament per identificar errors en bases de codi i suggerir pegats, una capacitat que pot resultar especialment interessant per a projectes de codi obert i per a empreses europees que han de complir normatives exigents en matèria de seguretat i protecció de dades. Com a contrapartida, la firma reconeix que aquestes mateixes capacitats podrien ser mal utilitzades si no s'hi estableixen salvaguardes adequades.

En aquest sentit, OpenAI sosté que no ha trobat proves que GPT-5.3-Codex pugui executar de manera autònoma tots els passos d'un atac informàtic des del principi fins al final. Tot i així, la companyia ha optat per una postura cauta, implementant mesures de mitigació específiques per reduir la probabilitat d'usos maliciosos, especialment pel que fa a l'automatització d'exploits.

Entre aquestes mesures s'inclouen entrenaments de seguretat orientats al doble ús, sistemes de monitoratge automatitzat per detectar comportaments de risc, i restriccions en determinades capacitats avançades, sobretot en aquells canals on el control és menor. El desplegament gradual del model, amb accés més limitat a l'API, forma part d'aquesta estratègia.

Paral·lelament, l'empresa ha assenyalat la seva intenció de col·laborar amb mantenidors de projectes populars per oferir anàlisis de seguretat gratuïtes sobre els seus repositoris, usant precisament GPT-5.3-Codex com a eina per detectar vulnerabilitats que encara no han sortit a la llum.

On i com es pot utilitzar GPT-5.3-Codex avui

Quant a la disponibilitat, GPT-5.3-Codex ja es pot utilitzar a totes les subscripcions de pagament de ChatGPT als països on Codex està habilitat, inclòs l'entorn europeu. A diferència d'altres models, la seva integració se centra en la plataforma específica d'agents de programació que la companyia ha anat construint els darrers mesos.

El model és present a la aplicació d'escriptori de Codex per a macOS, que funciona com un hub des del qual gestionar diversos agents de desenvolupament de manera simultània. També es pot utilitzar des de la versió web, la interfície de terminal i les extensions per a entorns de desenvolupament integrats, com els IDE que utilitzen cada dia molts programadors a Espanya i la resta d'Europa.

En aquesta fase inicial, OpenAI manté una política més conservadora amb la exposició a través d'API. Tot i que en alguns documents s'esmenta la integració amb eines de tercers i fluxos CI/CD, l'empresa insisteix que està escalonant aquest accés per assegurar-se que l'ús del model sigui tan segur com sigui possible. L'obertura total a l'API es planteja com un pas següent, però sense terminis ferms.

El disseny del sistema està clarament orientat a funcionar com agent operatiu i no com a simple chatbot. A la pràctica, això significa que pot trucar a ordres, interactuar amb el sistema d'arxius, executar proves i analitzar resultats, sempre dins dels límits definits pels desenvolupadors que l'integren als fluxos de treball.

Per als equips europeus, acostumats a manejar-se amb requisits de compliment normatiu estrictes (des del RGPD fins a futurs marcs específics per a IA), aquestes capacitats s'han d'avaluar amb compte. La promesa de més productivitat és evident, però també ho és la necessitat de establir polítiques clares sobre quines dades s'exposen al model i com s'auditen les seves intervencions al codi.

Impacte a la feina diària dels desenvolupadors

L'arribada de GPT-5.3-Codex encaixa en una tendència que molts equips ja han començat a notar al seu dia a dia: la transició de l'autocompletar codi a l'agent que s'encarrega de tasques senceres. En comptes de demanar una funció aïllada, la idea és que el desenvolupador pugui delegar blocs complets de treball, supervisant el resultat i corregint la direcció quan calgui.

A la pràctica, això es tradueix en escenes força reconeixibles per als que programen: aixecar una aplicació des de zero, connectar bases de dades, preparar proves, localitzar un bug esquiu que només apareix en producció, o revisar permisos i dependències en un sistema gran. GPT-5.3-Codex es pot encarregar de bona part d'aquests passos, mentre l'equip es concentra a decidir quin producte construir i quines prioritats té el negoci.

Per a perfils menys tècnics, el model obre la porta a participar més activament en la construcció de ferramentes internes i prototips. Una persona amb una idea clara, encara que no domini un framework concret, pot recolzar-se a l'agent per generar la base del projecte, revisar opcions i ajustar el resultat mitjançant iteracions successives. Això sí, la responsabilitat final sobre aspectes com la seguretat, el manteniment o el compliment legal continua recaient en professionals qualificats.

OpenAI insisteix que GPT-5.3-Codex no s'ha d'entendre com un substitut directe dels desenvolupadors, sinó com un copilot molt més capaç. El model pot accelerar el treball rutinari, però continua cometent errors, necessita supervisió i, de vegades, pot proposar solucions que funcionen tècnicament però no encaixen amb els objectius del projecte o amb les limitacions reals de l'entorn on es desplegarà.

Per a equips a Espanya i la resta d'Europa, on moltes empreses tecnològiques estan adoptant la IA de manera gradual, aquest tipus d'agents també planteja qüestions d'organització: com repartir tasques, quina part del codi es deixa en mans del model, quins processos de revisió s'implementen i com es documenta el que fa la IA per evitar deute tècnic a mitjà termini.

Amb tot aquest context, GPT-5.3-Codex es perfila com una peça central a l'estratègia d'OpenAI per al desenvolupament de programari: un model que combina velocitat, raonament i capacitats agèntiques, que ha ajudat a construir la seva pròpia versió i que aspira a integrar-se al dia a dia dels equips de programació i d'aquells professionals que treballen diàriament davant d'un ordinador. El seu impacte real dependrà de com s'adopti en projectes concrets, de les salvaguardes que s'apliquin i fins a quin punt els usuaris europeus se sentin còmodes incorporant una eina tan potent en processos que, fins ara, eren exclusivament humans.

Article relacionat:
Ja pots crear la teva pròpia aventura Pokémon RPG

Segueix-nos a Google News