OpenAI, la companyia coneguda per haver impulsat Xat GPT a escala global, es prepara per fer un pas clau: passar del programari al maquinari amb un altaveu intel·ligent amb càmera pensat per a la llar. Aquest moviment situaria l'empresa en plena batalla pel control del saló, un espai on avui dominen propostes com ara Amazon Echo, Google Nest o Apple HomePod.
Segons diferents informacions filtrades, la firma està ultimant un altaveu IA amb càmera integrada i micròfons que funcionaria com a cervell domèstic, capaç no només d'escoltar ordres de veu, sinó també d'observar l'entorn, interpretar hàbits i actuar de manera proactiva. La idea és apostar per una experiència molt més contextual i personalitzada que la dels assistents actuals.
Aquest nou dispositiu es presentaria com un altaveu intel·ligent a lús, però el seu enfocament aniria més enllà del simple control per veu i la reproducció de música. La profunda integració de ChatGPT seria l'element diferencial, convertint l'aparell en una mena d'assistent personal domèstic que conversa, entén matisos i s'avança a determinades necessitats de l'usuari.
Enfront dels models habituals centrats sobretot en el so o en funcions bàsiques de domòtica, l'aposta d'OpenAI es basa en una combinació de intel·ligència conversacional avançada, visió per ordinador i reconeixement de patrons. Per al mercat europeu i espanyol, on els altaveus connectats ja estan força estesos, la proposta apuntaria a un esglaó superior quant a capacitats d'IA.
En l'àmbit econòmic, les filtracions apunten que el preu de sortida es mouria en una forquilla de entre 200 i 300 dòlars, és a dir, al voltant d'uns 185-275 euros al canvi, situant-ho d'entrada a la gamma mitjana-alta del segment. Quedaria, per tant, més a prop de l'estratègia d'Apple amb el HomePod que dels models més assequibles dAmazon o Google.
Un altaveu IA que observa, escolta i entén el context

La gran diferència davant d'altres altaveus intel·ligents estaria en la manera com el dispositiu percep el que passa al seu voltant. Diversos reports assenyalen que l'altaveu d'OpenAI incorporaria una càmera capaç de reconèixer objectes i persones a l'entorn, així com diversos micròfons per captar converses properes amb claredat.
No es tractaria només d'afegir videotrucades a un altaveu, una cosa que ja hem vist en altres equips amb pantalla, sinó dusar la càmera com una peça clau de lexperiència. Les filtracions parlen de funcions similars al reconeixement facial tipus Face ID, amb la capacitat d'identificar diferents membres de la llar i adaptar la interacció a cadascun.
Aquesta mateixa tecnologia es podria utilitzar, segons s'ha avançat, per autenticar compres o confirmar accions sensibles mitjançant el rostre de lusuari. A la pràctica, seria possible aprovar una comanda, gestionar pagaments o accedir a determinats perfils simplement col·locant-se davant del dispositiu, sense contrasenyes ni PINs.
A més de la identificació de persones, la càmera serviria per reconèixer objectes situats en una taula oa l'estada. Això permetria escenes com que l'altaveu detecti productes de la compra, recomani receptes en funció del que veu o avisi si falta alguna cosa habitual al rebost. També podria interpretar gestos bàsics o moviments, ampliant les maneres d'interactuar més enllà de la veu.
La companyia estaria apostant per una IA capaç de reaccionar a situacions concretes. Per exemple, si el sistema detecta que un usuari ha quedat despert fins tard i té una reunió important a primera hora, podria suggerir anar a dormir abans, ajustar l'alarma o reorganitzar compromisos per evitar arribar esgotat. La clau està en aquesta capacitat proactiva que va més enllà dexecutar ordres sota demanda.
Al dia a dia, l'altaveu actuaria com un assistent que ajuda a mantenir organitzada l'agenda familiar, coordinar recordatoris, gestionar llistes de tasques i oferir recomanacions personalitzades. La idea és que passi de ser un simple gadget a convertir-se en una presència constant que acompanya rutines, sense forçar l'usuari a treure el mòbil o obrir una aplicació concreta.
ChatGPT com a motor de la llar connectat
El cor del dispositiu seria una integració profunda de Xat GPT, aprofitant les darreres versions del model i les seves capacitats multimodals. Això implicaria no només comprendre llenguatge natural amb més precisió, sinó també analitzar imatges i context per oferir respostes més riques.
A diferència dels assistents actuals, que sovint només executen ordres bàsiques (posar música, encendre llums, respondre consultes senzilles), l'altaveu d'OpenAI aspiraria a sostenir converses més naturals i contínues, recordant informació rellevant de lusuari i ajustant el to i el contingut en funció de cada persona.
En una llar espanyola o europea, això es podria traduir en gestionar rutines familiars complexes: coordinar horaris dels nens, ajudar amb tasques escolars, proposar menús setmanals, controlar dispositius de domòtica o fins i tot servir de suport lingüístic a cases bilingües. Tot això amb un enfocament més contextual que els sistemes que només reaccionen a paraules clau.
La capacitat del model per interpretar converses properes obre la porta a interaccions menys rígides. No seria imprescindible parlar amb frases molt estructurades; només caldria esmentar alguna cosa mentre es prepara el sopar perquè el sistema prengui nota, proposi accions o formuli recordatoris més tard. La IA passaria a ser un acompanyant en segon pla, sempre disponible però sense necessitat d'activar una ordre per a cada petició.
Aquesta presència més gran planteja, lògicament, dubtes sobre com es gestionaran les dades. L'empresa haurà d'explicar amb detall i transparència si les converses es processen al núvol, què s'emmagatzema, durant quant de temps i com poden els usuaris controlar la informació que comparteixenA Europa, on el RGPD estableix un marc regulador estricte, aquest punt serà decisiu per a l'acceptació del producte.
Disseny i estratègia de maquinari: el segell de Jony Ive
Per donar forma física a aquesta aposta, OpenAI s'ha aliat amb un nom molt conegut al sector: Jony Ive, històric responsable de disseny a Apple. La seva firma, io Products, va ser adquirida per OpenAI per valor de 6.500 milions de dòlars, i des de llavors s'ha integrat en una nova divisió dedicada exclusivament al maquinari d'intel·ligència artificial.
Més de 200 empleats estarien actualment bolcats en aquesta línia de productes, cosa que anticipa un esforç seriós per part de la companyia i no un simple experiment. La meta declarada és crear dispositius que combinin simplicitat d'ús, estètica cuidada i capacitats avançades d'IA, seguint una filosofia similar a la que va portar Apple a destacar en electrònica de consum.
Sam Altman, director executiu d'OpenAI, ha reconegut públicament que ja estan desenvolupant prototips de l'altaveu després de descartar dissenys anteriors que no complien el llistó marcat. L'objectiu és que el resultat final sigui un objecte discret, fàcil d'entendre a primera vista i que s'integri sense estridències al saló o qualsevol estada de la casa.
Dins aquesta estratègia, l'altaveu no seria l'únic producte previst. Es parla també de unes ulleres intel·ligents, un llum connectada i un pin o dispositiu portàtil sense pantalla com a projectes en diferents fases d'exploració. No està garantit que tots arribin al mercat, però reforcen la idea que OpenAI cerca construir un petit ecosistema de dispositius al voltant de ChatGPT.
En el context europeu, un disseny sobri i ben acabat pot marcar la diferència, especialment a països com Espanya on el saló continua sent un espai social clau i on els usuaris valoren tant la funcionalitat com l'aparença dels gadgets que col·loquen a casa. La col·laboració amb Ive pretén precisament reforçar aquesta percepció de producte cura, més proper a la gamma premium que a un altaveu purament utilitari.
Dates de llançament i posicionament al mercat
Pel que fa als terminis, les informacions disponibles apunten a un calendari relativament ampli. L'altaveu amb càmera tindria com a horitzó una estrena comercial a partir de començaments de 2027, amb algunes fonts estenent aquesta referència fins a 2028 per a l'arribada d'altres dispositius com les ulleres intel·ligents.
Aquest període de temps indica que el projecte encara es troba en una fase de desenvolupament on es poden fer ajustaments al disseny, les característiques o fins i tot a l'estratègia de preus. Tanmateix, la gamma de 200-300 dòlars es repeteix en la majoria de filtracions, cosa que suggereix que OpenAI vol col·locar-se clarament per sobre dels altaveus més bàsics, però sense arribar a terrenys de luxe inabastables.
Al mercat actual, això situaria l'altaveu d'OpenAI com dels models més avançats d'Amazon, Google i Apple. L'HomePod d'Apple potser seria la referència més propera pel que fa a posicionament, mentre que Amazon i Google compten amb un catàleg més ampli que combina productes d'entrada molt econòmics amb altres opcions més capaces.
La diferència, si es compleixen les expectatives, estaria al pes específic de la IA dins del producte. Mentre que molts altaveus del mercat se centren sobretot en la reproducció d'àudio i en un conjunt limitat de comandes, el dispositiu d'OpenAI aspiraria a oferir una experiència d'assistent personal molt més rica i autònoma, recolzant-se en models de llenguatge d'última generació.
Per als consumidors espanyols, un factor clau serà la qualitat del suport en castellà i en altres idiomes europeus, així com la integració amb serveis locals: plataformes de música, aplicacions de domòtica compatibles amb els estàndards europeus, serveis de lliurament a domicili o calendaris corporatius utilitzats a la regió. Si l'altaveu arriba amb un enfocament massa centrat al mercat nord-americà, podria trobar més difícil fer-se un lloc aquí.
Privadesa, dubtes raonables i expectatives reals
Un aspecte que està generant debat des del primer moment és el de la privadesa a la llar. Un altaveu amb micròfons sempre atents ja planteja dubtes habituals; si a més afegeix una càmera capaç d'identificar cares, observar l'activitat a la sala i reconèixer objectes, el nivell d'escrutini públic encara serà més gran.
Col·lectius de defensa de drets digitals i organismes reguladors a Europa previsiblement posaran el focus en com es gestionen les imatges, els enregistraments i les metadades generades pel dispositiu. Control granular, opcions clares de desactivació i emmagatzematge local de part de la informació podrien convertir-se en requisits de facto per assolir un mínim de confiança.
Més enllà de la privadesa, també existeix la qüestió de la utilitat real. Molts dispositius impulsats per IA arriben al mercat envoltats de grans promeses —des de substituir el telèfon intel·ligent fins a revolucionar el treball a casa— i després es queden en propostes interessants però marginals. L'altaveu d'OpenAI haurà de demostrar que realment estalvia temps, simplifica tasques i aporta valor diari, no només que és tecnològicament cridaner.
La maduresa actual de la intel·ligència artificial juga un paper important en aquesta equació. Els models han millorat de manera molt notable, però continuen cometent errors, al·lucinen respostes o fallen en tasques aparentment senzilles. Perquè un dispositiu situat al centre del saló guanyi el nivell de confiança necessari, l'experiència haurà de ser més estable i predictible que la que ofereixen avui moltes aplicacions basades en IA.
Tot i així, el moviment d'OpenAI encaixa en una tendència més àmplia: portar la intel·ligència artificial del mòbil i l'ordinador a objectes d'ús quotidià, integrant-la a l'entorn físic. Si la companyia aconsegueix equilibrar innovació, disseny, control de dades i veritable utilitat, aquest altaveu amb càmera es podria convertir en el primer pas d'una nova generació de dispositius domèstics centrats en la intel·ligència artificial contextual.