Prácticamente, todos los gigantes de la IA ya se han mojado respecto a sus novedades para llevar la tecnología un paso más allá. Google tiene pensado anunciar algo a finales de año y Anthropic presentó hace nada su nueva capacidad de interactuar con interfaces digitales. Ahora le toca el turno a la protagonista de la escena, OpenAI. Según informa Bloomberg, la empresa de Sam Altman tiene casi listo un nuevo modelo que pretende revolucionar el mercado de la IA.
Y no es para menos, pues se trata de una herramienta con la capacidad de interactuar con las interfaces digitales. Hasta el momento, los modelos de la compañía han permitido grandes avances a la hora de procesar texto e imágenes, pero tienen una espina clavada a la hora de manejar escenarios reales. Ahí es justo donde quiere ir OpenAI con su nuevo agente.
Internamente lo han llamado ‘Operador‘, y tiene como objetivo poder interactuar con ordenadores y realizar acciones de todo tipo. Esta herramienta IA ya no solo podrá responder preguntas basadas en su conocimiento o analizar imágenes, será capaz de manejar una interfaz para llevar a cabo procesos completos. Es decir, una especie de sistema operativo independiente.
Según la fuente citada, OpenAI está preparando todo para lanzar una versión preliminar que podrán utilizar los investigadores, y un poco más tarde estará disponible para los desarrollares. Se espera que en enero de 2025 se comiencen a ver los primeros pasos de Operador —un nombre que podría cambiar— y conocer sus capacidades reales.
Por desgracia, el uso para usuarios finales parece lejano. A pesar de ser una herramienta sumamente interesante, puede que su uso y curva de aprendizaje vayan más allá de los conocimientos de los usuarios de a pie, al menos hasta que se lance una versión final y comercial.
OpenAI abre la puerta a la verdadera revolución de la IA
Si lo que es capaz de hacer ChatGPT, Gemini Live o Sora te parece una auténtica locura, lo que conseguirán estas herramientas de OpenAI, Google y Anthropic te va a volar la cabeza. Cuando estén disponibles, el procesado de imágenes, la creación de textos o la IA conversacional podrían quedar en un segundo plano, pues la inteligencia artificial tendrá la capacidad de ser prácticamente autosuficiente.
Tener un modelo de lenguaje capaz de controlar interfaces de ordenador y hardware abre un mundo de posibilidades. Las tareas que hasta ahora requerían la intervención humana podrían dar el salto a la autonomía total, dejando con la boca abierta a la industria.
Es pronto para conocer las capacidades exactas del ‘Operador’ de OpenAI, pero ya es posible avecinar la posibilidad de configurar la herramienta para que sea capaz de tomar las riendas de tu PC, y que este haga tareas complejas abriendo apps, modificando parámetros y realizando búsquedas.
Ahí va un ejemplo muy vago y futurista por ahora: imagina que tienes un virus en tu ordenador que quieres eliminar. Con esta nueva IA, no necesitarás abrir ChatGPT, preguntar y seguir los pasos que te dé, sino que podría bastar con pedirle al modelo que solucione el problema para que empiece a realizar acciones en tu ordenador tratando de eliminar el virus por sí solo.
Este uso, llevado al ámbito profesional, podría transformar —no ahora mismo— la industria del desarrollo y la investigación tal y como se conoce. Y, bueno, también puede que esto se convierta en Blade Runner.