Nvidia acaba de dar un contundente golpe en la mesa que ha debido resonar en las oficinas de Meta, Google y OpenAI. La compañía se ha adentrado de lleno en el mundo de la IA con un nuevo modelo de lenguaje llamado NVLM. De hecho, se acaba de presentar y las primeras pruebas ya lo posicionan como un claro competidor en las grandes ligas de la inteligencia artificial.
NVLM 1.0 es el conjunto de modelos de lenguaje que ha lanzado Nvidia, y en el que destaca NVLM-D-72B, una IA capaz de gestionar 72.000 millones de parámetros y que ha desmotrado un rendimiento increíble que ya rivaliza con GPT-4o, Llama 3-V-70B y Gemini 1.5 Pro.
En las primeras comparativas, NVLM-D ha dejado bastante claro que tiene un rendimiento excepcional en visión, texto y solución de problemas matemáticos. De hecho, para ser una primera versión, está muy a la par de los resultados de GTP-4o o Claude 3.5, dos modelos de lenguaje masivos muy consolidados en la industria.
NVLM-D, la joya de Nvidia que ya empieza a pulirse
En su puesta en marcha, Nvidia ha destacado el impresionante rendimiento y la buena adaptabilidad de NVLM-D-72B a las entradas visuales y al texto complejo. La compañía ha puesto mucho énfasis en su percepción de las imágenes, la alta capacidad para resolver problemas basados en la visión e incluso, su buen desempeño a la hora de comprender memes.
De hecho, es verdaderamente interesante ver los resultados de la primera prueba comparativa con los grandes reyes de la industria. No solo se acerca peligrosamente a modelos como GPT-4o o Claude 3.5, sino que en algunos escenarios concretos es capaz de superarlos.
El mejor ejemplo es su desempeño con las tareas de texto. Mientras que otros modelos se están centrando en la visión y la resolución de problemas complejos, NVLM-D sigue poniendo el foco en la compresión avanzada del lenguaje, lo que le ha permitido superar a los grandes y situarse como una referencia en su primer día de vida.
La guinda del pastel
Ahora bien, NVLM no solo supone un problema para el resto de la industria por su potencia y rendimiento. Nvidia ha presentado sus nuevos modelos de lenguaje IA bajo una política de código abierto. Es decir, lo contrario que el resto de compañías más importantes de la industria.
Mientras que OpenAI o Meta guardan bien sus secretos, Nvidia ha decidido dar rienda suelta a su desarrollo, poniendo un total de cero impedimentos para que el resto de empresas sepan cómo funciona exactamente su inteligencia artificial.
Esto no solo podría acelerar la investigación IA y los descubrimientos, también va a dar acceso a compañías más pequeñas a modelos masivos muy complejos con los que antes no podían interactuar. Al compartir el código, permites desarrollar herramientas en base a tu modelo, que históricamente han estado reservadas para los gigantes.
A modo de resumen, Nvidia ha conseguido desarrollar un modelo de lenguaje IA capaz de rivalizar con los más grandes, que tiene una capacidad increíble a la hora de analizar texto e imágenes y que, además, tiene un código público al que cualquiera puede acceder para conocer cómo funciona y crear más herramientas bajo su entorno. Sin duda alguna, punto para Nvidia.