NVIDIA acaba de sorprender en el CES 2024 con el lanzamiento de sus GPU GeForce RTX SUPER para equipos de escritorio. Estas potentes unidades no solo ofrecen un rendimiento extraordinario para la IA generativa, sino que también prometen impulsar nuevas laptops de IA y ofrecer herramientas y software acelerados por NVIDIA RTX, abriendo las puertas a una nueva era de innovación tecnológica.
Basándose en décadas de liderazgo en PC, con más de 100 millones de sus GPUs RTX impulsando la era del PC con IA, NVIDIA ofrece ahora estas herramientas para mejorar las experiencias de PC con IA generativa: aceleración NVIDIA TensorRT del popular modelo Stable Diffusion XL para flujos de trabajo de texto a imagen, NVIDIA RTX Remix con herramientas de textura de IA generativa, microservicios NVIDIA ACE y más juegos que utilizan la tecnología DLSS 3 con Frame Generation.
Además, NVIDIA TensorRT-LLM (TRT-LLM), una biblioteca de código abierto que acelera y optimiza el rendimiento de inferencia de los últimos modelos de lenguaje de gran tamaño (LLM), ahora admite más modelos preoptimizados para PC. Acelerado por TRT-LLM, Chat with RTX, una demo tecnológica de NVIDIA que también se publica este mes, permite a los entusiastas de la IA interactuar con sus notas, documentos y otros contenidos.
"La IA generativa es la transición de plataforma más significativa en la historia de la computación y transformará todas las industrias, incluidos los juegos. Con más de 100 millones de PC y estaciones de trabajo RTX AI, NVIDIA es una base de instalación masiva para que desarrolladores y jugadores disfruten de la magia de la IA generativa".
Dijo Jensen Huang, fundador y CEO de NVIDIA.
Ejecutar IA generativa localmente en un PC es fundamental para aplicaciones sensibles a la privacidad, la latencia y los costes. Requiere una amplia base de sistemas preparados para la IA, así como las herramientas de desarrollo adecuadas para ajustar y optimizar los modelos de IA para la plataforma de PC.
Para satisfacer estas necesidades, NVIDIA ofrece innovaciones a través de toda su pila tecnológica, impulsando nuevas experiencias y construyendo sobre las más de 500 aplicaciones y juegos de PC habilitados para IA ya acelerados por la tecnología NVIDIA RTX.
Las GPUs NVIDIA RTX, capaces de ejecutar una amplia gama de aplicaciones al máximo rendimiento, liberan todo el potencial de la IA generativa en los PC. Los núcleos tensoriales de estas GPU aceleran drásticamente el rendimiento de la IA en las aplicaciones más exigentes para el trabajo y el tiempo libre.
Las nuevas tarjetas gráficas de la serie GeForce RTX 40 SUPER, también anunciadas hoy en CES, incluyen las GeForce RTX 4080 SUPER, 4070 Ti SUPER y 4070 SUPER para ofrecer el máximo rendimiento en IA. La GeForce RTX 4080 SUPER genera vídeo con IA 1,5 veces más rápido -e imágenes 1,7 veces más rápido- que la GPU GeForce RTX 3080 Ti. Los núcleos sensores de las GPU SUPER proporcionan hasta 836 billones de operaciones por segundo, lo que aporta una capacidad de IA transformadora a los juegos, la creación y la productividad cotidiana.
Los principales fabricantes, incluidos Acer, ASUS, Dell, HP, Lenovo, MSI, Razer y Samsung, están lanzando una nueva oleada de portátiles RTX AI, que ponen a disposición de los usuarios un completo conjunto de funciones de IA generativa nada más sacarlos de la caja. Los nuevos sistemas, que ofrecen un aumento del rendimiento de entre 20 y 60 veces en comparación con el uso de unidades de procesamiento neuronal, empezarán a comercializarse este mes.
Las estaciones de trabajo móviles con GPU RTX pueden ejecutar el software NVIDIA AI Enterprise, que incluye TensorRT y NVIDIA RAPIDS para simplificar y asegurar el desarrollo de inteligencia artificial generativa y ciencia de datos. Con cada GPU NVIDIA A800 40GB Active se incluye una licencia de tres años para NVIDIA AI Enterprise, lo que proporciona una plataforma de desarrollo de estaciones de trabajo ideal para IA y ciencia de datos.
NVIDIA acaba de presentar NVIDIA AI Workbench, un conjunto de herramientas unificadas y fáciles de usar para ayudar a los desarrolladores a crear, probar y personalizar modelos de IA generativa y LLM pre entrenados con un rendimiento y un consumo de memoria propios de un PC.
AI Workbench, que se lanzará en versión beta a finales de este mes, ofrece acceso simplificado a repositorios populares como Hugging Face, GitHub y NVIDIA NGC, junto con una interfaz de usuario simplificada que permite a los desarrolladores reproducir, colaborar y migrar proyectos con facilidad.
Los proyectos se pueden escalar a prácticamente cualquier lugar, ya sea el centro de datos, una nube pública o NVIDIA DGX Cloud, y luego traer de vuelta a los sistemas RTX locales en un PC o estación de trabajo para la inferencia y la personalización ligera.
En colaboración con HP, la marca también está simplificando el desarrollo de modelos de IA mediante la integración de NVIDIA AI Foundation Models and Endpoints, que incluyen modelos de IA acelerados por RTX y kits de desarrollo de software, en HP AI Studio, una plataforma centralizada para la ciencia de datos. Esto permitirá a los usuarios buscar, importar y desplegar fácilmente modelos optimizados en PC y en la nube.
Después de crear modelos de IA para casos de uso en PC, los desarrolladores pueden optimizarlos utilizando NVIDIA TensorRT para aprovechar al máximo los tensor cores de las GPUs RTX.
Recientemente, NVIDIA amplió TensorRT a las aplicaciones basadas en texto con TensorRT-LLM para Windows, una biblioteca de código abierto para acelerar LLM. La última actualización de TensorRT-LLM, ya disponible, añade Phi-2 y Zephyr 7B a la creciente lista de modelos pre optimizados para PC.
En CES, NVIDIA y sus socios desarrolladores están lanzando nuevas aplicaciones y servicios impulsados por IA generativa para PC, incluyendo: