¡Google toma la delantera en el mundo de la Inteligencia Artificial! La empresa ha presentado Gemini: su modelo de IA más avanzado hasta la fecha. Este logro representa el resultado de esfuerzos colaborativos a gran escala entre diversos equipos dentro de Google, que incluyen a nombres destacados como Google DeepMind y Google Research. Gemini llega como el fruto del proyecto científico y de investigación más grande emprendido por la compañía hasta el momento.
Es un modelo de Inteligencia Artificial multimodal, lo que significa que puede generar y comprender, operar y combinar a la perfección diferentes tipos de información, incluyendo texto, imágenes, audios, videos y lenguajes de programación.
También es el modelo más flexible hasta el momento, capaz de ejecutarse eficientemente en cualquier dispositivo, desde móviles hasta centros de datos. Gemini mejorará significativamente la forma en la que los clientes corporativos y desarrolladores construyen y escalan con IA.
Hasta el momento, el método estándar para crear modelos multimodales consistía en entrenar componentes separados para distintas modalidades, y luego unirlos para imitar a grandes rasgos algunas de sus funciones. A veces, estos modelos pueden ser buenos en determinadas tareas, como la descripción de imágenes, pero tienen algunas dificultades con el razonamiento más conceptual y complejo.
Por eso, la compañía diseñó Gemini, para que fuera un modelo de IA multimodal de forma nativa, es decir, previamente entrenado en diferentes modalidades (y desde el inicio). Se perfeccionó con datos multimodales adicionales para poder mejorar su eficacia. Esto ayuda a Gemini a comprender y razonar sin problemas todo tipo de entradas desde el principio, mucho mejor que los modelos multimodales existentes, y sus capacidades son de vanguardia en casi todos los ámbitos.
Este nuevo modelo de IA se ha puesto a prueba rigurosamente y evaluando su rendimiento en una amplia variedad de tareas que abarcan: desde la comprensión de imágenes naturales, audio y video, hasta codificación y el razonamiento matemático. El desempeño de Gemini Ultra supera 30 de los 32 puntos de referencia académicos ampliamente utilizados en la investigación y el desarrollo de grandes modelos lingüísticos. Podrán conocer más en este documento técnico, haciendo clic aquí.
Gemini 1.0 se encontrará disponible en una serie de productos y plataformas:
Para usuarios
Para clientes y desarrolladores
A partir del 13 de diciembre, desarrolladores y clientes podrán acceder a Gemini Pro a través de la API de Gemini en Google AI Studio y en Vertex AI de Google Cloud.
Los desarrolladores de Android podrían crear aplicaciones sobre Gemini Nano, nuestro modelo más eficiente para dispositivos móviles, a través de AI Core.
De cara al futuro
La versión Ultra de Gemini se encuentra ahora en etapa de pruebas de seguridad con socios externos y la abriremos a un grupo de usuarios, desarrolladores y clientes para una experimentación temprana a comienzos del próximo año.
Esto es un hito importante en el desarrollo de la Inteligencia Artificial y el comienzo de una nueva era para Google, a medida que continúa innovando rápidamente y avanzando de manera responsable en las capacidades de cada uno de los nuevos modelos. Hasta el día de hoy, la compañía ha alcanzado grandes progresos y seguirá trabajando arduamente para ampliar aún más sus capacidades para versiones futuras.
Si estás interesado en conocer más detalles sobre las capacidades y aplicaciones de Gemini u otras novedades en inteligencia artificial, te recomendamos mantener un ojo en T3 Latam. Aquí te mantendreoms infromado con las mejores noticias y desarrollos tecnológicos.