Este año se ha hablado mucho de la inteligencia artificial y, aunque sigue creciendo en cuanto a capacidades y precisión, Google acaba de anunciar algunas herramientas nuevas para los usuarios de Google Cloud que parecen bastante especiales.
En una entrada del blog de Google Cloud a principios de diciembre, el director senior de gestión de productos de la empresa, Warren Barkley, reveló que estaba invirtiendo en tecnología de IA con nuevos modelos: Veo e Imagen 3. El primero es un modelo de generación de video, mientras que Imagen 3 crea imágenes más avanzadas.
Veo permitirá a los usuarios crear un video a partir de un simple texto o una imagen. Puede hacerlo en lo que Google describe como "videos de alta calidad y definición" y "en una amplia gama de estilos cinematográficos y visuales con una velocidad excepcional".
En la entrada del blog, Google ofrece algunos ejemplos de cómo Veo es capaz de crear clips a partir de imágenes existentes o generadas por IA. Los dos primeros ejemplos utilizan imágenes creadas por Imagen 3 para crear clips de video cortos, o un hombre que levanta la vista de un libro y sonríe. También hay un perro que se levanta y mueve la cola. Los dos segundos ejemplos han creado videos cortos a partir de imágenes del mundo real: el primero muestra bombones asándose sobre una fogata, y el segundo, una multitud en un concierto.
Google afirma que Veo tiene "una comprensión avanzada del lenguaje natural y la semántica visual", lo que le permite generar videos precisos. Explica que el nuevo sistema puede crear un movimiento realista y coherente, de modo que "las personas, los animales y los objetos se mueven de forma realista a lo largo de las tomas".
En lo que respecta a las indicaciones de texto, Google ofreció algunos ejemplos de cómo el modelo Veo realizaría también esto, con un ejemplo que mostraba a un osito de peluche tocando la guitarra (seguro), mientras que el otro era un barco de vela navegando por aguas agitadas.
En cuanto a Imagen 3, Google presume que representa el "modelo texto-imagen de mayor calidad" de la compañía hasta la fecha. Puede generar imágenes mucho más detalladas y fotorrealistas, con menos elementos de imagen.
Tanto Veo como Imagen 3 estarán disponibles en la plataforma Vertex AI de Google. Veo está disponible en versión preliminar privada, mientras que Imagen 3 debería estar a lista para los clientes de Vertex AI a partir de esta semana.
Por ahora, el objetivo se dirige más a las grandes empresas, pero entre ellas se incluyen fabricantes de smartphones como Honor, que ofrecen modelos como Imagen en sus dispositivos.