Si hay algo de lo que no se podrá escapar en 2025, eso será la inteligencia artificial, o IA para abreviar. Todo el mundo se ha sumado a ella, y Gemini de Google aparece en más lugares y con funciones más avanzadas en herramientas de creación de texto, imágenes y video.
Tras haber añadido la edición de imágenes nativa en Gemini a principios de este año, ahora DeepMind ha dado un paso más con una nueva suite de edición de imágenes integrada en la aplicación Gemini, disponible en todo el mundo tanto para los usuarios de pago como para los de uso gratuito.
¿La clave de esta actualización? "Centrarse especialmente en mantener la semejanza de un personaje de una imagen a otra", según el blog oficial de Google. Pero hay más, así que aquí tienes un resumen de lo que Google Gemini puede hacer ahora:
Sube una foto tuya (o de otra persona) y ahora puedes pedirle a Gemini que cambie el vestuario o ajuste la ubicación.
Echa un vistazo a la galería de arriba para ver algunos ejemplos, en los que nuestro protagonista se transforma de fotógrafo a médico, panadero, escultor… Las posibilidades son infinitas.
Esto podría ser lo más importante de la nueva actualización de Gemini: la capacidad de combinar dos imágenes y pedirle que ofrezca un único resultado en una nueva imagen.
Puedes ver el proceso paso a paso en la galería de arriba, donde se le presenta a Gemini una mujer con una pelota de baloncesto y un perro con la cabeza asomada por la ventanilla de un coche, y se le pide que cree una nueva imagen.
La IA parece capaz de mantener el realismo de ambos sujetos en la nueva imagen, mezclándolos como si se tratara de una escena real. Es algo alucinante.
La última actualización también permite ediciones iterativas, es decir, puedes utilizar una indicación, tomar el resultado y ampliarlo con otra indicación incremental.
"Toma una habitación vacía, pinta las paredes y luego añade una repisa, algunos muebles o una mesa de centro", se lee en el ejemplo del blog de Google.
Sí, puedes crear mundos completamente nuevos desde cero o reinventar otros a partir de imágenes reales.
La otra gran novedad son las mejoras en la "mezcla de diseños", de modo que puedes tomar un estilo, por ejemplo, de dibujos animados, y mezclarlo con otro, como un escenario más realista o de estilo artístico.
El ejemplo anterior es el resultado de la indicación: "convierte esto en un vestido impresionante". Gemini no necesita que se le diga qué es una imagen para utilizar la fuente, y el resultado es innegablemente impresionante.
Google Gemini acaba de ganar mucha potencia en la creación de imágenes.
Esto es a la vez maravilloso y preocupante, ya que se difuminan los límites entre lo que es real y lo que no lo es. Pero las herramientas de IA están aquí para quedarse y avanzan a un ritmo acelerado.
Google utiliza una marca de agua digital SynthID invisible para indicar claramente cuándo una imagen ha sido generada por IA. Sin embargo, que la gente aprenda a buscar esa información es otra cuestión.