Google quiere seguir incrementando sus herramientas de edición de fotos apoyados con la IA, ya que además de la función Magic Editor, que tiene el borrador mágico como una de sus vedettes, ahora está probando una nueva característica.
RealFill es el nombre de esta función, una tecnología que permitirá a los usuarios ampliar las imágenes basándose en hasta cinco fotos de referencia.
La marca fue solicitada a través de la Oficina de Propiedad Intelectual de la Unión Europea (EUIPO) y la Oficina de Patentes y Comercio de los Estados Unidos (USPTO).
«Proporcionar software no descargable que utiliza inteligencia artificial (IA) para pintar imágenes; Proporcionar software en línea no descargable para crear modelos generativos», se lee en una breve descripción de la marca.
¿Cómo funcionaría RealFill?
RealFill es capaz de expandir y pintar con mayor precisión una imagen existente utilizando hasta cinco imágenes como referencia:
«Estas imágenes de referencia no tienen que estar alineadas con la imagen de destino y se pueden tomar con puntos de vista, condiciones de iluminación, aperturas de cámara o estilos de imagen que varían drásticamente».
En primer lugar, el equipo afina un modelo de IA generativa personalizado en las imágenes de referencia y de destino. Este proceso permite que el modelo aprenda la iluminación, el estilo y el contenido de la escena en las imágenes.
Una desventaja notable es que necesita someterse a un «proceso de ajuste fino basado en gradientes» en las imágenes de entrada, lo que hace que el proceso sea lento. También puede ser difícil recuperar la escena en la imagen final si hay una gran diferencia entre las imágenes de referencia y la imagen de destino. Además, los investigadores descubrieron que el texto podría ser un problema cuando se utiliza esta técnica.
RealFill salió a la luz a finales del año pasado en un artículo y un sitio web de un equipo de investigadores de Google y la Universidad de Cornell. El documento, titulado «Reference-Driven Generation for Authentic Image Completion», describe una forma de expandir y pintar imágenes con mayor precisión.
Recomendaciones del editor