Los modelos de síntesis de texto a imagen, como DALL-E u otros similares, han demostrado su capacidad de convertir una leyenda de entrada en una visualización coherente.
Expandiendo las capacidades de estos sistemas, un nuevo proyecto demostró que es posible procesar narrativas más largas, incluso con expresiones metafóricas, para generar más de una imagen consecutiva, como parte de una misma secuencia.
Inteligencia artificial para generar imágenes consecutivas y coherentes entre sí
Los investigadores de este nuevo proyecto, se propusieron explorar una adaptación aplicable sobre un modelo de síntesis de texto a imagen previamente entrenado, añadiéndole la capacidad de ejecutar una nueva tarea: desarrollar la continuación de la historia que se presenta en la primera imagen generada.
En esta tarea, se proporciona una escena inicial, como un modelo que el sistema puede seguir con flexibilidad como referencia, dejando en manos de un sistema preentrenado y automatizado la generación de estas imágenes.
Los sistemas de generación de imágenes conocidos hasta la fecha no han sido entrenados para la ejecución de tareas especializadas como la visualización de historias. En este caso, la capacidad añadida a la IA se apoya justamente en este factor, comprendiendo la orden de referencia como una sucesión narrativa en la que determinados personajes interactúan.
Para mantener cierta coherencia, la historia visual generada por la IA se condiciona siempre a una imagen de origen, lo que permite una mejor generalización a las narrativas con nuevos personajes.
En este proceso, el equipo de investigación tomó como punto de partida otros modelos de síntesis de texto a imagen previamente entrenados, integrando sobre ellos un nuevo enfoque que, apoyado en las mismas variables, puede rescatar sus elementos principales para marcar una continuidad con las generaciones sucesivas.
El análisis compartido por los investigadores tras este proyecto, sugiere que la capacidad de comprender narrativas que involucran a varios personajes fue uno de los principales desafíos a abordar. En este caso, fue una tarea superada satisfactoriamente, obteniendo buenos resultados en la adaptación para que estos sistemas puedan ejecutar tareas nuevas, complejas y disponiendo de bajos recursos.
El software desarrollado dentro de este proyecto se encuentra disponible en GitHub para probarlo, en caso de contar con la experiencia necesaria, en una plataforma propia. Próximamente, contarán con una demostración operativa en la web, pero de momento presentan como adelanto una captura de pantalla que ilustra cómo lucirá en el futuro.
SIENTE EL JUEGO: Siente la respuesta táctil gracias a la Retroalimentación Háptica capaz de transmitir las acciones del juego con dos activadores capaces de simular todo tipo de sensaciones, como los elementos del entorno o el retroceso de diferentes... read more
Capacidad de almacenamiento de 2 TB Conexión USB 3.0 y compatibilidad con versiones anteriores de dispositivos USB 2.4 Compatibilidad Con formato NTFS paraWindows 10+. Puede requerir reformatear para otros sistemas operativos. El nivel de compatibili... read more
Xiaomi Redmi Watch 3 Active - Llamadas Bluetooth, Pantalla LCD de 1,83”, Monitor de frecuencia cardíaca, 100 Modos Deportivos, hasta 12 días de autonomía, Negro (Versión ES + 3 años de garantía) Por solo 57,86 €
Gran pantalla LCD de 1,83". Redmi Watch 3 Active incorpora una pantalla de 1,83" para ver la información más fácilmente, con nueva interfaz, más información y detalles en cada pantalla Compatible con llamadas Bluetooth, responde y habla desde tu smar... read more
Mini y portátil: la impresora térmica es de 8 x 8 x 3,5 cm, la mini impresora se puede poner fácilmente en un bolsillo o bolsa para llevarla a cualquier lugar. Batería duradera: capacidad de batería de 1200 mAh, utiliza el cable USB adjunto para carg... read more
Cascos Gaming, Auriculares Gaming para PS4 PS5 PC Xbox One Switch, 3D Estéreo Sonido, Cascos con Microfono Cancelación de Ruido, Cascos PS4 con 3.5mm Jack Por solo 21,99 €18,69 €
【Crear Una Experiencia De Juego Inmersiva】 Auriculares gaming utiliza tecnología de audio de vanguardia, equipado con controladores de audio de alta calidad de 50 mm y tecnología de sonido envolvente, proporcionando efectos de sonido claros y sin ret... read more
Compatible con Chromebook. La tarjeta SanDisk Ultra microSD UHS-I se ha probado y certificado para funcionar sin problemas con Chromebooks. Por tanto, puedes tener la tranquilidad de que es la tarjeta adecuada Hasta 512 GB de almacenamiento. Ya sea p... read more
✅ El cartucho de tóner compatible TN2420 TN2410 es una alternativa rentable al consumible original para aquellos que buscan ahorrar en su presupuesto de impresión. La caja contiene 2x cartuchos de tóner compatible negro TN2420/TN2410. 🖨 La compatibil... read more
【Mini teclado plegable】El teclado Bluetooth se puede plegar en tres en tamaño de bolsillo, conveniente para llevar cuando viaja o en caso de emergencia. Tamaño plegable: 30,4*9,8*1cm; Tamaño desplegado: 15,2*9,8*2 cm. 【Teclado Bluetooth multidisposit... read more
Tecnologia 3D NAND flash que garantiza un rendimiento optimizado. Tecnología de caché slc para aumento de rendimiento y mayor vida útil; habilite un tiempo de arranque corto y una carga rápida de aplicaciones 7mm, adaptado para ultrabooks; a prueba d... read more
Disco duro externo tipo C para mayor durabilidad y velocidad; ¡Este disco duro externo tipo C/USB 3.1 trae un nuevo nivel para almacenamiento externo! El extremo de tipo C avanzado permite la inserción ciega en ambos lados para prolongar su vida útil... read more
Obtén un rápido rendimiento de estado solido con velocidades de lectura de 520 MB/s en una memoria portátil Haz copias de seguridad de tus contenidos y recuerdos en una solución de almacenamiento que se adapta perfectamente a tu estilo de vida móvil ... read more
Canon Pixma TR4650 Impresora Multifunción 4 en 1, Sistema de Inyección de Tinta, Impresión, Escaneo, Copia y Fax, WiFi, Cartuchos Tinta XL, ADF de 20 Hojas, Impresión a Doble Cara Automática, Negro Por solo 79,00 €51,19 €
Impresora inteligente: gracias a la app Canon PRINT podrás controlar las funciones de la impresora e imprimir directamente con AirPrint (iOS) y Mopria (Android). Configuración sencilla y diseño inteligente: configura la impresora mediante la app para... read more
Deja volar tu imaginación mientras creas más rápido y mantienes un bajo consumo de energía. Con velocidades de lectura de hasta 3500 MB/s (modelos de 500 GB a 1 TB), tu sistema puede funcionar hasta cinco veces más rápido que nuestras mejores SSD SAT... read more
Nuevo Reemplazado TD Systems TV Mando a Distancia - No se Necesita configuración TV Control Remoto K24DLH8FS K32FMN9GT K50DLG8F 899-550-20MUS K50DLH8F K55DLM8US K50DLH8US K55DLG8US Por solo 11,59 €
Nuevo Reemplazado TD Systems TV Mando a Distancia - No se Necesita configuración TV Control Remoto K24DLH8FS K32FMN9GT K50DLG8F 899-550-20MUS K50DLH8F K55DLM8US K50DLH8US K55DLG8US Sin necesidad de programación / ajuste, funciona perfectamente sin có... read more
Diseñado para los Juegos de PlayStation P5, PS4, PS3 y PC más Recientes: Añade Driving Force a tu selección de controlador, G29 Driving Force también se puede usar en PC con determinados juegos Force Feedback Realista: G29 Driving Force incluye Force... read more