La tecnología avanza a pasos agigantados. Y lo que tampoco se detiene es la censura china. La empresa tecnológica Baidu acaba de presentar ERNE-ViLG. Se trata de una nueva IA de texto a imagen capaz de generar imágenes reales sobre diferentes aspectos culturales del gigante asiático. Incluso también es capaz de crear anime, mejorando a otras IA punteras como DALL-E 2.

Sin embargo, lo que no cambia es la censura en China. Y es que, por ejemplo, la segunda plaza más grande del país y de gran carga tanto histórica, como cultural y política, la Plaza de Tiananmen, no aparece en esta herramienta de IA. Un detalle que no pasó desapercibido por los usuarios cuando a finales de agosto se lanzó una demostración de este software.

Rápidamente, se percataron que ciertos líderes políticos o palabras consideradas como controvertidas fueron etiquetadas como “sensibles”. Por lo que fueron bloqueadas en los resultados. No es ni mucho menos la primera vez que tecnología y censura van de la mano en China. Su `competidora´ DALL-E 2 prohíbe el contenido sexual e imágenes de contenido médico o rostros de personajes públicos.

Cómo funciona ERNIE-ViLG

El modelo ERNIE-ViLG forma parte de Wenxin, un proyecto a gran escala en procesamiento de lenguaje natural de Baidu. Lo componen una serie de datos de 145 millones de pares imagen-texto y contiene 10.000 millones de parámetros que la IA utiliza para discernir las sutiles diferencias entre conceptos y estilos de arte.

¿Y esto que supone en la práctica? Que ERNIE-ViLG posee un conjunto de datos más pequeño que DALL-E 2, que se queda en 650 millones de pares, y Stable Diffusion con 2.3 mil millones de pares. Pero, sin embargo, más parámetros que cualquiera de los dos De momento, Baidu ha lanzado una versión demo en su propia plataforma y también en Hugging Face, una de las comunidades internacional de IA más importantes.

La principal diferencia entre ERNIE-ViLG y otros softwares occidentales es que el desarrollado por Baidu entiende las indicaciones escritas en chino. Además, es menos probable que cometa errores cuando se trata de palabras tan especificas culturalmente.

Por ejemplo, un creador de videos chino comparó los resultados de diferentes modelos que incluían figuras históricas chinas, celebridades de la cultura pop y comida. Y descubrió que ERNIE-ViLG producía imágenes más precisas que DALL-E 2 o Stable Diffusion. Tras su lanzamiento, ERNIE-ViLG también ha sido adoptado por la comunidad de anime japonesa.

La censura como ´garante´ de la seguridad y la estabilidad nacional

En una prueba llevada a cabo por MIT Technology Review, se comprobó cómo se habían bloqueado varias palabras chinas como nombres de líderes políticos chinos de alto perfil como Xi Jinping y Mao Zedong. También términos que pueden considerarse políticamente sensibles, como `revolución´, o el nombre del fundador y CEO de Baidu, Yanhong (Robin) Li.

Si bien se permiten palabras como `democracia´ y `gobierno´, las indicaciones que las combinan con otras palabras, como ´democracia en Medio Oriente´ o ´gobierno británico´, están bloqueadas.

No es algo nuevo ni mucho menos, de hecho en China las compañías de redes sociales suelen tener listas de palabras sensibles que han sido incluso elaboradas mediante instrucciones del gobierno.

En enero de este año, el gobierno chino propuso una nueva regulación que prohíbe cualquier contenido generado por IA que, según él, ponga en peligro la seguridad nacional y la estabilidad social. Pese a esto, no hay que menospreciar el potencial de ERNIE-ViLG, que seguirá ocupando un papel importante en el desarrollo de IA de texto a imagen a gran escala.

Fuente info
Autor: Sergio Delgado