Inteligencia Artificial Generativa y Marcas de Agua ¿Qué es LAION-5B?

¿Cómo Entrenan las IA con Nuestras Imágenes? ¿Están Nuestras Obras de Arte en sus Bases de Datos?

¿Qué es LAION-5B? Plagio, Privacidad y Seguridad en Juego.

A estas alturas, es probable que las personas hayan oído hablar de herramientas de inteligencia artificial generativa (IA) como ChatGPT, DALL-E y GitHub Copilot, entre otras. Estas herramientas están ganando un interés generalizado debido a su capacidad para permitir que cualquier individuo pueda crear contenido, ya que permite la generación de texto, imágenes, videos, código de programación, generación de datos y traducción de idiomas en cuestión de momentos (Brady, 2023).

El modelo Stable Diffusion, por ejemplo, tiene la capacidad de generar imágenes de alta calidad a partir de texto, lo que podría ser utilizado para crear contenidos falsos con fines de desinformación y manipulación. Este modelo se entrenó con conjuntos de datos de Stability AI y LAION (Rombach, Blattmann, Lorenz, Esser, & Ommer, 2021), esta última su versión LAION-5B está compuesto por un conjunto de datos a gran escala filtrado por CLIP de 5850 millones de pares de imágenes y texto de alta calidad, con herramientas de exploración y detección de marcas de agua, es importante destacar que esta base de datos es abierta a todo el mundo, lo que promueve la transparencia en la investigación (Beaumont et al., 2022).

LAION-5B está trabajando en el reconocimiento de marca de agua, la empresa LAION menciona:

“Si bien tratamos de seleccionar un conjunto de prueba para evaluar la calidad de nuestro modelo de detección de marcas de agua, nos dimos cuenta de que es casi imposible trazar una línea clara entre lo que realmente es una marca de agua y lo que no lo es”

(Beaumont et al. 2022, par 25.).

Esto sugiere que es difícil determinar con precisión qué es una marca de agua y qué no lo es, lo que hace que la evaluación de un modelo de detección de marcas de agua sea un desafío.

En el artículo, Laion-5b: una nueva era de conjuntos de datos multimodales abiertos a gran escala, elaborado por Beaumont et al. (2022) revelan que tras recolectar un conjunto de datos de entrenamiento con 90.000 imágenes, 50% con marcas de agua y 50% limpias, para abordar el problema de las imágenes con marcas de agua al entrenar modelos generativos, se entrenó un modelo de detección de marcas de agua y se usó para calcular puntajes de confianza para cada imagen en LAION-5B; la evaluación de la calidad del modelo de detección de marcas de agua resultó ser difícil, ya que no existe una definición clara y universal de lo que constituye una marca de agua en una imagen.

Los investigadores creen que eliminar imágenes con alta puntuación de marca de agua según su modelo reducirá el porcentaje de imágenes obviamente marcadas. Utilizaron el juicio consensuado para seleccionar un modelo que fuera “bueno” para detectar marcas de agua obvias como las que se usan en sitios populares de imágenes de archivo.

Fuente: (Laion,2022)

Es importante destacar que estos problemas no son exclusivos de este modelo IA en particular, sino que son un problema generalizado que afecta a muchas tecnologías, las cuales también están trabajando para buscar una solución, como Microsoft Copilot Jakkal (2023) vicepresidenta de seguridad de Microsoft Corporation indica que, con el lanzamiento de Security Copilot ofrece una defensa de extremo a extremo a velocidad y escala, este modelo específico de seguridad cuenta con habilidades específicas de seguridad y se basa en la inteligencia de amenazas global única de Microsoft, respaldada por más de 65 billones de señales diarias. Security Copilot se ejecuta en la infraestructura de hiperescala de Azure, lo que proporciona una experiencia de seguridad y privacidad de nivel empresarial.

Fuentes Bibliográficas

Guía de anotación estricta de marca de agua. Fuente: (Laion,2022)
Rombach, R., Blattmann, A., Lorenz, D., Esser, P., & Ommer, B. (16 de 11 de 2021). CompVis/stable-diffusion. Obtenido de GitHub: https://github.com/CompVis/stable-diffusion#readme
Beaumont, R., Schuhmann, C., Vencu, R., Coombes, T., Gordon, C., Katta, A., . . . Jitsev, J. (31 de 3 de 2022). LAION-5B: A NEW ERA OF OPEN LARGE-SCALE MULTI-MODAL DATASETS. Obtenido de Laion.ai: https://laion.ai/blog/laion-5b/

Si te gusto el contenido, de seguro te va interesar los 4 Addons completamente gratis para Blender

Inteligencia Artificial Generativa y Marcas de Agua ¿Qué es LAION-5B?

Relacionado

Deja un comentario Cancelar respuesta