Inteligencia Artificial Generativa y Marcas de Agua ¿Qué es LAION-5B?

¿Cómo Entrena la Inteligencia Artificial Generativa con Nuestras Imágenes? ¿Están Nuestras Obras de Arte en sus Bases de Datos? ¿Qué es LAION-5B? Plagio, Privacidad y Seguridad en Juego.

A estas alturas, es probable que las personas hayan oído hablar de herramientas de inteligencia artificial generativa (IA) como ChatGPT, DALL-E y GitHub Copilot, entre otras. Estas herramientas están ganando un interés generalizado debido a su capacidad para permitir que cualquier individuo pueda crear contenido, ya que permite la generación de texto, imágenes, videos, código de programación, generación de datos y traducción de idiomas en cuestión de momentos (Brady, 2023).

El modelo Stable Diffusion, por ejemplo, tiene la capacidad de generar imágenes de alta calidad a partir de texto, lo que podría ser utilizado para crear contenidos falsos con fines de desinformación y manipulación. Este modelo se entrenó con conjuntos de datos de Stability AI y LAION  (Rombach, Blattmann, Lorenz, Esser, & Ommer, 2021), esta última su versión  LAION-5B está compuesto por  un conjunto de datos a gran escala filtrado por CLIP de 5850 millones de pares de imágenes y texto de alta calidad, con herramientas de exploración y detección de marcas de agua, es importante destacar que esta base de datos es abierta a todo el mundo, lo que promueve la transparencia en la investigación (Beaumont et al., 2022).

Reconocimiento de las marcas de agua

LAION-5B  está trabajando en el reconocimiento de marca de agua, la empresa LAION menciona:

“Si bien tratamos de seleccionar un conjunto de prueba para evaluar la calidad de nuestro modelo de detección de marcas de agua, nos dimos cuenta de que es casi imposible trazar una línea clara entre lo que realmente es una marca de agua y lo que no lo es” (Beaumont et al. 2022, par 25.).

Esto sugiere que es difícil determinar con precisión qué es una marca de agua y qué no lo es, lo que hace que la evaluación de un modelo de detección de marcas de agua sea un desafío.

En el artículo, Laion-5b: una nueva era de conjuntos de datos multimodales abiertos a gran escala, elaborado por Beaumont et al. (2022) revelan que tras recolectar un conjunto de datos de entrenamiento con 90.000 imágenes, 50% con marcas de agua y 50% limpias, para abordar el problema de las imágenes con marcas de agua al entrenar modelos generativos, se entrenó  un modelo de detección de marcas de agua y se usó para calcular puntajes de confianza para cada imagen en LAION-5B; la evaluación de la calidad del modelo de detección de marcas de agua resultó ser difícil, ya que no existe una definición clara y universal de lo que constituye una marca de agua en una imagen.

Los investigadores creen que eliminar imágenes con alta puntuación de marca de agua según su modelo reducirá el porcentaje de imágenes obviamente marcadas. Utilizaron el juicio consensuado para seleccionar un modelo que fuera «bueno» para detectar marcas de agua obvias como las que se usan en sitios populares de imágenes de archivo.

Guía de anotación estricta de marca de agua
Fuente: (Laion,2022)

Es importante destacar que estos problemas no son exclusivos de este modelo IA en particular, sino que son un problema generalizado que afecta a muchas tecnologías, las cuales también están trabajando para buscar una solución, como Microsoft Copilot  Jakkal (2023) vicepresidenta de seguridad de Microsoft Corporation indica que, con el lanzamiento de Security Copilot ofrece una defensa de extremo a extremo a velocidad y escala, este modelo específico de seguridad cuenta con habilidades específicas de seguridad y se basa en la inteligencia de amenazas global única de Microsoft, respaldada por más de 65 billones de señales diarias. Security Copilot se ejecuta en la infraestructura de hiperescala de Azure, lo que proporciona una experiencia de seguridad y privacidad de nivel empresarial.

En conclusión, la inteligencia artificial generativa, como LAION-5B, abre grandes oportunidades, pero también plantea retos en privacidad, seguridad y derechos de autor. Avanzar de forma ética y transparente será clave para aprovechar su potencial sin comprometer valores esenciales.

¿Tienes alguna opinión o pregunta sobre este tema? ¡Déjala en los comentarios! Y si te interesa, no te pierdas nuestro post sobre cómo la IA está revolucionando el diseño gráfico.

Fuentes Bibliográficas

  • Guía de anotación estricta de marca de agua. Fuente: (Laion,2022)
  • Rombach, R., Blattmann, A., Lorenz, D., Esser, P., & Ommer, B. (16 de 11 de 2021). CompVis/stable-diffusion. Obtenido de GitHub: https://github.com/CompVis/stable-diffusion#readme
  • Beaumont, R., Schuhmann, C., Vencu, R., Coombes, T., Gordon, C., Katta, A., . . . Jitsev, J. (31 de 3 de 2022). LAION-5B: A NEW ERA OF OPEN LARGE-SCALE MULTI-MODAL DATASETS. Obtenido de Laion.ai: https://laion.ai/blog/laion-5b/

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Información básica sobre protección de datos Ver más

  • Responsable: Jessica Toaquiza.
  • Finalidad:  Moderar los comentarios.
  • Legitimación:  Por consentimiento del interesado.
  • Destinatarios y encargados de tratamiento:  No se ceden o comunican datos a terceros para prestar este servicio. El Titular ha contratado los servicios de alojamiento web a Hostinger que actúa como encargado de tratamiento.
  • Derechos: Acceder, rectificar y suprimir los datos.
  • Información Adicional: Puede consultar la información detallada en la Política de Privacidad.

Esta web utiliza cookies propias y de terceros para su correcto funcionamiento y para fines analíticos. Contiene enlaces a sitios web de terceros con políticas de privacidad ajenas que podrás aceptar o no cuando accedas a ellos. Al hacer clic en el botón Aceptar, acepta el uso de estas tecnologías y el procesamiento de tus datos para estos propósitos. Más información
Privacidad