OpenAI y Midjourney entrenarán sus modelos de IA con datos de usuarios de Tumblr y Wordpress.
OpenAI y Midjourney entrenarán sus modelos de IA con datos de usuarios de Tumblr y Wordpress.
/ KIRILL KUDRYAVTSEV
Agencia Europa Press

OpenAI y Midjourney planean utilizar datos de los usuarios de Tumblr y Wordpress tras la firma de un acuerdo con su empresa matriz, Automattic, para el entrenamiento de sus modelos generativos de (IA).

Automattic se habría preparado para organizar y vender la información de los usuarios de sus plataformas a OpenAI y Midjourney, según ha publicado recientemente a 404 Media, que cita una fuente relacionada con la matriz de Tumblr y Wordpress y una serie de documentos internos a los que ha tenido acceso.

Según escribe el gerente de Producto de Tumblr, Cycle Gage, en uno de los documentos, este “volcado de datos inicial” incluye “todo el contenido de publicaciones públicas de Tumblr entre 2014 y 2023″, también, aparentemente por error, contenido que no sería visible públicamente en los blogs.

Este otro contenido no visible se refiere a publicaciones privadas en blogs públicos, publicaciones compartidas en blogs eliminados o suspendidos, respuestas privadas a los contenidos o publicaciones marcadas como explícitas o no apropiadas (NSFW, por sus siglas en inglés) de Tumblr. Todo ello se usaría para entrenar los modelos generativos de sendas compañías.

MIRA: Apple romperá los límites de la IA generativa este año, señala Tim Cook

No obstante, tal y como ha informado The Verge en base a esta publicación, Automattic planea lanzar una nueva configuración que permitirá a los usuarios decidir qué se puede hacer con sus datos y “optar por no compartirlos con terceros, incluidas empresas de IA”.

Desde Automattic subraya, en la página dedicad a la protección de la elección del usuario, que actualmente bloquean de forma predeterminada los principales rastreadores de plataformas de IA, incluidos los de las empresas tecnológicas más relevantes, y que actualizan sus listas a medida que se lanzan nuevos servicios de este tipo para proteger a los usuarios de Wordpress y Tumblr.

También indica que están “trabajando directamente” con compañías desarrolladoras de IA, siempre que estas estén alineadas con los principios de su comunidad: “atribución, exclusión voluntaria y control”.

En este sentido, ha concretado que sus asociaciones respetarán la privacidad de los datos de los usuarios que opten por no compartirlos y que planea “ir un paso más allá”, informando periódicamente a estas compañías sobre aquellos que soliciten que sus contenidos se elimine de fuentes anteriores.

Contenido sugerido

Contenido GEC