Nuevamente estamos ante una batalla por el control de los datos en internet, recientemente hemos conocido a través de The Verge, que Reddit ha decidido bloquear Wayback Machine, la herramienta de Internet Archive que durante años nos ha permitido viajar al pasado de las web. Cabe mencionar que dicha medida no es casual, ya que algunas compañías de inteligencia artificial han estado extrayendo información de sus archivos, aún en contra las reglas de la plataforma.
Así pues, a partir de ahora en adelante, la gran mayoría de las páginas, hilos, comentarios y hasta perfiles dejarán de estar accesibles al rastreo de Wayback Machine. En su lugar, solo se podrá indexar las páginas principales y los comentarios más populares del día, limitando drásticamente el historial de la comunidad.
Motivos por los qué Reddit bloquea a Internet Archive
De acuerdo a las explicaciones de Reddit a The Verge, la compañía ha detectado que múltiples empresas de inteligencia artificial se están aprovechando de Internet Archive para obtener datos y entrenar sus modelos, incumpliendo así las políticas de la plataforma,
Con está medida, Reddit quiere proteger la privacidad de sus usuarios y así evitar que el contenido eliminado o sensible siga siendo accesible a las copias almacenadas en Internet Archive. Por lo tanto, hasta que la plataforma no garantice el cumplimiento de estas políticas, el acceso quedará restringido.
El cambio será progresivo en Reddit
Las restricciones comenzarán a implementarse de forma gradual, iniciando el día de hoy. Por otra parte, según Reddit, antes de tomar está medida ya se le había notificado a Internet Archive, pero no al parecer esto no es de ahora, ya que anteriormente ya habían hablado del tema.
Pero está no es la la primera vez que Reddit limita el acceso a todos sus datos, si recordamos un poco:
- En 2023, cambió su API según para evitar abusos, esto acabo con el cierre de varias aplicaciones de terceros.
- También acordó con Google y OpenAI la concesión de todos sus datos a cambio de un pago, y bloqueo a otros motores de búsqueda que no aceptaron sus condiciones.
- También en junio del corriente año demando a Anthropic por seguir extrayendo la su información, incluso de haber prometido no seguir haciéndolo.
Wayback Machine en el punto de mira
Internet Archive es una organización sin animo de lucro cuya única misión es preservar una copia digital de la web y otros recursos culturales. En la actualidad, Wayback Machine ha sido utilizada por periodistas, investigadores y usuarios para consultar versiones pasadas de páginas web.
Sin embargo, para Reddit, esta herramienta se ha convertido en un canal por el que empresas de inteligencia artificial pueden acceder a datos que ya no deberían estar disponibles.
Sin embargo, para Reddit está herramienta se ha convertido en el canal por donde las empresas de inteligencia artificial pueden acceder a sus datos, los cuales, ya no debería de estar disponibles.
Con todas estas medidas, Reddit quiere monetizar todo su contenido y mantener el control estricto de cómo se usa. El movimiento refleja la tendencia creciente de las grandes plataformas de cerrar sus puertas a los rastreos, siempre y cuando las compañías detrás de estos estén dispuestos a pagar.
Comentarios!