Reddit está bloqueando a los grandes buscadores y sus rastreadores web de Inteligencia Artificial a menos que paguen

Si no usas Google como tu motor de búsqueda, no verás publicaciones recientes de Reddit en tus resultados de búsqueda. Esta es la nueva realidad en el mundo de los motores de búsqueda tras un movimiento reciente de Reddit, como explicó el portavoz Tim Rathschmidt en una declaración proporcionada a The Verge.

Rathschmidt comentó: «Hemos estado en conversaciones con varios motores de búsqueda. No hemos logrado acuerdos con todos ellos, ya que algunos no son capaces o no están dispuestos a hacer promesas exigibles sobre el uso del contenido de Reddit, incluido su uso para IA».

Hombre con expresión seria y brazos cruzados, situado entre los logotipos de Reddit y Google, simbolizando la reciente decisión de Reddit de restringir el acceso a sus contenidos recientes únicamente a Google.

Por lo tanto, solo Google podrá mostrar publicaciones recientes de Reddit, según el informe. Sin embargo, motores de búsqueda rivales como Bing seguirán mostrando resultados de contenido más antiguo del sitio.

Muchos usuarios suelen utilizar el comando ‘site:site.com’ en sus búsquedas cuando quieren respuestas más personales y humanas, por ejemplo, para obtener ayuda en videojuegos difíciles o recomendaciones de cuidado de la piel. Sin embargo, actualmente, si intentas esto en cualquier otro motor de búsqueda que no sea Google, es probable que termines bastante decepcionado viendo publicaciones desactualizadas de Reddit.

A principios de este año, Google firmó un acuerdo con Reddit valorado en 60 millones de dólares para permitir que sus bots de inteligencia artificial accedieran al contenido de Reddit. Este acuerdo siguió a un apagón de Reddit el año pasado (una protesta contra los cambios en la API) que dejó a Google sin acceso a una gran cantidad de subreddits.

Cabe señalar que Rathschmidt también aclaró que este último movimiento relacionado con los resultados de búsqueda “no está en absoluto relacionado con nuestra reciente asociación con Google”.

Parece que Reddit está jugando fuerte en este juego de extracción de datos, bloqueando a las IA de acceder a sus publicaciones y presentarlas como resultados para consultas. Como observa The Verge, el mes pasado, Reddit actualizó su archivo robots.txt para impedir que los rastreadores web hagan exactamente esto, subrayando que los datos de Reddit no son gratuitos.

Una portavoz de Microsoft, Caitlin Roulston, reconoció anteriormente que: «Microsoft respeta el estándar robots.txt y acatamos las indicaciones proporcionadas por los sitios web que no desean que el contenido de sus páginas se utilice con nuestros modelos de IA generativa».

En este momento, si intentas usar la etiqueta de Reddit en motores de búsqueda como Bing, aún obtendrás publicaciones de Reddit relacionadas con tu consulta, pero serán de hace varios años. Si necesitas consejos más recientes, tendrás que buscar con Google, al menos por ahora, hasta que otros motores de búsqueda estén dispuestos a pagar por este privilegio.

Fuente

Las últimas noticias en nuestro podcast semanal

Comentarios

No hay comentarios aún. ¿Por qué no comienzas el debate?

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.