El organismo de control de la competencia del Reino Unido explica cómo Google debería dar más control a los editores.

Por Charlotte Tobitt

El organismo de control de la competencia del Reino Unido ha dicho que los editores deberían poder optar por no permitir que su contenido se utilice en las vistas generales de inteligencia artificial de Google sin que esto afecte la forma en que aparecen en los resultados de los motores de búsqueda.

Google respondió que ya está “explorando actualizaciones a nuestros controles para permitir que los sitios opten específicamente por no usar las funciones de inteligencia artificial generativa de búsqueda”.

La Autoridad de Competencia y Mercados (CMA) también dijo que la forma en que Google decide cómo se clasifica el contenido en los resultados de búsqueda, incluidas las vistas generales de IA y el modo de IA, debe ser «justa y transparente».

Las propuestas de la CMA llegan después de que designara a Google como una plataforma tecnológica con “estatus de mercado estratégico” para su regulación en octubre .

Google, donde se realizan más del 90% de las búsquedas en línea en el Reino Unido, es la primera plataforma tecnológica que enfrenta requisitos de conducta bajo los nuevos poderes de la Ley de Mercados Digitales, Competencia y Consumidores de 2024 .

Las propuestas estarán ahora en consulta hasta el 25 de febrero, tras lo cual se tomará una decisión final.

Sarah Cardell, directora ejecutiva de la CMA, dijo que las propuestas “darían a las empresas y consumidores del Reino Unido más opciones y control sobre cómo interactúan con los servicios de búsqueda de Google”.

Agregó: “También brindarían un trato más justo para los editores de contenido, particularmente las organizaciones de noticias, sobre cómo se utiliza su contenido en las descripciones generales de inteligencia artificial de Google”.

Según el análisis de Press Gazette, Google obtiene al menos 20.000 millones de libras al año en ingresos gracias a los anunciantes del Reino Unido .

CMA: Los editores «no tienen suficiente libertad» sobre cómo Google utiliza su contenido

La CMA afirmó que los editores “actualmente no tienen suficientes opciones” sobre cómo se utiliza su contenido en las respuestas generadas por IA de Google.

Y dijo que «no tienen otra opción realista que permitir que se rastree su contenido» debido al dominio del mercado de Google.

La CMA afirmó: “Al no proporcionar suficiente control sobre cómo se utiliza posteriormente este contenido, Google puede limitar la capacidad de los editores de monetizar su contenido, al tiempo que accede al contenido para respuestas generadas por IA de una manera que sus competidores no pueden igualar”.

El efecto de todas las limitaciones impuestas por Google a los editores, según la CMA, «puede restringir su capacidad para invertir en nuevo contenido de alta calidad, lo que perjudica a los usuarios finales. Esto podría ser especialmente significativo para ciertos sectores, como el de las noticias».

Google les dice a los editores que no quieren que su contenido aparezca en las descripciones generales de IA que usen la etiqueta meta NOSNIPPET y el atributo DATA-NOSNIPPET para que permanezcan vinculados en la búsqueda orgánica sin que aparezcan resúmenes de su contenido allí ni en las funciones de IA generativas de búsqueda.

Pero la CMA dijo que «el uso de este control probablemente afectará la clasificación de búsqueda orgánica [de los editores] y reducirá el tráfico porque los editores pierden el texto descriptivo que ayuda a los usuarios a decidir si hacer clic en el sitio web».

Citó un estudio de Google (realizado antes de que existieran los productos de IA) que encontró que reducir los detalles del contenido del editor en las búsquedas reducía el tráfico en un 45%.

Los editores también pueden usar el control robots.txt extendido de Google para optar por no permitir que el chatbot de IA Gemini y la plataforma de desarrollo de IA Vertex recopilen su contenido, pero esto no impide que se acceda a los sitios y se los use en las descripciones generales de IA de Google o en los resultados de búsqueda principales.

La CMA dijo que había una “falta de claridad sobre el alcance” de Google Extended, lo que “impide a los editores tomar una decisión informada sobre cómo se utiliza su contenido en servicios de inteligencia artificial generativa más amplios”.

Por lo tanto, el regulador dijo que Google debería «ofrecer a los editores controles efectivos para evitar que su contenido de búsqueda se utilice» en el entrenamiento y la puesta a tierra de sus servicios de inteligencia artificial generativa más amplios, como Gemini y Vertex, así como en la puesta a tierra de AI Overviews y AI Mode.

Google define la conexión a tierra como «la capacidad de conectar los resultados de un modelo con fuentes de información verificables. Si se proporciona a los modelos acceso a fuentes de datos específicas, la conexión a tierra vincula sus resultados a estos datos y reduce las posibilidades de inventar contenido».

La CMA afirmó que se deben realizar “cualquier cambio necesario” en Google Extended para permitir que los editores excluyan su contenido de búsqueda del entrenamiento y la puesta a tierra de la IA.

Además, se debe publicar información “clara y detallada” sobre el alcance del control de Google Extended, incluido su propósito, las principales excepciones y limitaciones del mismo y qué contenido del editor cubre.

La CMA agregó que, en relación con la puesta a tierra de las Reseñas de IA y el Modo de IA, Google debería introducir un nuevo control para poder optar por no participar tanto a nivel de directorio (todo el sitio web) como a nivel de página (por ejemplo, en el contenido donde los resúmenes de IA generativos tendrían el mayor impacto en los clics) y no debe «tomar ninguna acción u omisión que frustre la eficacia de los controles».

La CMA también afirmó que Google no debe “mantener o introducir señales de clasificación” diseñadas para rebajar en los resultados de búsqueda generales a los editores que hayan optado por no permitir que su contenido se utilice en las vistas generales de IA y el modo de IA.

Estos editores tampoco deberían tener su contenido “presentado o mostrado de manera diferente” en la búsqueda general.

Y Google no debe “intentar eludir la decisión de cualquier editor de retener su contenido de búsqueda adquiriendo ese contenido a través de otras fuentes”, por ejemplo, a través de raspadores de terceros que se cree que han sido utilizados por otras plataformas de IA.

La CMA afirmó, sin embargo, que sería “razonable” que Google “adquiriera dicho contenido a través de conjuntos de datos de código abierto, cuando estos conjuntos de datos hayan obtenido contenido legalmente”.

Los editores tienen una «transparencia limitada» sobre cómo Google utiliza su contenido

La CMA también afirmó que los editores “tienen una transparencia limitada sobre cómo su contenido, recopilado para búsquedas, es utilizado por Google en respuestas generadas por IA y cómo los usuarios interactúan con ese contenido.

“Esto dificulta que los editores tomen decisiones informadas, incluso sobre si permitir o no que Google use su contenido y con qué fines”.

Se propone que Google “publique información clara y detallada que explique cómo se utiliza el contenido de búsqueda para el entrenamiento y la puesta a punto de sus servicios y funciones de IA generativa”, por ejemplo, en su sitio web Google Search Central.

La CMA también dijo que Google debería asegurarse de que el “efecto y alcance” de las formas en que los editores pueden controlar el uso de su contenido “sean transparentes y puedan entenderse bien”.

Los editores también deberían recibir “métricas claras y detalladas sobre la participación de los usuarios con su contenido de búsqueda cuando se utiliza en sus funciones de inteligencia artificial generativa de búsqueda”.

Estos datos deben incluir impresiones de los usuarios (incluso cuando el contenido de un editor se atribuye en Vistas generales de IA o Modo de IA), clics desde enlaces en esas funciones de IA para que los editores puedan evaluar la calidad de esos clics y la tasa de clics (el porcentaje de usuarios que hacen clic).

Los datos deben proporcionarse de forma desagregada para cada editor, totalmente desagregados de otros elementos de búsqueda general y a través de una plataforma de acceso común como Google Search Console.

Por qué Google necesita una mejor atribución de fuentes en las vistas generales de IA y el modo de IA

La CMA también afirmó que la atribución de contenido en productos de IA como AI Overviews es importante tanto para los consumidores como para los editores. Para los consumidores, la atribución les permite comprobar la veracidad del contenido generado por IA.

“Para los editores, la atribución puede ayudar a garantizar que los consumidores conozcan las fuentes del contenido, lo que a su vez puede permitirles mantener el valor de la marca y la creación de material nuevo”.

El organismo de control afirmó que había visto “evidencia de que una atribución prominente y precisa… puede tener un impacto significativo en los resultados de los editores, incluidas las tasas de clics”.

La CMA dijo que Google ha estado tomando «medidas concretas» para mejorar la atribución, pero que «la incapacidad de los editores de retirar contenido contribuye a que Google no tenga incentivos suficientes para garantizar que su atribución a los editores en las funciones de inteligencia artificial generativa de búsqueda siga siendo precisa y suficientemente destacada».

Las nuevas propuestas establecen que Google debe “tomar medidas razonables para garantizar” que el contenido se atribuya de manera suficiente y precisa en AI Overviews y AI Mode y que debe publicar “información clara y detallada” que explique cómo lo hace.

Esa explicación debe incluir cómo Google identifica qué contenido atribuir y los pasos que toma para monitorear la precisión de sus atribuciones.

La CMA afirmó: “Dada la forma en que se crean las respuestas de IA generativa, reconocemos que las funciones de IA generativa de búsqueda no siempre pueden ser completamente precisas; sin embargo, esperamos que Google describa los pasos que toma para mejorar la veracidad de las funciones de IA generativa de búsqueda, cómo aborda las inexactitudes fácticas cuando surgen y las métricas sobre la veracidad que ayudarían a los editores a tomar una decisión sobre si dar su consentimiento para que Google utilice su contenido de búsqueda en las funciones de IA generativa de búsqueda”.

La CMA dijo que reconocía que sus propuestas colectivas «no abordarían todos los problemas que enfrentan actualmente los editores», pero dijo que los cambios «serían una condición previa importante para abordar preocupaciones más amplias sobre la capacidad de los editores de negociar términos razonables con Google para el uso de su contenido de búsqueda».

Respuesta de Google a las propuestas de la CMA

Ron Eden, director de gestión de productos de Google, declaró: «Durante años, hemos proporcionado a los editores web una serie de controles , basados ​​en estándares abiertos como robots.txt, para gestionar cómo aparece su contenido en la Búsqueda. A medida que la tecnología ha evolucionado, también lo han hecho nuestras herramientas».

Agregamos controles para elementos como fragmentos destacados y vistas previas de imágenes (que también se aplican a las vistas generales de IA). Y más recientemente, presentamos Google-Extended , un nuevo control que permite a los sitios web administrar cómo se usa su contenido para entrenar nuestros modelos de Gemini.

Eden continuó: «A partir de este marco y trabajando con el ecosistema web, estamos explorando actualizaciones de nuestros controles para permitir que los sitios web desactiven específicamente las funciones de IA generativa de la Búsqueda. Nuestro objetivo es proteger la utilidad de la Búsqueda para quienes buscan información rápida, a la vez que brindamos a los sitios web las herramientas adecuadas para administrar su contenido. Esperamos participar en el proceso de la CMA y continuaremos las conversaciones con los propietarios de sitios web y otras partes interesadas sobre este tema.»

Cualquier nuevo control debe evitar que la búsqueda se fragmente o genere una experiencia confusa. A medida que la IA se convierte en un componente fundamental de la búsqueda de información, cualquier nuevo control también debe ser simple y escalable para los propietarios de sitios web.

“Somos optimistas de que podemos encontrar un camino a seguir que ofrezca aún más opciones a los propietarios y editores de sitios web, al tiempo que garantiza que las personas sigan obteniendo la experiencia de búsqueda más útil e innovadora posible”.

La NMA insta a una «separación física total de los rastreadores»

Owen Meredith, director ejecutivo de News Media Association, que representa a los principales editores nacionales y regionales del Reino Unido, dijo: «Acogemos con gran satisfacción las propuestas de la CMA para permitir que los editores de noticias controlen si su contenido se utiliza en las vistas generales de IA mientras permanecen visibles en los resultados de búsqueda de Google y para garantizar una clasificación justa del contenido del editor.

“La CMA reconoce correctamente que Google puede extraer datos valiosos sin recompensa, lo que perjudica a los editores y le otorga a la empresa una ventaja injusta sobre sus competidores en el mercado de modelos de IA, incluidas las empresas emergentes británicas”.

Sin embargo, Meredith dijo que «dada la gravedad del impacto anticompetitivo de Google en los medios de comunicación y el mercado de IA, somos escépticos de que las soluciones conductuales más débiles sean suficientes, e instamos a la CMA a considerar la separación física total de los rastreadores para productos de búsqueda y de IA individuales.

Garantizar que la CMA cuente con los recursos y el apoyo adecuados del gobierno permitirá al regulador avanzar con mayor rapidez en otras intervenciones esenciales, como exigir a Google que negocie condiciones de pago justas y razonables con los editores. Sin una obligación clara de Google de negociar, los editores seguirán enfrentándose a importantes obstáculos para obtener un precio justo por su valioso contenido. Es fundamental que los ministros apoyen a la CMA para que avance con rapidez.

En una carta reciente al Comité Digital de Comunicaciones de los Lores, que está llevando a cabo una investigación sobre IA y derechos de autor, Meredith solicitó «soluciones que garanticen que Google mantenga el rastreo para la búsqueda general y el rastreo para el desarrollo o la provisión de interfaces de búsqueda de IA (como las vistas generales de IA y el modo de IA) por separado, y debe buscar el consentimiento informado de un editor antes de implementar un rastreador web con el propósito de una interfaz de búsqueda de IA en el sitio web de un editor».

La exclusión voluntaria del scraping de IA «debe ser significativa»

En julio del año pasado, la organización sin fines de lucro de justicia tecnológica Foxglove, la Independent Publishers Alliance y el grupo de campaña Movement for an Open Web presentaron conjuntamente una queja legal ante la CMA sobre el impacto de Google AI Overviews en los editores de noticias.

Rosa Curling, codirectora ejecutiva de Foxglove, dijo en respuesta a las soluciones planeadas por la CMA: “Es una buena noticia que la CMA esté considerando propuestas que podrían ayudar a evitar que Google robe el trabajo de periodistas y organizaciones de noticias independientes.

“Sin embargo, es crucial que la CMA confirme que su propuesta de exclusión voluntaria del ‘scraping de IA’ es significativa: no se debe permitir que Google penalice a aquellas organizaciones que opten por no participar degradándolas o eliminándolas de la búsqueda.

La CMA también debe actuar con mayor urgencia. Foxglove presentó una queja detallando este problema el pasado junio; el regulador debe actuar con rapidez, antes de que sea demasiado tarde. La pérdida de organizaciones de noticias independientes no solo es una mala noticia para el periodismo, sino también para una democracia informada en el Reino Unido.

El grupo de campaña Movimiento por una Web Abierta dijo que las soluciones propuestas por la CMA “son muy insuficientes”.

El cofundador Tim Cowen afirmó: «Las Vistas Generales de IA de Google están robando enormes cantidades de tráfico y, por lo tanto, ingresos a los editores. Dejar de usar las Vistas Generales de IA en el futuro no cambiará eso; simplemente impedirá que los editores accedan a las escasas migajas de tráfico que podrían obtener al estar presentes en las AIO».

“Lo que se necesita es una desagregación forzada y un pago por la pérdida de oportunidades de negocios al quedar excluido de los rankings.

La CMA está consultando sobre los requisitos de conducta. El DCMS consultará sobre el mecanismo de pago para el uso de IA. Ambas partes deberían considerar la postura de la otra para abordar plenamente el problema que Lisa Nandy* ha expresado tan bien.

Fuente: Press Gazette