Por Jessica Davies – 22 de agosto de 2025

Las licencias de entrenamiento en inteligencia artificial, donde los medios reciben una suma fija para que sus contenidos se utilicen para entrenar modelos, están quedando atrás. En su lugar, están surgiendo modelos más dinámicos basados en el uso, conocidos como “grounding” o “RAG” (Retrieval Augmented Generation).

¿Qué diferencia hay entre los acuerdos de entrenamiento y los de grounding?

  • Entrenamiento: implican pagos únicos o tarifas fijas por años para entrenar modelos con el contenido de los editores. Ejemplos notables incluyen acuerdos con The New York Times por US$20 millones y News Corp por US$50 millones.
  • Grounding (RAG): se basan en cómo el sistema de IA recupera contenido en tiempo real. Cuando un usuario pide, por ejemplo, “mostrarme una actualización de la reunión entre Trump y Zelensky”, el modelo no tiene esa información en su base de entrenamiento (que suele estar desfasada hasta seis meses), por lo que recurre a RAG para obtener contenido actualizado.

Este enfoque permite que los editores generen ingresos recurrentes, obtengan atribución y continúen siendo visibles —a diferencia de los acuerdos de entrenamiento, que son de una sola vez.

¿Por qué está creciendo la preferencia por el modelo de grounding?

  • Poca equidad en los pagos de entrenamiento: muchos editores no logran negociar sumas significativas, especialmente frente a gigantes como NYT o News Corp.
  • Desvalorización del contenido de entrenamiento: el valor de los datos históricos ha disminuido y muchos editores consideran que licenciar contenido para grounding es más rentable y legalmente menos problemático.
  • Un caso reciente ejemplar: el 30 de julio, Gannett firmó un acuerdo con Perplexity para licenciar contenido del USA Today Network. Este modelo se enfoca en compartir ingresos por publicidad en lugar de sublicenciar contenido para entrenamiento.

¿Cómo funcionan las tarifas de grounding?

Las licencias de grounding operan mediante estructuras de pago basadas en uso real, con modalidades como:

  • Pago por uso
  • Pago por consulta
  • Pago por rastreo (“crawl”)
  • Compartición de ingresos publicitarios, como hacen Perplexity y ProRata.ai

Lo fundamental en estos acuerdos es que el contenido del editor sea efectivamente mostrado en la respuesta de IA, con atribución y enlace, algo que no ocurre necesariamente en los acuerdos de entrenamiento.

Fuente: Digiday

Traducción realizada por ADEPA