Francesco Marconi, Madhumita Murgia, Charlie Beckett y dos fundadores de startups analizan el impacto de la IA generativa en la industria de las noticias.

Desde que se lanzó el chatbot ChatGPT de OpenAI, impulsado por IA, en noviembre, los periodistas han estado discutiendo su impacto potencial en la industria de las noticias. 

¿Cuántos periodistas serán reemplazados por el auge de la inteligencia artificial generativa? ¿Qué tan rápido se llevará a cabo este proceso? ¿Qué periodistas serán más vulnerables a este tipo de perturbaciones? ¿Y deberíamos ver ChatGPT como un desafío o como una oportunidad para resolver algunos de los problemas que enfrenta la industria de las noticias?

Mientras todas estas preguntas y más se debaten acaloradamente, hablé con tres expertos y dos fundadores de empresas emergentes para tener una idea más clara de cómo la IA generativa y los modelos de lenguaje extenso pueden afectar el periodismo a corto y mediano plazo.

Francesco Marconi es periodista informático y cofundador de la empresa de información en tiempo real AppliedXL . Anteriormente, fue jefe de I+D en The Wall Street Journal y codirector de inteligencia artificial y automatización de noticias en Associated Press. Marconi es autor de «Newsmakers: Artificial Intelligence and the Future of Journalism«, un libro sobre IA y periodismo publicado en 2020.

Madhumita Murgia es la editora de inteligencia artificial recién nombrada en el Financial Times, un nuevo puesto en el periódico. Antes de esto, trabajó como corresponsal de tecnología europea en el FT.

El profesor Charlie Beckett es el director de JournalismAI , un proyecto de periodismo de la London School of Economics (LSE). Además de realizar investigaciones y publicar un informe sobre periodismo e IA, la iniciativa ejecuta un programa de becas para periodistas y tecnólogos, un programa de capacitación dirigido a salas de redacción pequeñas y selecciona ejemplos de aplicaciones de IA en periodismo para que otros puedan aprender.

Muchos puntos de venta ya están utilizando IA de forma limitada para ayudar en sus operaciones. Otros están imaginando modelos completamente nuevos basados ​​en la tecnología. Entre este último grupo se encuentran Jenny Romano y Pedro Henriques, cofundadores de The Newsroom, una aplicación que ofrece a sus lectores un resumen diario con resúmenes generados por IA de las principales noticias: los hechos clave, el contexto y las tomas principales.

No del todo nuevo

El uso de IA para apoyar y producir piezas de periodismo es algo con lo que los medios han estado experimentando durante algún tiempo. Francesco Marconi clasifica la innovación en IA en la última década en tres oleadas: automatización, aumento y generación. 

Durante la primera fase, “la atención se centró en la automatización de noticias basadas en datos, como informes financieros, resultados deportivos e indicadores económicos, utilizando técnicas de generación de lenguaje natural”, dice. Hay muchos ejemplos de editores de noticias que automatizan algunos contenidos, incluidas agencias globales como Reuters, AFP y AP, así como medios más pequeños. 

Según Marconi, la segunda ola llegó cuando “el énfasis se desplazó a aumentar los informes a través del aprendizaje automático y el procesamiento del lenguaje natural para analizar grandes conjuntos de datos y descubrir tendencias”. Un ejemplo de esto se puede encontrar en el periódico argentino La Nación, que comenzó a usar IA para respaldar a su equipo de datos en 2019 y luego estableció un laboratorio de IA en colaboración con analistas y desarrolladores de datos.

La tercera y actual ola es la IA generativa. Está «impulsado por grandes modelos de lenguaje capaces de generar texto narrativo a escala», dice Marconi. Este nuevo desarrollo ofrece aplicaciones al periodismo que van más allá de simples informes automatizados y análisis de datos. Ahora, podríamos pedirle a un chatbot que escriba un artículo más largo y equilibrado sobre un tema o un artículo de opinión desde un punto de vista particular. Incluso podríamos pedirle que lo haga al estilo de algún escritor o publicación conocida.

Las ideas sobre los posibles usos de esta tecnología se han multiplicado desde noviembre, y los propios periodistas a menudo prueban las capacidades de los chatbots para escribir y editar.

Parte de la razón por la que ChatGPT y otras herramientas han generado tanto entusiasmo puede ser el hecho de que son muy fáciles de usar y pueden comunicarse en lenguaje natural, dice Madhumita Murgia del FT. “Se siente como si hubiera una inteligencia allí, aunque en realidad sigue siendo un tipo de tecnología predictiva muy poderosa”, dice ella.

Los modelos de lenguaje con los que funcionan estas herramientas significan que están respondiendo a nuestras indicaciones cuando generan contenido nuevo y no presentan las ideas en sí mismas. El modelo se entrena en un conjunto de contenido y datos y genera nuevos resultados en función de lo que se entrenó.

Esto significa que, si bien podría ser útil para sintetizar información, realizar ediciones e informes, Murgia cree que la IA generativa, tal como la vemos hoy, carece de algunas habilidades clave que le impedirán asumir un papel más importante en el periodismo. “Según dónde está hoy, no es original. No es romper nada nuevo. Se basa en la información existente. Y no tiene esa capacidad analítica ni voz”, dice Murgia.

Debido a esto, explica, la IA generativa no puede satisfacer la demanda de más análisis o una visión más desarrollada de un tema, algo que los lectores buscan cuando acuden a medios como el Financial Times. ChatGPT parece estar de acuerdo.

“Eso no quiere decir que la IA generativa no pueda volverse más poderosa o avanzar a medida que evoluciona la tecnología subyacente”, dice Murgia. “Me gustaría ser realmente optimista sobre la voz humana original, que nada pueda reemplazarnos. Y definitivamente creo que, donde están los modelos de lenguaje hoy, no son creativos ni originales ni generan nada nuevo de ninguna manera. Pero creo que lo están imitando bastante bien”.

Otro desafío para un papel más importante en el periodismo para la IA generativa son los errores fácticos que a menudo comete ChatGPT, a veces incluso en demostraciones públicas, como parece haber sucedido con las nuevas herramientas impulsadas por IA de Google y Microsoft . ChatGPT puede haber dirigido al lector a una referencia que no existe.  

“Estos modelos a menudo tienen dificultades para generar información precisa y fáctica sobre eventos actuales o datos en tiempo real”, dice Marconi. Esto sugiere que las herramientas de inteligencia artificial disponibles actualmente no son adecuadas para informar sobre noticias de última hora, una operación compleja y costosa que requiere una cuidadosa verificación de hechos y referencias cruzadas de información.

Los modelos de IA generativa también han tenido problemas con los números. “La nueva cosecha de IA generativa no es precisa cuando se trata de realizar cálculos exactos. La creación algorítmica sin control presenta riesgos importantes en lo que respecta a un ecosistema de información saludable”, dice Marconi. Esto no significa que la IA generativa no tenga un papel en el periodismo, sino que no podemos confiar únicamente en ella.

El profesor Charlie Beckett , jefe del proyecto de investigación Polis/LSE JournalismAI, también aconsejó cautela y desalentó a los periodistas a usar nuevas herramientas sin supervisión humana: “La IA no se trata de la automatización total de la producción de contenido de principio a fin: se trata de aumentar a brinde a los profesionales y creativos las herramientas para trabajar más rápido, liberándolos para dedicar más tiempo a lo que los humanos hacen mejor”, dice. “El periodismo humano también está lleno de fallas y mitigamos los riesgos a través de la edición. Lo mismo se aplica a la IA. Asegúrese de comprender las herramientas que está utilizando y los riesgos. No esperes demasiado de la tecnología”.

Marconi también argumenta que los medios deberían trabajar con la tecnología de una manera que reconozca y contrarreste sus escollos actuales. “Las limitaciones de los grandes modelos de lenguaje, como GPT, indican dónde se debe centrar la innovación periodística: hacia el desarrollo de sistemas de detección de eventos que puedan capturar y calcular información en tiempo real. La combinación de estos sistemas de detección de eventos con grandes modelos de lenguaje allanará el camino para un enfoque completamente nuevo del periodismo”, dice.

Un ejemplo de un sistema de detección de eventos se encuentra en la propia empresa de Marconi, AppliedXL, que él describe como “una empresa de detección de eventos donde las personas con mentalidad periodística trabajan juntas para anticipar las noticias”. A través del aprendizaje automático y los principios del periodismo de investigación, su equipo tiene como objetivo anticipar las noticias relacionadas con los ensayos clínicos, como señalar señales irregulares tempranas en los datos mucho antes de que las empresas publiquen sus problemas.

IA generativa en acción

Varios medios conocidos han anunciado sus planes para usar IA generativa o ya la están incorporando en su contenido. BuzzFeed anunció que usará IA para potenciar sus famosos cuestionarios de personalidad , y el New York Times usó ChatGPT para crear un generador de mensajes del Día de San Valentín con una combinación de avisos.

Más están explorando la idea de posibles usos, incluido el gigante editorial alemán Axel Springer y la editorial británica Reach, que recientemente publicó sus primeros artículos escritos por AI en un sitio de noticias local. El periódico italiano Il Foglio anunció un desafío para sus lectores: durante 30 días a partir de la segunda semana de marzo, publicará textos breves escritos por AI en su edición diaria, y los lectores que puedan identificar correctamente cada texto durante una semana podrán optar a gana una suscripción gratuita y una botella de champán.

Para Pedro Henriques y Jenny Romano, la aplicación de la IA al periodismo es el núcleo del negocio de The Newsroom, la empresa que fundaron en 2021. Han creado una aplicación que ofrece resúmenes diarios generados por IA de las principales noticias. Estas no son noticias de última hora, sino noticias que ya han sido ampliamente reportadas por una variedad de medios. El objetivo de la aplicación, me dijeron sus fundadores, no es necesariamente brindar información totalmente nueva al usuario, sino pintar una imagen de los hechos en los que todos los medios están de acuerdo y luego resaltar diferentes perspectivas.

El primer paso en el proceso es recopilar datos de una variedad de editores para comprender qué noticias se están discutiendo y por quién, explicó Henriques. El siguiente paso es ejecutar estos artículos a través de un modelo que los fundadores trabajaron con los periodistas para construir. El modelo evalúa la calidad de las piezas en función de criterios como la presencia de hechos y elementos de sesgo. 

“Una vez que tenemos ese conjunto de artículos sobre los mismos eventos y una cierta barra de calidad de nuestro lado, tenemos otros dos modelos que esencialmente rompen los artículos en pedazos”, dice Henriques. “Identificamos los elementos de consenso en torno a lo que se informa. Entonces, ¿cuáles son las cosas principales en las que todos los periódicos están de acuerdo? ¿Cuáles son los hechos básicos sobre los que todo el mundo está informando? Y por otro lado, ¿cuáles son los elementos de divergencia? Entonces, ¿cuáles son los diferentes puntos de vista sobre el mismo tema que están surgiendo? En base a eso, escribimos un nuevo artículo que esencialmente empaqueta eso, por lo que comienza con los elementos de consenso, los hechos básicos de lo que está sucediendo, y luego puede explorar lo que llamamos las múltiples perspectivas”.

En la pestaña «Múltiples perspectivas» también hay una lista de editores que informan sobre el tema que se resume, con enlaces a su cobertura.

Las piezas de la sala de redacción están escritas por IA y revisadas manualmente por humanos. Si bien los humanos siempre serán parte del proceso de supervisión, dice Romano, buscan simplificar aún más el proceso.

“Estamos planeando tener diferentes niveles en términos de la cantidad de revisión manual que se incluye, según el tema”, dice Henriques. “Entonces, por ejemplo, en este momento, la mayoría de los temas que hacemos son temas globales sobre geopolítica, clima, etc. Una vez que comencemos a evolucionar a otros temas que son de menor riesgo, como los deportes, por ejemplo, planeamos tener diferentes niveles de revisión para entra en esos.” 

Por el momento, solo están utilizando fuentes en inglés y publicando resúmenes en inglés, pero planean incluir artículos en otros idiomas en su modelo, para mejorar también la diversidad geográfica de su producción. Esto se refleja en toda la industria: a pesar de la posibilidad de usar ChatGPT en varios idiomas, la calidad de su salida no es la misma en todos los ámbitos .

Cuando se les preguntó si han experimentado algunos de los problemas que enfrentan otros modelos, Henriques y Romano dicen que no. Sus modelos no han producido ninguna «alucinación», cuando AI genera una declaración que no está respaldada por los datos , y su revisión manual del texto contrarresta cualquier inexactitud de los hechos.

“No nos ocupamos de cosas como noticias de última hora. Cuando hay noticias de última hora, todavía no hay suficiente información para que podamos validarlas correctamente. Y así, la información en The Newsroom siempre se retrasa un poco, a propósito”, dice Henriques.

La aplicación se encuentra actualmente en su etapa de producto mínimo viable y, por lo tanto, aún se está desarrollando. Tiene alrededor de 1.000 usuarios en todos los países, principalmente en Europa, con una abrumadora mayoría menor de 35 años, dicen los fundadores. Según Romano, los usuarios actuales de The Newsroom se pueden dividir en dos grupos principales: personas que ya consumen muchas noticias de otras fuentes y antiguos evasores de noticias, un grupo que encontraron entre su audiencia contactando y hablando con algunos de sus usuarios.

Sin embargo, Henriques enfatiza que la aplicación no está diseñada para ser la única fuente de noticias para sus usuarios. “Nos vemos a nosotros mismos como una forma de ayudar a los usuarios a navegar las noticias en general. No lo vemos como una plataforma completamente autónoma, el único lugar al que vas para leer las noticias. Es un punto de acceso, por lo que vas allí para navegar, pero no termina ahí. Luego vas a otros jugadores para seguir sumergiéndote en cosas que realmente te interesan”, dice.

Una mirada al futuro

Tanto Murgia como Marconi mencionaron el papel de los periodistas para sintetizar la información, contextualizarla e identificar la historia. Para Marconi, esto se va a poner más difícil. 

“La explosión de datos de fuentes como la web, sensores, dispositivos móviles y satélites ha creado un mundo donde simplemente hay demasiada información. Ahora estamos produciendo más información que en cualquier otro momento de la historia, lo que hace que sea mucho más difícil filtrar la información no deseada”, dice.

Marconi cree que este es un lado del periodismo en el que la IA puede desempeñar un papel crucial para reducir la carga de trabajo de los humanos. “La IA no solo debe verse como una herramienta para generar más contenido, sino también para ayudarnos a filtrarlo”, dice. “Algunos expertos predicen que para 2026, el 90 % del contenido en línea podría ser generado por máquinas. Esto marca un punto de inflexión, donde ahora debemos centrarnos en construir máquinas que filtren el ruido, distingan la realidad de la ficción y resalten lo que es significativo”. 

Marconi cree que los periodistas deberían desempeñar un papel en el desarrollo de nuevas herramientas de IA. Por ejemplo, escribiendo algoritmos editoriales y aplicando principios periodísticos a la nueva tecnología. “La industria de las noticias debe participar activamente en la revolución de la IA”, dice. “De hecho, las empresas de medios tienen la oportunidad de convertirse en un jugador importante en el espacio: poseen algunos de los activos más valiosos para el desarrollo de IA: datos de texto para modelos de capacitación y principios éticos para crear sistemas confiables y confiables”.

Fuente: Reuters Institute, traducido por Adepa.