Reseñas | La IA pone en riesgo nuestra historia

No necesitamos imaginar un mundo en el que los deepfakes puedan imitar de manera tan creíble las voces de los políticos que puedan usarse para provocar escándalos que podrían influir en las elecciones. Ya está ahí. Afortunadamente, hay muchas razones para ser optimistas sobre la capacidad de la sociedad para identificar medios falsos y mantener una comprensión común de los acontecimientos actuales.

Aunque tenemos motivos para creer que el futuro será seguro, tememos que el pasado no lo sea.

La historia puede ser una poderosa herramienta de manipulación y malversación. La misma IA generativa que puede simular eventos actuales también puede simular eventos pasados. Aunque se pueden proteger nuevos contenidos mediante sistemas integrados, existe un mundo de contenidos que no tienen marcas de agua, lo que se consigue añadiendo información imperceptible a un archivo digital para que se pueda rastrear su procedencia. Una vez que las marcas de agua durante la creación se generalizan y la gente se acostumbra a desconfiar del contenido que no tiene marcas de agua, cualquier cosa producida antes de ese momento podrá cuestionarse mucho más fácilmente.

Y creará un tesoro de oportunidades para respaldar afirmaciones falsas con documentos generados, desde fotografías que colocan a personajes históricos en situaciones comprometedoras hasta la alteración de historias individuales en periódicos históricos y el cambio de nombres en títulos de propiedad. Aunque todas estas técnicas se han utilizado antes, es mucho más difícil contrarrestarlas cuando el coste de crear falsificaciones casi perfectas se ha reducido radicalmente.

Esta predicción se basa en la historia. Hay muchos ejemplos de cómo los poderes económicos y políticos han manipulado los registros históricos para sus propios fines. Stalin purgó de la historia a sus camaradas desleales ejecutándolos y luego alterando registros fotográficos para que pareciera como si nunca hubieran existido. Eslovenia, cuando se convirtió en país independiente en 1992, borró a más de 18.000 personas del registro de residentes, principalmente miembros de la minoría romaní y otras personas de etnia no eslovena. En muchos casos, el gobierno destruyó sus registros físicos, lo que provocó la pérdida de su vivienda, pensión y acceso a otros servicios, según un informe de 2003 del Comisionado de Derechos Humanos del Consejo de Derechos Humanos.

Leer más  Ami Ayalon, exjefe militar: “Mucha gente va a morir en Gaza: soldados israelíes y muchos más palestinos, pero no tenemos otra opción” | Internacional

Los documentos falsos son una parte clave de muchos esfuerzos por reescribir el registro histórico. Los infames Protocolos de los Sabios de Sión, publicados por primera vez en un periódico ruso en 1903, pretendían ser registros de una conspiración judía para controlar el mundo. Desacreditados por primera vez en agosto de 1921, como una falsificación plagiada de varias fuentes independientes, los Protocolos ocuparon un lugar destacado en la propaganda nazi y se utilizaron durante mucho tiempo para justificar la violencia antisemita, incluida una cita en el artículo 32 del Pacto Fundacional de Hamás de 1988.

En 1924, la carta de Zinoviev, que se cree era un comunicado secreto del líder de la Internacional Comunista en Moscú al Partido Comunista de Gran Bretaña destinado a movilizar apoyo para la normalización de las relaciones con la Unión Soviética, fue publicada por el Daily Mail cuatro días después. ante una asamblea general. elección. El escándalo resultante puede haberle costado las elecciones a los laboristas. El origen de la carta nunca ha sido probado, pero su autenticidad fue cuestionada en su momento y una investigación oficial en la década de 1990 concluyó que lo más probable era que fuera obra de los Blancos Rusos, una facción política conservadora encabezada en ese momento por emigrados rusos opuestos. a la Unión Soviética. Gobierno comunista.

Décadas más tarde, la Operación Infektion –una campaña de desinformación soviética– utilizó documentos falsos para propagar la idea de que Estados Unidos había inventado el VIH, el virus que causa el SIDA, como arma biológica. Y en 2004, CBS News retiró un artículo controvertido porque no pudo autenticar documentos, luego desacreditados como falsos, que cuestionaban el servicio anterior del entonces presidente George W. Bush en la Aerolínea de la Guardia Nacional de Texas. A medida que se vuelve más fácil generar desinformación histórica y el volumen de falsificaciones digitales se dispara, surgirá la oportunidad de remodelar la historia o al menos desafiar nuestra comprensión actual de ella.

Las perspectivas de que los actores políticos utilicen la IA generativa para remodelar eficazmente la historia (sin mencionar que los estafadores creen documentos legales y registros de transacciones falsos) son aterradoras. Afortunadamente, las mismas empresas que crearon este riesgo han forjado un camino a seguir.

Leer más  Los pasos del Papa Francisco por el hospital

Al indexar gran parte de los medios digitales del mundo para entrenar sus modelos, las empresas de inteligencia artificial han creado efectivamente sistemas y bases de datos que pronto contendrán todo el contenido grabado digitalmente de la humanidad o al menos una aproximación significativa de este. Podrían comenzar hoy a guardar versiones con marcas de agua de estos documentos primarios, que incluyen archivos de periódicos y una amplia gama de otras fuentes, para que las falsificaciones posteriores sean detectables instantáneamente.

Este trabajo enfrenta ciertos obstáculos. Los esfuerzos de las Bibliotecas Digitales de Google para digitalizar millones de libros de bibliotecas en todo el mundo y hacerlos fácilmente accesibles en línea se han topado con límites de propiedad intelectual, lo que hace que el archivo histórico sea inutilizable para el propósito previsto de hacer que estos textos puedan ser vistos por cualquier persona con acceso a Internet. conexión. Estos mismos problemas de propiedad intelectual llevan a los creadores y a las empresas a preocuparse tanto por los datos de entrenamiento proporcionados a la IA generativa como por sus implicaciones cuando se utilizan para generar contenido.

Dada esta tensa historia, incluida la inversión fallida de Google en su proyecto de bibliotecas digitales, ¿quién dará un paso al frente y financiará un esfuerzo masivo similar que crearía versiones inmutables de datos históricos? Hay un fuerte incentivo para que el gobierno y la industria lo hagan, y muchas de las cuestiones de propiedad intelectual asociadas con el suministro de archivos en línea con capacidad de búsqueda no se aplican a la creación de versiones de documentos con marcas de agua y de tiempo, porque no es necesario que estas versiones se hagan públicas para servir a sus necesidades. propósitos. objetivo. Un documento reclamado se puede comparar con registros registrados utilizando una transformación matemática del documento conocida como «hashing», la misma técnica que utiliza el Foro Global de Contraterrorismo de Internet para ayudar a las empresas a filtrar contenido terrorista conocido.

Leer más  Resumen de la guerra de Rusia en Ucrania el miércoles 14 de junio

Además de crear un bien público importante y proteger a los ciudadanos de los peligros que plantea la manipulación de narrativas históricas, la creación de registros verificados de documentos históricos puede resultar valiosa para las grandes empresas de inteligencia artificial. Una nueva investigación sugiere que cuando los modelos de IA se entrenan con datos generados por IA, su rendimiento se degrada rápidamente. Por lo tanto, puede ser crucial separar lo que en realidad es parte del registro histórico de los «hechos» recién creados.

Preservar el pasado también significa preservar los datos de entrenamiento, las herramientas asociadas que se ejecutan en ellos e incluso el entorno en el que se ejecutaron las herramientas. Vint Cerf, uno de los primeros pioneros de Internet, llamó a este tipo de grabación «vitela digital» y la necesitamos para proteger el entorno de la información.

Esta vitela será una herramienta poderosa. Puede ayudar a las empresas a crear mejores modelos al permitirles analizar qué datos incluir para obtener el mejor contenido y ayudar a los reguladores a auditar el sesgo y el contenido dañino en los modelos. Los gigantes tecnológicos ya están liderando esfuerzos similares para registrar nuevo contenido creado por sus modelos, en parte porque tienen que entrenar sus modelos con texto generado por humanos y los datos producidos después de adoptar el lenguaje de modelos grandes pueden verse contaminados por el contenido generado.

Ha llegado el momento de extender este esfuerzo también en el tiempo, antes de que nuestra política también se vea seriamente distorsionada por la historia generada.

Jacob N. Shapiro es profesor de política y asuntos internacionales en la Universidad de Princeton y director ejecutivo del Proyecto de Estudios Empíricos de Conflictos. Chris Mattmann es profesor asistente de investigación en la Universidad del Sur de California y director de su Grupo de Recuperación de Información y Ciencia de Datos.

El Times se compromete a publicar una variedad de letras Para el editor. Nos encantaría saber qué piensas sobre este o cualquiera de nuestros artículos. Aquí hay algo consejo. Y aquí está nuestro correo electrónico: cartas@nytimes.com.

Siga la sección de Opinión del New York Times en Facebook, Instagram, TIC Tac, X Y Temas.