Chile busca a los desaparecidos de la dictadura de Pinochet de la mano de la inteligencia artificial

 

El lunes 15, en la inauguración del Congreso del Futuro en Santiago, el presidente Gabriel Boric dijo que la inteligencia artificial, la temática que aborda la versión número 13 del encuentro, “jugará un rol importante en la búsqueda de nuestros detenidos desaparecidos”. Se refería al Plan de Búsqueda de más de 1.000 personas que fueron víctimas de la dictadura de Augusto Pinochet (1973-1990) y que su Administración presentó el 30 de agosto de 2023, en la víspera de la conmemoración el 11 de septiembre de los 50 años del golpe de Estado en el que fue derrocado el presidente socialista Salvador Allende.

El plan, que lidera el ministro de Justicia Luis Cordero, es una iniciativa que pretende convertirse en una política permanente de Estado. Según datos de Justicia, tras la dictadura en Chile hubo 1.469 víctimas de desaparición forzada y de ellas, 1.092 son detenidas desaparecidas, mientras que 377, que fueron ejecutadas, están en la misma condición. Hasta ahora solo 307 han sido identificadas.

Para emprender esta nueva búsqueda, que ya han hecho los tribunales, Cordero dice a EL PAÍS que se trabaja con dos principales fuentes. Por un lado, las investigaciones judiciales, que comprenden millones de páginas. Y por otro, los antecedentes administrativos de los casos que están dispersos en reparticiones del Estado. Entre ellas, el Programa de Derechos Humanos, creado en 1997, que depende de la cartera de Justicia, además de antiguas indagatorias en fiscalías militares (que solían cerrar los casos) y los expedientes que sirvieron de base para el Informe de la Comisión Verdad y Reconciliación de 1991, impulsado por el expresidente Patricio Aylwin (1990-1994), y en el que por primera vez se hizo un relato sobre las víctimas.

Escritos a máquina

Tras el análisis tecnológico de la información, que el Programa de DD.HH. ya tiene digitalizado mientras que en el Poder Judicial lo está en un 80%, se encuentra Unsholster, una empresa especializada en análisis de datos, data science y desarrollo de software, cuyo gerente general es el ingeniero civil Antonio Díaz-Araujo. En el contexto de Plan de Búsqueda la firma se adjudicó el proyecto en una licitación: es la encargada de aplicar inteligencia artificial.

Un dato relevante en este trabajo es que los expedientes judiciales, separados por cada caso, fueron tramitados en el antiguo sistema de justicia chileno (cambió en 2005), lo que implica que las indagatorias de los jueces está en papel: gran parte tienen las hojas cosidas a mano para armar un cuaderno, con tipeo con máquina de escribir e, incluso, hay varias partes manuscritas. Son los que contienen declaraciones, fotografías en blanco y negro, fotocopias de fotos, informes periciales y viejos partes policiales.

Pero, además, una base de información crucial en los análisis, más actualizada, serán las indagatorias judiciales que partir del año 2000, cuando se reabrieron cientos de causas que habían sido archivadas en la dictadura, emprendieron los jueces con dedicación exclusiva para casos de violaciones a los derechos humanos con sentencias.

Cordero señala que “es mucha la información que está en manos del Estado y no hay capacidad humana para procesarla, pues requiere ser vinculada una con otra. Por ejemplo, hay testimonios que están en unos expedientes y no en otros. Y, además, dependiendo de los jueces hubo líneas investigativas, por lo que pudo haber antecedentes que fueron útiles para unos y no para otros”. Por ello, dice que la inteligencia artificial puede ser fundamental, pues dice que en estos casos el cruce de información será clave.

“Toda esa información está entre expedientes judiciales y administrativos y la digitalización, lo primero que logra, es poder integrarlas en un lugar. Y luego trabajar con inteligencia artificial, lo que nos permite reducir las brechas de investigación con algoritmos, que se van probando, y que van leyendo en esos expedientes, por ejemplo, fechas, nombres, lugares”, agrega el ministro.

4,7 millones de páginas, por ahora

Hoy Unsholster está en una etapa de anteproyecto, antes de empezar a programar, explica Díaz-Araujo a EL PAÍS. “Pero ya hemos tocado gran parte de los tipos de archivos que vamos a tener que tocar”, señala. Los documentos que han ido llegando, escaneados previamente hoja por hoja, se encuentran en carpetas, en formato PDF, por lo que no tienen una lógica que permita buscar datos pues están grabados como imagen. Por ello, lo primero ha sido comenzar a aplicar la tecnología OCR (reconocimiento óptico de caracteres) a fin de que se transformen en datos.

Por ejemplo, ya tienen información –que no incluye todavía a los miles de expedientes del Poder Judicial– que suma 46.768 archivos PDF, lo que equivale a más de 4,7 millones de páginas. “Si una persona se pusiera a leer cada una de esas páginas, en voz alta y sin entender ni relacionar hechos, estaría leyendo ocho horas al día durante 27 años”, explica el ingeniero civil.

Una vez que esos archivos son llevados a páginas es cuando se crea, dice Díaz-Araujo, “un gran árbol de clasificación, que permite clasificar hojas que tienen imágenes, manuscritos, máquina de escribir o archivos estilo word. Y luego empezar a aplicar, en cada una de ellas, el mejor OCR” para cada tipo de página, pues la clave, añade, está en “qué material se lleva a cada una”.

Otra etapa es crear, explica, distintos tipos de diccionarios y entidades “que vayan aprendiendo con el uso”. Por ejemplo, apodos de las personas, lugares, calles (muchas han cambiado de nombres desde la dictadura), formas de escribir y fechas.

Esto implica, detalla, crear una topología de entidades en la lectura, con tecnología, de cada uno de los textos “que sea capaz de ir correlacionando rápidamente distintas páginas, personas, lugares y fechas en forma muy flexible”. Ejemplifica: “Muchos de los victimarios pueden tener apodos, y varios de estos pueden estar escritos de distinta manera, pero no por ello no se van a unir. Lo que haces es crear tecnología que sea capaz de sugerir al analista otras correlaciones que se vayan dando en el tiempo”.

Por lo tanto, profundiza, “hay inteligencia artificial en la clasificación de los documentos; hay alta inteligencia en transformar los documentos desde una imagen a datos buscables y luego, mucha, en la creación de entidades que permite unir unos documentos con otros. Y, finalmente, lo que es más necesario en una plataforma, es que ésta sea sobre la posibilidad de hacer competir algoritmos, de inteligencia artificial o no, sobre estos datos. Pero que no se calce con una tecnología, pues la mayor clave es estar abiertos a nuevas tecnologías del futuro. Si lo dejas cerrado, se transforma en un escollo”.

Y añade: “Otra clave de esta plataforma es que los datos orginales, y los transformados, permanecen. Pero se puede seguir creando otros datos arriba de esos. No hay una máquina del tiempo que haga una suerte de congelamiento de la capacidad de producir más algoritmos y más información con nuevas plataformas el día de mañana”.

Contreras y Krassnoff

A cinco meses desde que se comenzó a aplicar tecnología a los casi 47.000 documentos del Programa de Derechos Humanos que tiene Unsholster, ya es posible, con la aplicación de los primeros OCR a los documentos identificatorios, rut, encontrar miles de menciones de al menos cuatro militares que fueron parte de la policía secreta de Pinochet, la temida DINA.

Manuel Contreras, su director general, condenado al momento de su muerte en 2015 a 526 años de cárcel por cientos de crímenes, aparece 2.800 veces; Pedro Espinoza y Miguel Krassnoff, ambos cumplen sentencias en el penal Punta Peuco, 2.079 y 2.954 menciones, respectivamente. Y Marcelo Moren Brito, quien fue el torturador de Ángela Jeria, la madre de la expresidenta socialista Michelle Bachelet, 2.284.

Por ahora son solo menciones. Pero en adelante, los nombres, hechos, fechas y lugares, podrán unirse y relacionarse, dice Díaz-Araujo.

 
El PaísAlicia Hamilton