Blog

Abrir la caja negra de los algoritmos

Durante los próximos años, la vida cotidiana en el ámbito urbano se va a desarrollar en casi todos sus aspectos bajo la influencia directa de las tecnologías de la información. A grandes rasgos, la transformación digital consiste en eso;  un aumento exponencial de la cantidad de decisiones, tanto triviales como importantes, que van a tomar individuos y entidades. Su apoyo, eso sí, es un trípode formado por tres desarrollos paralelos: el de dispositivos y máquinas, las redes de transmisión y la definición de métodos a seguir, siguiendo una serie de pasos sucesivos.

Este último desarrollo del trípode, los algoritmos, no se trata con claridad y transparencia en las organizaciones, aún siendo uno de los factores más decisivos para ejercer un control fiable sobre la información. Veamos el porqué.

Decisiones y criterios de selección difíciles

Un algoritmo no es más que una secuencia de pasos bien definidos cuyo seguimiento permite solucionar un problema dado. Esta definición general podría llevarnos a considerar que estamos refiriéndonos a un proceso escrupulosamente objetivo. Pero no es así. Diseñar un algoritmo tiene implicaciones subjetivas de hondo calado, sobre todo si tratamos de modelar realidades complejas.

En primer lugar, para definirlo es necesario determinar qué datos servirán para representar un fenómeno determinado, aclarar por qué consideramos esos datos y no otros, y escoger las preguntas que vamos a hacer para obtenerlos, así como el modo en que vamos a formularlas.

Una vez hemos escogido el tipo de datos a recabar, deberemos decidir cuáles de entre ellos son los más significativos, lo que implica superponer al primero un nuevo criterio de selección. Como resultado, obtendremos una modelización del fenómeno a aclarar que ofrecerá soluciones desde un punto de vista determinado. Esto implica que la perspectiva que tendremos del fenómeno estará condicionada por el punto de vista escogido.

Un ejemplo esquemático

Por ejemplo, podríamos preguntarnos si el nivel económico que una persona puede alcanzar en el seno de una sociedad altamente industrializada (primer sesgo, considerar la perspectiva individual) depende de su inteligencia (segundo sesgo); determinar que para conocerla vamos a examinar su trayectoria en la escuela formal (tercer sesgo) y que vamos a tener en cuenta las calificaciones que obtuvo en los exámenes finales durante su paso por ella (cuarto sesgo); por ser datos fáciles de recabar (quinto sesgo) y estar expresados en un valor numérico, lo que facilita la jerarquización (sexto sesgo).

Esta simplificación de los datos de entrada nos llevaría a obtener una simplificación similar en los datos de salida. En el caso del ejemplo, nuestra manera de formular la pregunta y las consideraciones que hemos tenido en cuenta para seleccionar los datos relevantes y recabarlos podrían llevarnos a asociar responsabilidad individual, falta de inteligencia y pobreza. El problema no estaría en haber estudiado el fenómeno a partir de esas consideraciones, sino en presentar sus resultados sin conocer los sesgos de partida, como el fruto de un proceso totalmente objetivo.

Es evidente que las cuestiones acerca de qué realidad queremos conocer, por qué y cómo vamos a conocerla son mucho más complejas y profundas.

Con lo expuesto tan solo queremos señalar que conocer los algoritmos “por dentro” en lugar de concebirlos como misteriosos artefactos insondables, cuyo fondo no se puede examinar, debería empezar a considerarse una necesidad de primer orden en cualquier entidad donde se vayan a tomar decisiones basadas en su uso. Más que nada porque disponer de resultados sin saber a qué criterios obedece su logro es muy probable que haga de ellos información engañosa, lo que – supongo, estaremos de acuerdo- no es ninguna ventaja.