24/3/14

Las probabilidades de encontrar el avión desaparecido, según la inteligencia colectiva

"El avión MH370 de Malaysian Airways ha desaparecido de manera misteriosa, no tardando en aparecer una serie de teorías conspiratorias acerca de la causa detrás del suceso: explosiones a mitad de vuelo, suicidio de los pilotos, secuestro milimétricamente planeado y hasta la posibilidad de que el avión esté oculto para usarlo posteriormente en un atentado terrorista.

Sin embargo, el hecho de que un avión deje de estar localizado en pleno vuelo no es algo tan extraordinario; desde 1948 son conocidas al menos 83 desapariciones de vuelos de los que de 80 nunca más se supo nada. Lo preocupante es cómo puede suceder este desconcierto con la tecnología de hoy, que nada tiene que ver con la de décadas pasadas.

¿Qué retos afronta esta búsqueda?

El básico y primordial es encontrar y almacenar información fiable sobre qué áreas geográficas ya fueron rastreadas. Normalmente  se pierde la memoria sobre qué zonas han sido miradas y por quién. Luego debemos afrontar la probabilidad de que el avión aparezca en una zona ya investigada.

Revisar más de una vez el amplio arco de búsqueda es muy costoso, pero como nos recuerda la historia reciente, el vuelo Air France 447 de Rio de Janeiro a París estuvo desaparecido dos años y posteriormente un equipo de investigadores de Metro Scientific Solution lo encontró en apenas 6 días, en una zona donde ya había sido buscado ¿Qué utilizaron para encontrar los restos del avión? Inferencia bayesiana

 Y aquí es donde entra en juego Nate Silver, el maestro de los modelos estadísticos aplicados a predicciones de actualidad, desde política a deportes, quien nos explica cómo la estadística puede ayudarnos a predecir dónde encontraremos el avión.

El teorema de Bayes es muy intuitivo y su importancia no es sólo una fórmula, sino que es el lema de una forma de pensar: a nueva información (recibida), nueva probabilidad (estimada). Es decir, los bayesianos realizan sus inferencias mejorando sus probabilidades iniciales asignadas previamente según va llegando nueva información. 

Es como añadir capas a tu modelo, de forma que cuantas más tengas, mejor probabilidad final tendrás. En investigación operativa es una herramienta muy utilizada, que funciona bien cuando tenemos buena forma de estimar las probabilidades iniciales (priors). Según avance la búsqueda del avión MH370 se actualizarán las probabilidades y quedará de mano del experto decidir en base a ellas.

Cuando tenemos demasiada información

Los investigadores armados con sus modelos bayesianos deben afrontar un obstáculo añadido: recopilar toneladas de información subjetiva. Véase el problema en la cantidad de información disponible y en la calidad de la misma. De nuevo Nate Silver nos explica en su libro “ La señal y el ruido” que todo paquete de información se compone de una parte veraz (señal) y de ruido (aleatorio). 

El objetivo del estadístico será filtrar la señal del ruido, algo que en la búsqueda del MH370 se antoja realmente complicado: apreciaciones subjetivas de no expertos, recopilación de datos no contrastados, información en prensa y medios, etc. Demasiado ruido para ser filtrado por un único modelo.

Un torneo de predicciones

La tarea de encontrar el MH370 se antoja demasiado compleja para un solo experto, pero existe una forma a gran escala de agregar información dispersa, heterogénea y eliminar a la vez sesgos o ruido de la misma. Se trata de las herramientas de inteligencia colectiva, y en concreto, los mercados de predicciones.

 Ni más ni menos usar un crowdsourcing de predicciones con los incentivos de un mercado detrás, de manera que cual detectives a sueldo, todos los usuarios expertos y no expertos compitan por predecir dónde aparecerá el vuelo o cuál fue la causa.

Los mercados de predicciones se basan en la teoría de la “ sabiduría de las masas”, descubierta en 1906 por el estadístico Francis Galton, padre de conceptos como la correlación o la regresión a la media.

 La idea central es que la predicción de un grupo de personas comportada como un todo, es más precisa que la de cualquiera de sus partes. James Suroweicki en su best-seller de 2004 “ The Wisdom of Crowds” escribió sobre el potencial de las masas, demostrando dónde éstas se comportan bien, y donde no (por ejemplo, en labores donde se requiere habilidades no funcionarán: un grupo de personas pilotando un avión lo harán peor que un piloto experto).

Estadísticamente lo que ocurre es que al agrupar correctamente la opinión de muchas personas, el ruido se compensa con el ruido y nos quedamos con la señal. Para que esto ocurra tienen que darse ciertas condiciones: masa heterogénea (con distintas fuentes de información), opiniones independientes y un mecanismo adecuado para agregar la información. 

Existen distintos mecanismos válidos, pero el más reconocido por su elevado historial de aciertos son los mercados de predicciones: competiciones donde los expertos y no expertos invierten en sus mejores estimaciones.

Pensemos que un experto aparte de asumir un riesgo de modelo propio, tiene una capacidad limitada de absorber información, pero un mercado de predicciones, donde todo el mundo compite por acertar, tiene una capacidad ilimitada de incorporar información, cual teorema de Bayes, pero a escala mayor. 

Además, el mercado de predicciones actuará como un mercado bursátil a la hora de incentivar a los participantes a aportar solamente la mejor información disponible, puesto que los beneficios o pérdidas irán a parar directamente a ellos. Para asegurar la eficiencia (informativa) del mercado, éstos usan dinero virtual para evitar especulación.

Existen varios mercados de predicciones que hoy en día usan esta “externalización a las masas” o crowdsourcing para averiguar qué ha pasado con el vuelo MH370.  En EEUU tenemos a SciCast.org que está cotizando actualmente preguntas al respecto, y en España está FuturaMarkets.com, donde se han listado dos preguntas que llevan ya unos 100 usuarios de media aportando información a través de unas 700 operaciones de compra y venta en los dos primeros días de cotización ( empíricamente a partir de 65 - 100 usuarios los mercados de predicciones aumentan significativamente las tasas de acierto).

¿Cuál será la causa de la desaparición?
Actualmente las alternativas cotizan con las siguientes probabilidades: secuestro (37%), fallo del piloto (14,3%), fallo del avión (9,7%), bomba (9,5%), otro (29,6%).

¿Dónde aparecerá el avión?
Aquí hay mucha incertidumbre, ya que solamente la opción del mar Andamán destaca en SciCast con una probabilidad del 11%, mientras que la posibilidad de encontrarse fuera del arco oficial de búsqueda o no encontrarse antes el 30 de junio cotiza con un 69% de probabilidad. En cambio, en FuturaMarkets cotiza la probabilidad de que se encuentre el avión antes del 30 de abril en un 67%, lo cual claramente nos apunta a que la probabilidad condicional de que se encuentre el avión pasado el 30 de abril es realmente minúscula.

¿Encontrarán los mercados de predicciones el avión?
Predecir consta de tres partes: modelos dinámicos, análisis de datos y juicio humano. Nate Silver puede tener excelentes modelos, y ser gran analista de datos, pero la capacidad de introducir juicio humano en las estimaciones que otorgan los mercados de predicciones es infinitamente mayor que la de un solo experto.

Sin embargo, lo único cierto en la vida es que “nada es seguro hasta que ha sucedido”. La probabilidad cero no existe, y por ende, no podemos decir que hablamos de magia o certezas. Tanto Nate Silver como los mercados de predicciones podrán ayudarnos a navegar la incertidumbre, asignando probabilidades a las alternativas que los expertos consideran más posibles.

 Este mapa de probabilidades lo que nos permitirá es asignar los recursos de la búsqueda de manera eficiente. Como dijo, Kenneth Arrow, premio Nobel de Economía en 1972 y experto en predicciones económicas: “el buen pronóstico no es el que te dice que lloverá, sino el que te da las probabilidades”.       (eldiario.es, 20/03/2014)

No hay comentarios: