Paradoja de Simpson o cómo mal interpretar la estadística.

Imagina que eres parte del departamento de Compras o Abasto dentro de una organización, y estás tratando de evaluar las entregas en tiempo de tus proveedores a las unidades de negocio mediante un indicador simple, que se podría pensar que es suficientemente robusto para que cualquiera dentro de la organización pueda entender los resultados.

Pues bien, te das a la tarea de obtener datos sobre las entregas realizadas por los proveedores a tus unidades de negocio, y obtienes la siguiente tabla de datos para un periodo de tiempo determinado.

Después de revisar los datos y el porcentaje de entregas en tiempo, podrías concluir que la Unidad de Negocio “B” esta recibiendo pedidos en tiempo de mejor manera, el Proveedor 1 ha entregado el 88% de los pedidos en tiempo y el Proveedor 2 el 57%; y esto podría llevarte a pensar que las cosas van mejor en la Unidad de Negocio “B” que en la UN “A”; por lo que decides llamar a los responsables del seguimiento a proveedores en la UN “A” para decirles que presionen más a los proveedores.

Más tarde piensas que sería una buena idea hacer un indicador general, sin tanto detalle, para enviarlo a la Alta Dirección de la organización en la que trabajas, para darles el panorama macro del desempeño de las entregas en tiempo en las distintas unidades de negocio de parte de los proveedores. Decides sumarizar totales de pedidos realizados y de pedidos entregados en tiempo. Cuando procesas los datos, los resultados totales te dan otra impresión.

El porcentaje de pedidos entregados en tiempo por parte de los proveedores es mejor en la Unidad de Negocio “A”, que en la “B”, 70% en tiempo en contraste con un 63% respectivamente; “pero, ¿cómo es esto posible?” te preguntas. ¿Por qué si los Proveedores entregan mejores resultados en la UN “B” por separado, en el conjunto el desempeño de las entregas es mejor en la UN ”A”?, esl resultado es “paradójico”.

Pues bueno, a esto se le conoce como La Paradoja de Simpson o efecto Yule-Simpson, en honor a Edward H. Simpson y a Udny Yule, quienes estudiaron este efecto en la primera mitad del siglo XX; y en resumen se trata de un efecto que puede producir conclusiones opuestas si se observa desde la perspectiva total en contraste con los eventos o categorías en un nivel de jerarquía inferior o más granular por separado.

Lo importante de este efecto es que nos demuestra que los indicadores producto de un set de datos, no siempre cuentan la historia que sucede realmente, y puede ser que las organizaciones que toman decisiones en función de los resultados que se calculan en el interior de las organizaciones los puedan llevar a resultados contraproducentes. Es por ello que cuando se realiza un análisis estadístico de los datos de un proceso, se revise desde la perspectiva general y desde la perspectiva sus componentes más detallados, es decir, realizar un drill down a un nivel o dos dentro de los datos. En la aplicación, esto representaría no solo medir el nivel de entregas en tiempo en cada unidad de negocio, sino también en un nivel jerárquico menor como lo sería el de Proveedor, o el de Categoría de Productos que entrega cada Proveedor por ejemplificar un segundo nivel.

En conclusión, es recomendable revisar el indicador, pero también el peso que tiene en cantidad o en frecuencia de ocurrencia, y observar el efecto en el nivel macro, pero también como es que cada componente afecta o incide si se analiza por separado o de manera aislada; de esta manera se podrán tomar mejores decisiones y por consecuencia los resultados para la organización serán más eficaces.