La ruleta de los datos

La ruleta de los datos: cuando la estadística no miente, pero la realidad sí


Introducción. La ruleta de los datos: cuando la estadística no miente, pero la realidad sí

 

 

 

 

Durante años, esa frase de Cristina, mi brillante profesora de estadística, resonó en mi cabeza como una advertencia ética, una ruleta que giraba cada vez que tomaba una decisión. La idea implícita era clara: el peligro residía en la malicia del analista, en su habilidad maquiavélica para torturar los números hasta que confesaran lo que él quería oír. O de contrario, una creencia en que el dato, por si sólo es inapelable. Y sabemos que eso no siempre es así.

Sin embargo, en la era del Big Data, el riesgo ha mutado.

Hoy, en un contexto empresarial saturado de herramientas de BI, dashboards automatizados y científicos de datos brillantes, el verdadero problema ya no suele ser la manipulación matemática. El problema ocurre mucho antes de abrir el Excel o ejecutar el script de Python. El problema está en la materia prima.

Para entender por qué tomamos decisiones desastrosas basándonos en datos «perfectos», empecemos con una historia macabra, pero matemáticamente iluminadora.

 

La falacia de la ruleta rusa

 

Imagina que una consultora decide hacer el estudio definitivo sobre la seguridad de este «juego».

  • Metodología: Entrevista en profundidad a 1.000 personas que han jugado a la ruleta rusa.
  • Resultados: El 100% de los encuestados sobrevivió a la experiencia sin daños letales.
  • Conclusión: La ruleta rusa es una actividad estadísticamente segura y recomendable.

Desde un punto de vista puramente matemático, el cálculo es impecable. La hoja de cálculo no tiene errores. El intervalo de confianza es alto.

El error es existencial: el silencio de los ausentes.

La muestra solo incluye a los supervivientes. Los que recibieron la bala no pueden contestar la encuesta, ni enviar un correo de queja, ni dejar una mala review en Google. Han desaparecido del conjunto de datos y, por tanto, de la realidad del analista.

La estadística no mintió. Simplemente analizó un mapa incompleto. A esto se le llama sesgo de supervivencia.

 

De la ruleta a la segunda guerra mundial

 

Este fenómeno no es solo un ejercicio teórico. En la segunda guerra mundial, el ejército estadounidense cayó en la misma trampa.

Analizaban los aviones que regresaban del combate llenos de agujeros de bala. Los ingenieros, con lógica aplastante, propusieron reforzar las áreas más tiroteadas (las alas y el fuselaje) para proteger a los pilotos.

Fue el matemático Abraham Wald quien los detuvo en seco con una observación genial:

«No reforzáis las áreas donde veis las balas. Debéis reforzar las áreas donde no hay agujeros (el motor y la cabina).»

¿Por qué? Porque los aviones que recibían disparos en el motor nunca regresaban para ser analizados. Los datos que tenían en el hangar eran, al igual que en la ruleta rusa, solo los de los «supervivientes».

 

La ruleta rusa del marketing: “El cliente feliz”

 

Traslademos ahora a Wald y a la ruleta rusa a tu departamento de marketing o producto.

El escenario: lanzamos un nuevo servicio y encuestamos a 800 usuarios activos.

El dato: el 92% se declara «Satisfecho» o «Muy Satisfecho».

La decisión: «El mercado ama el producto. Vamos a escalar la inversión.»

Meses después, las ventas se estancan y nadie entiende por qué.

El problema es que, al igual que con los aviones, estamos mirando solo a los que «volvieron a la base». Tu encuesta de satisfacción tiene un filtro invisible brutal:

  • Excluye a los que lo rechazaron en el lineal: (Nunca entraron en tu base de datos).
  • Excluye a los que probaron y se fueron: (El churn silencioso).
  • Excluye a los indiferentes: (Aquellos que no tienen la energía para contestar una encuesta).

Ese 92% de satisfacción es real, pero solo aplica a los «supervivientes» de tu embudo: aquellos que ya te compraron, que siguen contigo y que, además, tienen la predisposición de hablarte.

Estás predicando a los conversos y confundiendo sus aplausos con la opinión del mercado.

 

El embudo del sesgo: cómo se degrada la verdad

 

Creemos que nuestras bases de datos son espejos de la realidad, pero en realidad son embudos de distorsión. Especialmente en el entorno digital, el sesgo se acumula en capas geológicas:

 

Nivel del embudo

El filtro invisible

1. Mercado total

La realidad completa.

2. Tus clientes

Ya hay un sesgo: son los que te eligieron (autoselección).

3. Contactables

Solo los que te dieron permiso (GDPR, suscripción).

4. Aperturas

Solo los que vieron el asunto del email y les interesó.

5. Respondientes

El peligro final.

 

El grupo final (los que responden) suele tener dos perfiles extremos: los apóstoles (aman tu marca) o los detractores furiosos (quieren venganza). La inmensa mayoría silenciosa, la que realmente define el éxito o fracaso masivo, rara vez aparece en el Excel.

 

¿Cómo gestionamos la incertidumbre?

 

Si no podemos entrevistar a los muertos (ni a los clientes que nos ignoran), ¿estamos condenados a trabajar a ciegas? No. Pero debemos cambiar nuestra mentalidad: de «analistas de datos» a «detectives de contextos».

Aquí tienes 5 estrategias para blindar tus decisiones:

 

1️⃣ Auditoría de la muestra (el «quién»)

Antes de mirar el «Qué» (las respuestas), obsesiónate con el «Quién».

Compara la demografía de tus encuestados con tu base de clientes real.

  • ¿Tengo un 50% de clientes hombres, pero el 80% de las respuestas son de mujeres?
  • ¿Mis clientes VIP son el 5% de la facturación, pero representan el 50% de las encuestas?

Si la foto no coincide, el resultado no es extrapolable. Punto.

 

2️⃣ La ponderación (arreglar la foto)

Si detectas que un grupo está subrepresentado (por ejemplo, los jóvenes casi nunca contestan encuestas telefónicas), usa la estadística para dar más peso a las pocas respuestas que tienes de ese grupo. La ponderación no crea verdad de la nada, pero equilibra la balanza.

 

3️⃣ Incentivos para «la mayoría silenciosa»

Los extremos responden gratis (por amor u odio). El centro necesita un empujón. Ofrecer incentivos no es sobornar al usuario, es la única forma de conseguir que la persona «normal», la que ni te ama ni te odia, dedique 5 minutos a darte su opinión. Esos son los datos más valiosos que existen.

 

4️⃣ Análisis forense: la «exit interview»

No gastes todo el presupuesto en preguntar a tus clientes actuales por qué se quedan. Invierte en perseguir a los que se van.

Una llamada a un cliente que acaba de darse de baja vale por mil encuestas de satisfacción de clientes activos. Ahí es donde están los «agujeros de bala» en el motor que mencionaba Abraham Wald.

 

5️⃣ Triangulación de datos

Nunca confíes en una sola fuente.

  • Lo que dicen: Encuestas.
  • Lo que hacen: Datos transaccionales / Comportamiento web.
  • Lo que siente el mercado: Social Listening (fuera de tu base de datos).

Si la encuesta dice «nos aman» pero el comportamiento web muestra una tasa de rebote del 80%, cree siempre al comportamiento. La gente miente (o es amable) en las encuestas; sus clics son brutalmente honestos.

 

En fin…humildad analítica

 

No vivimos una crisis de mala estadística. Vivimos una crisis de exceso de confianza en datos parciales.

Un análisis perfecto sobre una muestra sesgada es como conducir un Ferrari con el parabrisas pintado de negro: la máquina es potente, pero el accidente es inevitable.

Quizá hoy la frase de mi profesora debería actualizarse:

«No hace falta saber estadística para equivocarse con ella. Basta con olvidar preguntar quién no está en la sala.»

 

Comparte en Redes Sociales

Facebook
X
LinkedIn