viernes, 14 de junio de 2013

Con medias y a lo loco

Me gustan las medias. Me encantan.

Desde niña he sentido fascinación por esta prenda fetiche. En aquella época porque quería ser mayor, unos años más tarde porque quería ser sofisticada y sexy, en la actualidad porque me resultan mucho más prácticas y cómodas que los pantys, sobre todo cuando la cena o el almuerzo contiene apio o algún otro ingrediente con efecto diurético. Así que voy a hablar de medias. Pero no de las que envuelven nuestras piernas de seda, lycra onylon, sino de esas con las que continuamente nos bombardean en los medios tratando de convencernos de algo o para compararnos con otros y ensalzar la marca España cuando proceda o dejarnos a la altura del betún cuando interesa resaltar lo malo de alguna herencia histórica recibida.

Estoy casi segura de que todos, o casi todos, hemos oído, más de una vez, el dicho ese de que “la estadística es la ciencia que, si tú te comes 2 pollos y yo no me como ninguno, concluye que nos hemos comido un pollo cada uno”. Risas.

Pues no. La estadística en ese caso lo que concluye es que la media de pollos que hemos comido es 1. Y es verdad.

Abro un pequeño paréntesis. Estamos hablando de media aritmética. Para calcular la media aritmética de un conjunto de datos basta con sumarlos todos y dividir por el número total de datos.

El error en la historia esta del pollo radica en el uso de la media para representar un rasgo o comportamiento de la población. Ese es el problema de usar la media: no siempre es un buen indicador de la realidad del fenómeno observado.

Es como si a algún descerebrado se le ocurriese diseñar un sistema de acceso a la Universidad, templo del conocimiento y el pensamiento crítico, basado en puntuaciones calculadas a partir de la media aritmética de las calificaciones obtenidas en Matemáticas, por ejemplo, y Religión.

¿Son equiparables para entrar en ¡la Universidad! un estudiante con 10 en Matemáticas y un 5 en Religión con otro con un 10 en Religión y un 5 en Matemáticas? Por favor… ¿estamos locos o qué? Risas. Impotencia. Llanto. Miedo.

Perdonen, me he derivado… ya avisé.

Como estaba diciendo antes de esta pequeña digresión sobre esa majadería conocida como LOMCE, la media no es siempre un dato representativo de la población.

En España, sin ir más lejos, la mayoría de los habitantes tiene más piernas que la media. Efectivamente, con que haya un ciudadano que no tenga las 2 piernas, la media ya es menor que 2. ¿Parece razonable afirmar que los españoles suelen tener menos de 2 piernas?

Déjenme que lo intente explicar con otro ejemplo. Como profesora universitaria, he tenido la oportunidad de escuchar alguna vez a algún director de alguna escuela técnica argumentar (casi vanagloriándose) que la carrera que en ella se impartía no era de 3 años, sino de 8, porque esa es la media de lo que tardaban los alumnos en terminarla. Al margen de que no acabo de entender por qué se tenía que vanagloriar de las dificultades que se encontraban los alumnos en su centro, nunca le he visto yo la gracia a este tipo de cosas: resulta que estaba utilizando la media para algo que no es relevante en absoluto. Se puede ver con un ejemplo muy simple (y algo simplista).

Supongamos que tenemos 13 alumnos que tardaron, respectivamente, los años que aparecen en la siguiente lista, ordenados de menor a mayor:

3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 7, 20, 30

Si calculamos la media aritmética (sumando todos los datos y dividiendo por 13) nos sale 7, 7 años. Sin embargo, de los 13 alumnos, ¡10 la acabaron en menos de 4! Este dato es, por lo tanto, poco representativo.

Para casos como este, sería mucho más descriptivo utilizar la mediana (o percentil 50) que es el valor que ocupa la posición central de todos los valores que tenemos, con lo cual no influye nada el hecho de que el que más tarde sea 10, 20 o 50 años. En nuestros ejemplo, la mediana, el valor que está en el centro si los ordenamos de menor a mayor, es 4.

3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 7, 20, 30

Que la mediana en acabar una carrera sea de 4 años significa que si entran 100 alumnos a esa titulación, en 4 años al menos 50 de ellos tendrán terminados sus estudios; por lo menos todos los anteriores al valor central en esa lista. Y, como se ve en este ejemplo, da información más fiable que la media. Otra explicación más detallada sobre la representatividad de estas medidas de tendencia central, nos la dio nuestra amiga Mati en esta entrada.

Más aún, y ahora me voy a arriesgar a ganarme el odio de todos los estudiantes, la media aritmética puede no ser representativa para evaluar los conocimientos de una asignatura. Me explico: si un estudiante se examina de una asignatura realizando 2 exámenes de la misma y obtiene como calificación un 0 en uno de los exámenes y un 10 en el otro, al calcular su nota final mediante la media aritmética este estudiante habría superado esa materia. Ummmm…

¿Les gustaría que su médico o el ingeniero que diseñó el puente por el que pasan cada día solo supiera la mitad de cada cosa y desconociera totalmente la otra mitad?

Una posible solución para evitar estos aprobados anómalos sería calcular la nota final usando, no la media aritmética, sino la media geométrica. La media geométrica de 2 números se calcula multiplicando estos números (en lugar de sumarlos como en la media aritmética) y calculando después la raíz cuadrada del producto (en lugar de dividir por 2).

Efectivamente, esta media es más agresiva que la aritmética para calificar a los estudiantes pero, posiblemente, más segura. No sé.

Aún en el caso de que el profesor exija una nota mínima para hacer media, la geométrica nos salva de casos de aprobados anómalos con 3 y 7, puesto que la raíz cuadrada de 21 es menor que 5.

No, no me insulten todavía. No la uso con mis estudiantes, pero sí aparece en la nueva fórmula para la revisión de las pensiones.

Y no, no me miren con esa cara que yo también me asusté cuando la vi. Por cierto, he corregido una errata en la imagen de la fórmula publicada en El País.

Lo que resulta especialmente llamativo en la fórmula de marras es que el IPC ni está ni, posiblemente, se le espera. Se les habrá pasado con las prisas como se han pasado los del FMI con los griegos. Estos chicos…

Y, como señalan en el artículo de donde he sacado la fórmula, “dependerá de las previsiones del Gobierno sobre los ingresos y gastos futuros, de los cálculos actuariales sobre la evolución del número de pensionistas y sobre el efecto de la sustitución de pensiones (los pensionistas que se mueren suelen tener pensiones más bajas que los nuevos jubilados) y del coeficiente que elija el Gobierno para ir corrigiendo los desequilibrios presupuestarios”.Vamos, que pueden poner el coeficiente que quieran para que les salga lo que les dé la gana.

De lo que pueden estar casi seguros o, al menos, eso sospecho visto lo visto, es que si es para dar algo usarán la media geométrica que es siempre igual o más pequeña que la media aritmética. De verdad, déjenme que demuestre esta última afirmación gráficamente, que es muy chulo.

Lo podemos ver con un dibujito y sin más que conocer el Teorema de Pitágoras:

Si tenemos dos números, a y b, para los que queremos comparar su media aritmética y su media geométrica, dibujamos dos segmentos con dichas longitudes. Obtenemos así un segmento de longitud a + b.

Ahora, pinchamos con el compás en el centro del segmento de longitud a + b y dibujamos un círculo, que tendrá de radio (a+b)/2, como, por ejemplo, el radio que hemos pintado en azul en la siguiente figura:

Ahora pintamos, en rojo, un segmento paralelo al radio azul sobre el punto de unión de los segmentos originales, los de longitud a y b, respectivamente, y nos preguntamos cuánto mide ese segmento.

Para calcular la longitud del segmento rojo, no tenemos más que aplicar el famoso Teorema de Pitágoras, (sí, el de las suma de los cuadrados de los catetos que dan como resultado el cuadrado de la hipotenusa), sobre el triángulo sombreado en amarillo…

Y, ¡tachán! Si hacen las cuentas con esos datos, tendrán que la longitud del segmento rojo es, precisamente, √ab,esto es, la media geométrica de a y b. Puesto que la longitud del radio azul era la media aritmética de a y b, se deduce del dibujo que la media geométrica siempre es menor que la aritmética, salvo cuando a=b, en cuyo caso, la media aritmética y la geométrica coinciden.

Me encanta esta prueba gráfica de este hecho, ¿qué? ¿que no?

Bueno, termino como empecé, pidiendo que no usen la media por encima de sus posibilidades para sacar conclusiones sobre el comportamiento de la población.

Y si aún no los he convencido les propongo el siguiente ejercicio: sumen todas las cantidades que se han embolsado (o las que sabemos que se han embolsado) los corruptos de este país; divídanla por el número total de españoles y obtendrán un número mayor que 0. ¿Se podría deducir de ello que el español suele ser corrupto?

No.

Los corruptos son ellos y son pocos. Pero parece que, en este caso, los cobardes somos nosotros.

No hay comentarios:

Publicar un comentario