Media, mediana, moda, normal, rango… La estadística hace uso de conceptos básicos presentes en el día a día que no siempre terminan entendiéndose. Algunas de estas herramientas causan confusión al no conocer las definiciones básicas, y una de ellas es la protagonista del artículo. ¿Cómo calcular la mediana?
Índice
- ¿Qué es la mediana?
- Diferencias entre mediana, media y moda
- Mediana con datos agrupados
- Cómo calcular la mediana con Excel
Qué es y cómo calcular la mediana
La mediana de un conjunto de números (al que se llama «distribución») es el número que ocupa el lugar central una vez estos han sido ordenados de menor a mayor; o la media aritmética en caso de que este conjunto sea un número par. Dicho de otra forma, la mediana es el valor que deja a un lado el 50% de la distribución y a otro el restante 50%. Abajo se muestran dos problemas.
Mediana de una distribución impar. ¿Cuál es la mediana estadística de la edad de la gente de la oficina?
Para calcular la mediana lo primero que hay que hacer es preguntar estas edades y recogerlas en una lista. Una como esta:
23, 45, 34, 59, 22, 23, 43, 34, 24, 23, 44, 39, 37, 21, 22, 34, 35, 23 y 45
En esta oficina hay 19 personas; la más joven tiene 21 años y la más mayor, 59. Ahora, ¿cuál es la mediana? Para saberlo primero es necesario ordenar los números de menor a mayor. La mediana es el valor que ocupa la posición central, en este caso 34.
21, 22, 22, 23, 23, 23, 23, 24, 34, 34, 34, 35, 37, 39, 43, 44, 45, 45, 59
Una forma de calcular esto a mano es ir tachando los extremos hasta dar con el valor central. Sin embargo, es un poco engorroso y muy poco útil si hay muchos datos:
21, 22, 22, 23, 23, 23, 23, 24, 34, 34, 34, 35, 37, 39, 43, 44, 45, 45, 59
21, 22, 22, 23, 23, 23, 23, 24, 34, 34, 34, 35, 37, 39, 43, 44, 45, 45, 59
…
21, 22, 22, 23, 23, 23, 23, 24, 34, 34, 34, 35, 37, 39, 43, 44, 45, 45, 59
Mediana de una distribución par. ¿Cuál es la mediana estadística de la altura de la gente de clase?
Después de realizar una encuesta en clase, se ha visto que la distribución de alturas es como sigue:
1,92, 1,56, 1,76, 1,76, 1,77, 1,78, 1,67, 1,59, 1,62, 1,90, 1,85, 1,82, 1,75, 1,75, 1,78, 1,83, 1,64, 1,65, 1,66, 1,65, 1,63, 1,73, 1,65, 1,57, 1,78, 1,67
En este caso, además de contar con más datos que en el problema anterior, se da la situación de que el conjunto suma 26 cifras, un número par. Por lo tanto, no hay un valor central, sino dos. ¿Qué se hace en estos casos? Una vez ordenados, se toman los dos valores que ocupan la posición central y se calcula su media:
1,56, 1,57, 1,59, 1,62, 1,63, 1,64, 1,65, 1,65, 1,65, 1,66, 1,67, 1,67, 1,73, 1,75, 1,75, 1,76, 1,76, 1,77, 1,78, 1,78, 1,78, 1,82, 1,83, 1,85, 1,90, 1,92
La media entre 1,73 metros y 1,75 metros es 1,74 metros. Se calcula sumando ambos números y dividiendo entre dos. Por lo tanto, 1,74 es la mediana de la distribución de las alturas.
Diferencias entre mediana, media y moda
Es muy frecuente confundir mediana, media y moda. Sin embargo, son conceptos distintos. Ya se ha visto que la mediana es el valor central de una distribución ordenada (o la media de sus dos valores centrales si son pares). Estas son las otras dos definiciones, que serán calculadas para los problemas anteriores.
- Media aritmética: también llamada promedio, es la suma de todos los valores de una distribución dividida entre el número de valores.
- Moda aritmética: es el valor más frecuente en una distribución de datos, es decir, el que más veces aparece.
Mediana, media y moda del problema de las edades
Volviendo al problema de las edades, cuya distribución ordenada se repite abajo, se había calculado una mediana de 34 años.
21, 22, 22, 23, 23, 23, 23, 24, 34, 34, 34, 35, 37, 39, 43, 44, 45, 45, 59
Ahora, ¿cuál es la media? Para ello se realiza el siguiente cálculo: se suman todas las edades y se divide entre el número total (en este caso, 19):
(21+22+22+23+23+23+23+24+34+34+34+35+37+39+43+44+45+45+59)/19 = 33,15 años
¿Y cuál es la moda? En la distribución se puede observar que 23 años es el número de años que más se repite (cuatro veces) seguido de 34 (tres veces). Por lo tanto, la moda es 23.
Una de las mejores formas de representar media y mediana es mediante un diagrama de cajas y bigotes. En estos la X central indica la media, y la línea central horizontal del interior de la caja, la mediana. Además, se muestran los máximos y mínimos (los bigotes arriba y abajo) y otros datos interesantes como el Q1 y Q3.
Mediana, media y moda del problema de las alturas
A la hora de calcular la media y moda del problema de las alturas, cuya distribución se muestra abajo ordenada, y cuya mediana se había calculado previamente (1,74 metros), se hace lo mismo que en el apartado anterior.
1,56, 1,57, 1,59, 1,62, 1,63, 1,64, 1,65, 1,65, 1,65, 1,66, 1,67, 1,67, 1,73, 1,75, 1,75, 1,76, 1,76, 1,77, 1,78, 1,78, 1,78, 1,82, 1,83, 1,85, 1,90, 1,92
Para calcular la media se suman todas las alturas y se divide entre el número de alturas totales (26). El resultado es que la media da 1,72 metros. Para obtener la moda se revisa cuál es el valor más repetido, que en este caso es más de uno. Tanto el valor de 1,65 como el de 1,78 se repiten tres veces en la distribución. En otras palabras, esta distribución tiene dos modas.
Cómo calcular la mediana para datos agrupados usando una fórmula
La mediana es muy fácil de calcular cuando la distribución tiene muy pocos datos. Pero ¿qué ocurre cuando estos son abundantes? Por ejemplo, ¿qué pasa si en lugar de 20 o tre30inta edades se tuviesen cientos o miles? En el siguiente ejemplo se pregunta la edad a 200 personas, y este es el resultado:
44, 44, 20, 30, 38, 41, 29, 30, 18, 18, 47, 46, 49, 28, 58, 39, 41, 39, 26, 20, 17, 56, 29, 61, 24, 48, 58, 56, 39, 33, 61, 24, 46, 60, 44, 32, 58, 47, 48, 19, 57, 38, 60, 24, 30, 48, 29, 28, 37, 51, 28, 51, 33, 56, 39, 33, 55, 42, 35, 54, 33, 46, 29, 41, 31, 20, 47, 61, 24, 41, 42, 41, 47, 29, 36, 62, 48, 50, 47, 55, 49, 59, 44, 19, 26, 40, 28, 39, 39, 18, 33, 62, 62, 48, 47, 22, 62, 62, 48, 32, 34, 21, 62, 50, 23, 17, 24, 26, 30, 61, 18, 23, 28, 18, 18, 47, 19, 25, 32, 24, 38, 58, 47, 44, 43, 59, 46, 54, 28, 21, 36, 44, 32, 21, 27, 41, 61, 58, 37, 19, 29, 57, 49, 17, 24, 38, 33, 53, 47, 46, 20, 53, 32, 46, 41, 56, 58, 51, 21, 61, 29, 35, 22, 25, 57, 44, 50, 44, 44, 28, 29, 39, 39, 18, 62, 51, 47, 26, 44, 53, 32, 60, 58, 33, 29, 28, 20, 56, 32, 56, 57, 25, 31, 57, 46, 58, 46, 32, 56, 50
Construir una tabla agrupada
Lo primero que hay que hacer para calcular la mediana es construir una tabla agrupada como la que se recoge abajo, y que se explica a continuación.
Para empezar, se han seleccionado 10 intervalos o filas con una amplitud de cinco años entre cada uno. Así cada fila se diferencia en cinco años, que es una medida muy normal para distinguir edades en estadística. Pero también se podrían haber tomado conjuntos de 10 años, dos años o tres años, si se hubiese querido.
Dentro de cada intervalo el valor mínimo dentro de cada intervalo se llama «límite inferior», mientras que el máximo es el «límite superior». Así, en el intervalo ‘[15-20)’ los 15 años son el límite inferior y los 20 años el superior:
A continuación se cumplimenta la columna xi o marca de clase. Se calcula obteniendo la media entre el valor máximo y mínimo de cada intervalo. Para el primer caso: (15+20)/2 = 17,5. Para el segundo: (20+25)/2=22,5. La diferencia entre dos marcas de clase es igual a la amplitud. En este caso, cinco:
22,5 ? 17,5 = 5
Ahora toca calcular la columna fi o frecuencia absoluta, donde se refleja el número de veces que aparecen los números entre intervalos. Por ejemplo, para el intervalo ‘[15-20)’ habrá que contar una vez por cada vez que aparezcan los números 15, 16, 17, 18 y 19. El 20 no, dado que este iría en el siguiente intervalo. Se han resaltado en negrita aquellos números que irían en la primera casilla: 14 números. Para construir esta columna se aconseja ir tachando números.
44, 44, 20, 30, 38, 41, 29, 30, 18, 18, 47, 46, 49, 28, 58, 39, 41, 39, 26, 20, 17, 56, 29, 61, 24, 48, 58, 56, 39, 33, 61, 24, 46, 60, 44, 32, 58, 47, 48, 19, 57, 38, 60, 24, 30, 48, 29, 28, 37, 51, 28, 51, 33, 56, 39, 33, 55, 42, 35, 54, 33, 46, 29, 41, 31, 20, 47, 61, 24, 41, 42, 41, 47, 29, 36, 62, 48, 50, 47, 55, 49, 59, 44, 19, 26, 40, 28, 39, 39, 18, 33, 62, 62, 48, 47, 22, 62, 62, 48, 32, 34, 21, 62, 50, 23, 17, 24, 26, 30, 61, 18, 23, 28, 18, 18, 47, 19, 25, 32, 24, 38, 58, 47, 44, 43, 59, 46, 54, 28, 21, 36, 44, 32, 21, 27, 41, 61, 58, 37, 19, 29, 57, 49, 17, 24, 38, 33, 53, 47, 46, 20, 53, 32, 46, 41, 56, 58, 51, 21, 61, 29, 35, 22, 25, 57, 44, 50, 44, 44, 28, 29, 39, 39, 18, 62, 51, 47, 26, 44, 53, 32, 60, 58, 33, 29, 28, 20, 56, 32, 56, 57, 25, 31, 57, 46, 58, 46, 32, 56, 50
Finalmente se construye la columna F o frecuencia absoluta acumulada, que es la suma de las frecuencias absolutas. Así, si en el primer dato coinciden F1 y f1, en la siguiente línea se calcula como F2 = F1 + f2. Es decir, 14 + 18 = 32. La siguiente fila se calcula como F3 = F2 + f3 por lo que dará: 32 + 25 = 57.
Cómo calcular la media usando una tabla agrupada
Aprovechando que hay una tabla agrupada, se calcula con ella la media de la distribución, aunque esta no hará falta para calcular la mediana. La fórmula de la media es la que sigue:
La letra griega ? indica sumatorios. Calcular la media es fácil: basta con sumar la columna “xi · fi” y dividirla por el número de datos total. Para construir “xi · fi” tan solo se ha multiplicado la marca de clase por la frecuencia absoluta en cada fila. Para este caso concreto, la media es igual a 40,15 años.
Cómo calcular la mediana usando la tabla agrupada
Calcular la mediana usando una tabla agrupada exige un par de pasos más. El primero, localizar cuál es el valor mediano dentro de la columna F o frecuencia absoluta usando esta fórmula:
- Si n es par: (n+1)/2
- Si n es impar: n/2
En el caso actual, con 200 edades, n es par, por lo que el resultado es 100. A continuación hay que acudir a la columna F y ver dónde se encuentra el dato número 100. En el caso del ejemplo, la línea ‘[40-45)’, como aparece resaltado:
Después, aplicar la siguiente fórmula, donde Li es el límite inferior (40), Fi-1 es la frecuencia absoluta acumulada anterior (99), y a1 es la amplitud del intervalo (en este caso, 5). Se resuelve en la misma línea:
Cómo calcular la mediana en Excel u Hojas de Cálculo de Google
Partiendo de los mismos ejemplos de arriba, también se puede hacer uso de herramientas como Excel para calcular la mediana. Es mucho más rápido y no es necesario ordenar números a mano. En las columnas con un 1 se ven los datos desordenados. En las que tienen un 2, desordenados.
Además, se muestran las fórmulas para calcular la mediana para Excel y Hojas de Cálculo de Google. Respectivamente:
=MEDIANA(distribución)
=MEDIAN(distribución)
Usar estas herramientas digitales es muchísimo más rápido que hacerlo a mano, pero nunca está de más conocer el por qué tras las fórmulas de Excel.
En Nobbot | 10 maneras de aprender matemáticas sin tocar un libro
En Nobbot | ¿Arte o matemáticas? Las simetrías ocultas de la tabla de multiplicar
Imágenes | iStock/Giuseppe Lombardo, Marcos Martínez @euklidiadas