¿Cómo se calcula un percentil? Antes de contártelo paso a paso, explicamos que esta medida de posición es un tipo de cuantil que ayuda a observar distribuciones en detalle al dividirlas en 100 fragmentos con el mismo número de elementos. Se trata de una herramienta estadística indispensable para entender el mundo, especialmente el concepto social de desigualdad. Se mencionan por primera vez en 1885 y hoy en día tienen multitud de aplicaciones.
Qué es un percentil
El percentil es una medida estadística que indica la posición por debajo de la cual se encuentra cierto conjunto de datos una vez se han ordenado de menor a mayor los que forman una distribución. El percentil 1 (P1) incluye el 1 % de los datos más pequeños, el percentil 60 (P60) el 60 % de los datos más pequeños.
El método del percentil divide la distribución en 100 partes (centiles) con el mismo número de datos. Por ejemplo, si en un estudio sobre alturas de la población se tienen 15 000 datos de alturas, entonces cada percentil contendrá 150 datos, porque:
15 000/100 = 150
El primer percentil de una distribución estará compuesto por el 1 % de los datos más pequeños, el percentil 5 incluirá los cinco primeros 1 % de los datos, etc. Por definición, una distribución tiene 100 centiles.
Los percentiles suelen nombrarse como una P con su número como subíndice. El percentil 5 será el P5, el percentil 75 será el P75. En la siguiente imagen se muestra en la banda inferior cómo los percentiles dividen en 100 una distribución. Aparecen destacadas algunas medidas:
Cuantiles: percentil, decil, quintil, cuartil
Los percentiles son un tipo de cuantil, una forma de dividir una distribución en 100 partes. Pero no son el único tipo. Existen otras formas de trocear un conjunto de datos según el número de divisiones: 100-cuantil (percentiles), 20-cuantil (ventiles), 16-cuantiles (hexadeciles), 10-cuantiles (deciles), 8-cuantiles (octiles), etc. Por lo general, se usan los siguientes:
- Cuartiles. Distribución dividida en cuatro partes. Se representa con Q por el término inglés quartiles.
- Quintiles. Distribución dividida en cinco partes. Se representa con QU, para no confundirla con el cuartil Q.
- Deciles. Distribución dividida en 10 partes. Se representan con D.
- Percentil. Distribución dividida en 100 partes. Se representan con P.
Las divisiones que tenga la distribución dependerá de para qué se esté usando la división. Se verán varios ejemplos a continuación. Pero antes conviene mencionar algunas equivalencias entre cuantiles, como que P75 es Q3.
- Q1 = P25
- Q2 = D5 = P50
- Q3 = P75
- QU1 = D2 = P20
- QU2 = D4 = P40
- QU4 = D6 = P60
La mediana (Q2) y los cuartiles Q1 y Q3
La mediana es una de las divisiones más importantes de una distribución ordenada de menor a mayor, porque la mitad de los datos estará por debajo y la otra mitad por encima. La mediana coincide con el P50 y con el D5. En cierto sentido, la mediana es mucho más coherente que la media para realizar algunas comparaciones, como se verá más adelante.
Para qué sirven los percentiles
Los percentiles son muy usados en ámbitos tan dispares como estudios científicos, sociología o periodismo -este último es el más conocido-. Los cuantiles se usan, principalmente, para hablar de dinero, renta e ingresos. Lo cierto es que sería imposible entender la desigualdad social sin los percentiles y otros cuantiles. Algunos ejemplos son:
- “Los hijos de familias pobres están de media en el percentil 42” (Noticia)
- “Los deciles más bajos de ingresos están sujetos a un tipo medio del 28 %” (Noticia)
- “Los hijos de familias pobres crecen para tener rentas alrededor del percentil de 40” (Noticia)
¿Cómo se usan?
Cuantiles en distribución de ingresos
Cuando se habla de renta e ingresos, es muy frecuente dividir la distribución en 10 partes (deciles), aunque el último decil tiende a expresarse en centiles por la enorme diferencia que hay entre ellos. El 1 % más rico es muchísimo más rico que la gente que se ubica junto al nonagésimo noveno centil. Y en este punto merece hacer un aparte.
En matemática, el P99 indica todo aquello que hay debajo del 99 %. Sin embargo, en ambientes menos estrictos se suele hablar de cuantiles para indicar rangos. Las siguientes frases son ciertas, y aparecen reflejadas en la gráfica:
- El segundo cuartil incluye el segundo cuarto de los datos, empezando por los más pequeños. La gente del primer cuartil es más pobre, y la del tercer cuartil es más rica.
- El tercer quintil está en la mitad de la distribución. Dentro está la mediana.
- El noveno decil son aquellas personas cuyos ingresos están entre el 80 % y el 90 % de la distribución.
- El centésimo centil es el 1 % más rico, y no el 100 % de la distribución.
Nótese que aquí no se ha hablado de “Q2”, “QU3”, “D9” o “P100”, sino de “segundo cuartil”, “tercer quintil”, “noveno decil” o “centésimo centil”.
Mediana en la distribución de ingresos
La mediana es un valor bastante coherente para entender distribuciones como las de los ingresos. Por ejemplo, en España, si se observa el salario a tiempo completo para el año 2019, se obtiene la siguiente tabla con la media (suma de los valores dividido entre el número de datos), la mediana (valor central de la distribución o Q2) y la moda (el valor que más se repite):
Mujeres | Hombres | |
Salario medio bruto | 21 682 | 26 934 |
Salario mediano | 17 961 | 22 368 |
Salario más frecuente | 13 514 | 18 506 |
El salario medio es interesante porque indica cuál es la media aritmética de la distribución de salarios por género. Sin embargo, está muy afectada por los valores más atípicos. Un millonario más puede elevar la media, algo que no pasará con la mediana, que solo puede variar si se añaden una enorme cantidad de datos a la distribución.
Cómo se calcula un percentil
Para calcular un percentil es necesario partir de una distribución. La tabla de frecuencia inferior servirá de ejemplo y que ya aprendimos a calcularlas aquí. Es una tabla de edades que indica cuántas personas (qué frecuencia f) hay para cada intervalo.
La primera columna (intervalo) muestra las clases, la siguiente la frecuencia absoluta (f), mientras que la última muestra la frecuencia acumulada (F). Ahora, si se quiere conocer el ‘percentil A’, lo primero que hay que hacer es buscar su intervalo usando esta fórmula:
Intervalo = I = N·A/100
N es el número de elementos, en este caso 200, A es el percentil buscado y 100 indica que se divide la muestra entre 100 centiles. Por ejemplo, el intervalo del percentil 40 será:
Intervalo40 = I40 = 200·40/100 = 80
Con ese número hay que volver a la tabla de frecuencias y buscar dentro de la tabla de frecuencias acumuladas. Como 80 es menor que 81 pero mayor que 57 (estamos consultando los datos en la última columna), a P40 corresponde la clase [30-35). A continuación, habrá que aplicar la siguiente fórmula:
En el caso del ejemplo:
En Nobbot | Cinco ejercicios para ejercitar tu mente en el mes de las matemáticas
Imágenes | Propias