Calcular Estadística Descriptiva Online

Introduce tus datos y obtén media, mediana, moda, rango, varianza, desviación estándar y cuartiles. Cambia entre cálculo muestral (n−1) y poblacional (n) según tu caso.

La estadística descriptiva resume un conjunto de datos en pocos números clave que indican dónde se concentra la información (medidas de tendencia central) y cómo de dispersa está (medidas de dispersión). Es la primera herramienta que se aplica en cualquier análisis de datos, ya sea en un trabajo de fin de grado, un experimento de laboratorio, un control de calidad industrial o un informe de marketing. Esta calculadora hace los cálculos al instante y diferencia entre estadísticos muestrales y poblacionales, una distinción crucial que muchos estudiantes pasan por alto.

Medidas de tendencia central: media, mediana y moda

Las medidas de tendencia central indican el valor 'típico' de un conjunto de datos. Cada una se interpreta de forma distinta y resulta más adecuada según el tipo de datos.

La media aritmética es la suma de todos los valores dividida entre la cantidad de datos. La mediana es el valor central cuando los datos están ordenados (o el promedio de los dos centrales si hay un número par). La moda es el valor que más se repite.

  • Media: sensible a valores extremos (outliers). Útil con datos simétricos.
  • Mediana: robusta frente a outliers. Mejor para sueldos, precios de vivienda o datos asimétricos.
  • Moda: única medida válida para datos cualitativos (colores, marcas). Puede haber más de una.
  • Si media = mediana = moda, la distribución es simétrica.
  • Si media > mediana, la distribución se sesga a la derecha (cola de valores altos).

Medidas de dispersión: rango, varianza y desviación estándar

Dos conjuntos pueden tener la misma media pero comportarse de forma muy distinta. Las medidas de dispersión cuantifican cuánto se separan los datos respecto al centro.

El rango es la diferencia entre el valor máximo y el mínimo: rápido de calcular pero muy sensible. La varianza es el promedio de las desviaciones al cuadrado respecto a la media. La desviación estándar es la raíz cuadrada de la varianza, expresada en las mismas unidades que los datos originales.

Estadística muestral vs. poblacional

Si tus datos son toda la población (todos los empleados de tu empresa, todas las piezas fabricadas hoy), divides entre n. Si son una muestra que pretende representar a una población mayor (100 encuestados de un país), divides entre n−1 — la corrección de Bessel — para obtener un estimador insesgado.

En la práctica, casi todo lo que se hace en investigación, marketing y ciencia es muestral, así que por defecto se usa n−1. Excel ofrece ambas: VAR.S y DESVEST.M (muestral) frente a VAR.P y DESVEST.P (poblacional).

MedidaMuestral (n−1)Poblacional (n)
Varianzas² = Σ(xi − x̄)² / (n−1)σ² = Σ(xi − μ)² / n
Desviación estándars = √s²σ = √σ²
Símbolo mediax̄ (x barra)μ (mu)
Cuándo usarlaDatos = muestraDatos = población completa
ExcelDESVEST.M / VAR.SDESVEST.P / VAR.P

Ejemplo paso a paso

Conjunto de datos: 2, 4, 4, 4, 5, 5, 7, 9 (n = 8).

Media: (2+4+4+4+5+5+7+9) / 8 = 40/8 = 5. Mediana: (4+5)/2 = 4,5 (los dos centrales del array ordenado). Moda: 4 (aparece 3 veces).

Varianza muestral: Σ(xi − 5)² = 9+1+1+1+0+0+4+16 = 32. s² = 32/(8−1) = 4,57. Desviación estándar: s = √4,57 = 2,14. Rango = 9 − 2 = 7.

Cuartiles, percentiles y rango intercuartílico

Los cuartiles dividen los datos ordenados en cuatro partes iguales. Q1 deja debajo el 25% de los datos; Q2 es la mediana (50%); Q3 deja debajo el 75%.

El rango intercuartílico (RIC = Q3 − Q1) contiene el 50% central de los datos y se usa para detectar valores atípicos: cualquier dato fuera del intervalo [Q1 − 1,5·RIC, Q3 + 1,5·RIC] suele considerarse outlier.

  • Q1 (primer cuartil) = percentil 25
  • Q2 (mediana) = percentil 50
  • Q3 (tercer cuartil) = percentil 75
  • Percentil 90 = valor por debajo del cual queda el 90% de los datos
  • Diagrama de caja (boxplot): visualiza min, Q1, Q2, Q3, max y outliers

Errores frecuentes en estadística descriptiva

  • Usar la media con datos sesgados o con outliers: el sueldo medio sube con un solo CEO en la muestra. Mejor mediana.
  • Olvidar ordenar los datos antes de calcular la mediana o los cuartiles.
  • Confundir n con n−1 al calcular varianza muestral. Cambia mucho con muestras pequeñas.
  • Reportar la varianza en lugar de la desviación estándar: la varianza está en unidades al cuadrado y es difícil de interpretar.
  • No comprobar si hay datos repetidos para identificar correctamente la moda.

Formula

Media = Σxi / n  |  Varianza muestral s² = Σ(xi − x̄)² / (n−1)  |  Desviación estándar s = √s²

Ejemplos

  • Datos: 2, 4, 4, 4, 5, 5, 7, 9
    Media 5; Mediana 4,5; Moda 4; s = 2,14; Rango 7
  • Datos: 10, 20, 30, 40, 50
    Media 30; Mediana 30; s = 15,81; Rango 40
  • Notas: 5, 7, 8, 8, 9, 10
    Media 7,83; Mediana 8; Moda 8; s = 1,72
  • Sueldos (€): 1500, 1600, 1700, 1800, 8000
    Media 2920; Mediana 1700 (mejor referencia)
  • Edades: 22, 25, 25, 27, 30, 32
    Media 26,83; Mediana 26; Moda 25
  • Cuartiles de 1,2,3,4,5,6,7,8
    Q1=2,5; Q2=4,5; Q3=6,5; RIC=4
  • Datos: 100, 102, 98, 101, 99
    Media 100; s = 1,58 (datos muy concentrados)
  • Tiradas dado: 3, 5, 6, 6, 4, 2
    Media 4,33; Moda 6; Rango 4

Preguntas frecuentes

¿Qué es la desviación estándar?
Es una medida de dispersión que indica cuánto se alejan los datos de la media, expresada en las mismas unidades que los datos. Una desviación baja significa datos agrupados; una alta, datos muy dispersos.
¿Cuál es la diferencia entre varianza y desviación estándar?
La varianza es el promedio de las desviaciones al cuadrado respecto a la media, en unidades al cuadrado. La desviación estándar es la raíz cuadrada de la varianza, en las mismas unidades que los datos originales, por lo que es más interpretable.
¿Cuándo uso la fórmula muestral (n−1) y cuándo la poblacional (n)?
Usa n−1 cuando tus datos son una muestra que representa a una población mayor (lo habitual en investigación). Usa n cuando tienes los datos de toda la población y no necesitas estimar.
¿Qué es mejor, media o mediana?
Depende. La media usa toda la información pero se ve afectada por valores extremos. La mediana es más robusta y representativa cuando hay outliers o la distribución es asimétrica (sueldos, precios de vivienda).
¿Qué son los cuartiles?
Son tres valores que dividen los datos ordenados en cuatro partes iguales. Q1 (percentil 25), Q2 (mediana, percentil 50) y Q3 (percentil 75). El rango intercuartílico Q3−Q1 contiene el 50% central.
¿Cómo identifico un valor atípico (outlier)?
Un criterio común: cualquier dato fuera del intervalo [Q1 − 1,5·RIC, Q3 + 1,5·RIC] se considera outlier. También se puede usar el criterio de ±2 o ±3 desviaciones estándar respecto a la media.
¿Puede haber más de una moda?
Sí. Si dos valores se repiten con la misma frecuencia máxima, la distribución es bimodal. Con tres modas, trimodal. Si todos los valores aparecen una sola vez, no hay moda.
¿Para qué sirve el coeficiente de variación?
El CV = s / media · 100 expresa la dispersión en porcentaje y permite comparar variabilidad entre conjuntos con medias muy distintas. Un CV bajo indica datos homogéneos.

Herramientas relacionadas

Ultima actualizacion: 16 de abril de 2026