Aplicación de la regla empírica (68-95-99.7) a un conjunto de datos estadísticos

  1. Educación
  2. Matemáticas
  3. Estadísticas
  4. Aplicación de la regla empírica (68-95-99.7) a un conjunto de datos estadísticos

Libro Relacionado

Por Deborah J. Rumsey

La Regla Empírica (68-95-99.7) dice que si la población de un conjunto de datos estadísticos tiene una distribución normal (donde los datos tienen la forma de una curva de campana) con la población media µ y la desviación estándar

entonces las siguientes condiciones son ciertas:

  • Aproximadamente el 68% de los valores se encuentran dentro de una desviación estándar de la media (o entre la media menos 1 vez la desviación estándar y la media más 1 vez la desviación estándar). En la notación estadística, esto se representa como
  • Aproximadamente el 95% de los valores se encuentran dentro de 2 desviaciones estándar de la media (o entre la media menos 2 veces la desviación estándar y la media más 2 veces la desviación estándar). La notación estadística para esto es
  • Aproximadamente el 99,7% de los valores se encuentran dentro de 3 desviaciones estándar de la media (o entre la media menos 3 veces la desviación estándar y la media más 3 veces la desviación estándar). Los estadísticos utilizan la siguiente notación para representar esto:

La Regla Empírica también se conoce como la Regla 68-95-99.7, en correspondencia con esas tres propiedades. Se utiliza para describir una población en lugar de una muestra, pero también se puede utilizar para ayudar a decidir si una muestra de datos proviene de una distribución normal. Si una muestra es lo suficientemente grande y puede ver que su histograma se parece a una forma de campana, puede comprobar si los datos siguen las especificaciones del 68-95-99,7 por ciento. En caso afirmativo, es razonable concluir que los datos proceden de una distribución normal.

La regla empírica (68%, 95% y 99,7%).

Esta figura ilustra los tres componentes de la Regla Empírica. La razón por la que muchos (alrededor del 68%) de los valores se encuentran dentro de una desviación estándar de la media en la Regla Empírica es porque cuando los datos tienen forma de campana, la mayoría de los valores se concentran en el centro, cerca de la media (como muestra la figura).

Si se añade otra desviación estándar a cada lado de la media, el porcentaje aumenta de 68 a 95, lo que supone un gran salto y da una buena idea de dónde se encuentra «la mayoría» de los datos. La mayoría de los investigadores se mantienen en el rango del 95% (en lugar del 99,7%) para reportar sus resultados, porque aumentar el rango a 3 desviaciones estándar a cada lado de la media (en lugar de sólo 2) no parece valer la pena, sólo para recoger otro 4,7% de los valores.

La Regla Empírica le dice qué porcentaje de valores están dentro de un cierto rango de la media. Estos resultados son sólo aproximados, y sólo se aplican si los datos siguen una distribución normal. Sin embargo, la Regla Empírica es un resultado importante en las estadísticas porque el concepto de «salir de dos desviaciones estándar para obtener alrededor del 95% de los valores» es uno que se menciona a menudo con intervalos de confianza y pruebas de hipótesis.

Reply