Medidas de dispersión para datos agrupados

279 0

Calcular el intervalo de clase, Rango y Amplitud. Mediante los siguientes datos de edades.

2,5,9,11,13,14,15,18,19,21,22,23,25,25,27,29,31,31,32,32,33,34,35,36,37,37,38,39,42,45,50.

Intervalo de clase (K)

Para obtener un valor aproximado, podemos emplear la regla de Sturges.

K = 1+3.3 Log (N)

Donde:

  • K = Intervalo de clase.
  • N = Es el número de datos en la muestra.

K = 1+3.3 Log(31)

K= 5.92 por lo que se tiene que redondear al próximo número entero.

K=6

Rango

Al número de unidades de variación presente en los datos recopilados y se obtiene de la diferencia entre el dato mayor y el dato menor.

R = Dato mayor – Dato menor

R = 50-2

R = 48

Amplitud

Se encuentra dividiendo el rango por el número de intervalo de clase.

A = R/K

Por lo tanto A=48/6

A = 8

Quedando configurada la tabla de la siguiente manera

Añadiremos otra columna más donde multiplicaremos cada marca de clase por su frecuencia absoluta, sumando en la última fila todos los resultados.

Con esto podemos calcular la media:
Esta imagen tiene un atributo ALT vacío; su nombre de archivo es image-236.png

La suma de las marcas de clase por su frecuencia la tenemos en la última fila de la cuarta columna, que es 829.5 y la suma de todos los datos en la última fila de la segunda columna es 31.

Añadimos una quinta columna donde iremos escribiendo la distancia de cada intervalo, haciendo la resta de la marca de clase menos la media.

Tenemos la suma de las distancias de cada intervalo y el número total de datos, los cuales nos sirven para calcular la desviación media.

La suma de las distancias es 73.5 que la tenemos en la última fila de la quinta columna y el número total de datos es 31, que tenemos al final de la segunda columna.

A continuación añadimos dos columnas. Una es el cuadrado de la distancia y la segunda el cuadrado de la distancia por la frecuencia absoluta.

Con estas columnas podemos calcular la Varianza y Desviación estándar. Para la varianza es la división de la sumatoria total del cuadrado de la distancia por la frecuencia absoluta entre el total de la frecuencia absoluta. Desviación estándar la raíz cuadrada de suma de las distancias al cuadrado de cada intervalo y el número total de datos.

Varianza

La suma de las distancias al cuadrado es 4080.51 y lo que tenemos en la última fila de la sexta columna. El número total de datos es 31, que lo tenemos al final de la segunda columna.

Formula

Sustitución

Resultado

Desviación estándar

Raíz cuadrada de la suma de las distancias al cuadrado es 4080.51 y lo que tenemos en la última fila de la sexta columna. El número total de datos es 31, que lo tenemos al final de la segunda columna.

Formula

Sustitución

Resultado

Coeficiente de variación

El coeficiente de variación es una medida estadística que se calcula dividiendo la desviación estándar entre el valor absoluto de la media y multiplicando por 100 (para obtener el resultado en tanto por ciento).

Fórmula

El coeficiente de variación sería los valores del ejemplo:

Sustitución

Resultado

El coeficiente de variación se utiliza para comparar datos de una misma población, que se miden magnitudes diferentes.

Kendor Emmanuel O´Shelly Parada

Kendor Emmanuel O´Shelly Parada

Ingeniero en Geociencias, Docente