Resumen parcial 2 Probabilidad y estadistica I

126 0

Medidas de tendencia central

Las medidas de tendencia central son parámetros estadísticos que informan sobre el centro de la distribución de la muestra o poblacion estadistica.

Entre las medidas de tendencia central podemos encontrarnos con las siguientes:

Media

La media es el valor promedio de un conjunto de datos numéricos, calculada como la suma del conjunto de valores dividida entre el número total de valores. A continuación se muestra la fórmula de la media aritmética:

Formula Media Aritmetica
Formula media aritmetica

Existen muchos tipos de media. La elección de cada tipo de media tiene que ver, principalmente con el tipo de dato sobre el que se calcula.

Mediana

La mediana es un estadístico de posición central que parte la distribución en dos, es decir, deja la misma cantidad de valores a un lado que a otro. Las fórmulas propuestas no nos darán el valor de la mediana, lo que nos darán será la posición en la que está dentro del conjunto de datos. Las fórmulas que indica la posición de la mediana en la serie son las siguientes:

  • Cuando el número de observaciones es par:

Mediana = (n+1) / 2 → Media de las posiciones observaciones

  • Cuando el número de observaciones es impar:

Mediana = (n+1) / 2 → Valor de la observación

Moda

La moda es el valor que más se repite en una muestra estadística o población. No tiene fórmula en sí mismo. Lo que habría que realizar es la suma de las repeticiones de cada valor. Por ejemplo, ¿cuál es la moda de la siguiente tabla de salarios?

TrabajadorSalario
1 €          1.236
2 €          1.236
3 €             859
4 €             486
5 €          1.536
6 €          1.536
7 €          1.621
8 €             978
9 €          1.236
10 €             768

La moda sería 1.236€. Si vemos los salarios de los 10 trabajadores, veríamos que 1.236€ se repite en tres ocasiones.

Ejercicio: Medidas de Tendencia Central.

Encontrar la media, moda y mediana de los siguientes valores: 

  • x1      x2      x3     x4      x5     x6      x7     x8      x9
  • 84;     91;     72;     68;    87;    78;   65;    87;    79.

Solución:

1. Calculamos la media:

Procedimiento.

2. Calculamos la moda:

  • Ordenamos los datos y encontramos la moda,
  • 65; 68; 72; 78; 79; 84; 87; 87; 91.

Y podemos ver que el 87 aparece dos veces.

Al ser el valor que sé más se repite, Mo = 87.

3. Calculamos la mediana:

  • Para calcular la mediana, primero agrupamos los datos:
  • 65; 68; 72; 78; 79; 84; 87; 87; 91.

Ahora, encontramos el valor central: 656872787984878791.

Por lo tanto: Me = 79.

Medidas de Dispersión (para datos no agrupados)

¿Cuáles son las medidas de dispersión que se utilizan en la estadística y describe cada una de ellas?

Desviación respecto a la media (Dx)

La desviación respecto a la media es la diferencia en valor absoluto entre cada valor de la variable estadística y la media aritmética.

Di = |x-x|

Desviación media

La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media.

Imagen 1. Formula de la desviación media.

Varianza

La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística.

Imagen 2. Formula de la varianza.

Desviación estándar

La desviación estándar es la raíz cuadrada de la varianza.
Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación.

Imagen 3. Formula de la desviación estándar

¿Para qué se utilizan las medidas de dispersión?

Un promedio no dice nada acerca de la diseminación de los datos. El promedio no es representativo cuando se tiene una amplia dispersión. Se puede comparar cuán dispersas están dos o más distribuciones.

Una medida de dispersión puede utilizarse para evaluar la confiabilidad de dos o más promedios.

¿En qué pueden apoyar el uso de las medidas de dispersión en las ciencias sociales?

La estadística resulta en muchos casos inseparable de un proyecto de investigación. Es la ciencia que provee los métodos que permiten recoger, organizar, resumir, presentar y analizar información relativa a un conjunto de datos con el fin de obtener conclusiones válidas sobre ellos. Las principales aplicaciones estadísticas en cualquier campo, no solo el de las Ciencias Sociales, descansan sobre el hecho de poder hacer observaciones o experimentos repetidos, esencialmente, bajo las mismas condiciones. En algunas áreas de la investigación, los objetos o fenómenos observados bajo las mismas condiciones variarán solo en pequeña medida (en las ciencias físicas, donde las observaciones controladas dan prácticamente los mismos resultados).

Ejercicio

Calcular la desviación media, la varianza y la desviación estándar de la siguiente distribución: 3, 8, 8, 9, 8, 9, 9, 18

Paso 1: Calcular promedio o media aritmética.

Formula de la media aritmética

Sustitución

Nota 1: “Es indispensable sacar la media aritmética para poder determinar así los valores de medidas de dispersión

Paso 2: Calcular la desviación media

Formula de la Desviación media.

Sustitución

Nota 2: Los resultados de las operaciones realizadas son valores absolutos. Es decir números positivos.

Paso 3: Calcular la Varianza

Formula de la Varianza

Sustitución

Paso 4: Calcular Desviación estándar

Formula de la desviación estándar

Sustitución

Medidas de tendencia central para datos agrupados

Se calcula sumando los productos de marca de clase con la frecuencia absoluta respectiva y su resultado dividirlo por el número total de datos.

Formula de la media aritmética para datos agrupados.

La marca de clase de una tabla para datos agrupados en intervalos corresponde al promedio de los extremos de cada intervalo.

El intervalo 25-30. Por lo tanto el 25 corresponde al extremo inferior del intervalo y el 30 corresponde al extremo superior del intervalo.

El intervalo anterior la marca de clase es 27.5 es decir:

Valor de la marca de clase en intervalo (25 – 30).

Moda (Mo)

El valor que representa la mayor frecuencia absoluta. En tablas de frecuencia con datos agrupados.

Donde:

  • Li = Es el extremo inferior del intervalo modal (Intervalo que tiene mayor frecuencia absoluta).
  • fi = Es la frecuencia absoluta del intervalo modal.
  • fi-1 = Es la frecuencia absoluta del intervalo anterior modal.
  • fi+1 = Es la frecuencia absoluta del intervalo posterior modal.
  • ti = Es la amplitud de los intervalos.

Mediana (Me)

La mediana se encuentra en el intrvalo donde la frecuencia acumulada llega hasta la mitad de la suma de frecuencias absolutas.

Es decir tenemos que buscar el intervalo en el que se encuentre. N/2

Formula de la mediana.

Donde:

  • Li-1 = Es el límite interior de la clase donde se encuentra la mediana.
  • N/2 = Es la semi suma de las frecuencias absolutas.
  • Fi-1 = Es la frecuencia acumulada anterior a la clase mediana.
  • fi = Es la frecuencia absoluta del intervalo mediano.
  • ti = Es la amplitud de los intervalos.

Ejemplo

En la siguiente tabla se muestran las edades de un grupo de personas.

EdadMarca de
Clase (Xi)
Frecuencia
Absoluta (fi)
Frecuencia
acumulada (Fi)
[0 -10)533
[10 -20)1569
[20 -30)25716
[30 -40)351228
[40 -50)45331
Total31

1. Calcularemos la media aritmética

2. Calcularemos la mediana

Para poder calcular la mediana es necesario identificar la clase mediana. Para esto tenemos que buscar el intervalo en el que se encuentre. N/2 en este caso N/2 = 31/2 = 15.5

Ahora debemos buscar el intervalo donde la frecuencia acumulada (Fi) contenga el valor aproximado obtenido (15.5).

Formula de la Mediana (Me).

Esta imagen tiene un atributo ALT vacío; su nombre de archivo es image-239.png

Sustitución y operaciones

Recordando

  • Li-1 = Es el límite interior de la clase donde se encuentra la mediana. En este caso el límite inferior es 20.
  • N/2 = Es la semi suma de las frecuencias absolutas. En este caso es 15.5
  • Fi-1 = Es la frecuencia acumulada anterior a la clase mediana. En este caso es 9.
  • fi = Es la frecuencia absoluta del intervalo mediano. En este caso es 7.
  • ti = Es la amplitud de los intervalos. En este caso es: 30-20 = 10.

3. Calcularemos la Moda (Mo)

Lo primero que hay que hacer es identificar el intervalo modal.

Formula de la Moda (Mo)

Sustitución y operaciones

Recordando

  • Li = Es el extremo inferior del intervalo modal (Intervalo que tiene mayor frecuencia absoluta). En este caso es 30.
  • fi = Es la frecuencia absoluta del intervalo modal. En este caso es 12.
  • fi-1 = Es la frecuencia absoluta del intervalo anterior modal. En este caso es 7.
  • fi+1 = Es la frecuencia absoluta del intervalo posterior modal. En este caso es 3.
  • ti = Es la amplitud de los intervalos. En este caso es = 40 – 30 = 10

Medidas de dispersión para datos agrupados

Calcular el intervalo de clase, Rango y Amplitud. Mediante los siguientes datos de edades.

2,5,9,11,13,14,15,18,19,21,22,23,25,25,27,29,31,31,32,32,33,34,35,36,37,37,38,39,42,45,50.

Intervalo de clase (K)

Para obtener un valor aproximado, podemos emplear la regla de Sturges.

K = 1+3.3 Log (N)

Donde:

  • K = Intervalo de clase.
  • N = Es el número de datos en la muestra.

K = 1+3.3 Log(31)

K= 5.92 por lo que se tiene que redondear al próximo número entero.

K=6

Rango

Al número de unidades de variación presente en los datos recopilados y se obtiene de la diferencia entre el dato mayor y el dato menor.

R = Dato mayor – Dato menor

R = 50-2

R = 48

Amplitud

Se encuentra dividiendo el rango por el número de intervalo de clase.

A = R/K

Por lo tanto A=48/6

A = 8

Quedando configurada la tabla de la siguiente manera

Añadiremos otra columna más donde multiplicaremos cada marca de clase por su frecuencia absoluta, sumando en la última fila todos los resultados.

Con esto podemos calcular la media:
Esta imagen tiene un atributo ALT vacío; su nombre de archivo es image-236.png

La suma de las marcas de clase por su frecuencia la tenemos en la última fila de la cuarta columna, que es 829.5 y la suma de todos los datos en la última fila de la segunda columna es 31.

Añadimos una quinta columna donde iremos escribiendo la distancia de cada intervalo, haciendo la resta de la marca de clase menos la media.

Tenemos la suma de las distancias de cada intervalo y el número total de datos, los cuales nos sirven para calcular la desviación media.

La suma de las distancias es 73.5 que la tenemos en la última fila de la quinta columna y el número total de datos es 31, que tenemos al final de la segunda columna.

A continuación añadimos dos columnas. Una es el cuadrado de la distancia y la segunda el cuadrado de la distancia por la frecuencia absoluta.

Con estas columnas podemos calcular la Varianza y Desviación estándar. Para la varianza es la división de la sumatoria total del cuadrado de la distancia por la frecuencia absoluta entre el total de la frecuencia absoluta. Desviación estándar la raíz cuadrada de suma de las distancias al cuadrado de cada intervalo y el número total de datos.

Varianza

La suma de las distancias al cuadrado es 4080.51 y lo que tenemos en la última fila de la sexta columna. El número total de datos es 31, que lo tenemos al final de la segunda columna.

Formula

Sustitución

Resultado

Desviación estándar

Raíz cuadrada de la suma de las distancias al cuadrado es 4080.51 y lo que tenemos en la última fila de la sexta columna. El número total de datos es 31, que lo tenemos al final de la segunda columna.

Formula

Sustitución

Resultado

Coeficiente de variación

El coeficiente de variación es una medida estadística que se calcula dividiendo la desviación estándar entre el valor absoluto de la media y multiplicando por 100 (para obtener el resultado en tanto por ciento).

Fórmula

El coeficiente de variación sería los valores del ejemplo:

Sustitución

Resultado

El coeficiente de variación se utiliza para comparar datos de una misma población, que se miden magnitudes diferentes.

Jesus Aragón Pimienta

Jesus Aragón Pimienta

Ingeniero civil, Maestro de matematicas