jueves, 25 de octubre de 2018

MEDIDAS DE DISPERSIÓN

Se utilizan para saber como están distribuidos los datos, la más sencilla es el rango y la más utilizada es la desviación típica o estándar.
La dispersión sirve para medir que tan alejados estén los valores. La población o muestra será heterogénea en el caso contrario será homogénea.
Las medidas de dispersión incluyen:
Rango
Varianza
Desviación estandar.

RANGO: Es la medida de dispersión más sencilla y menos utilizada, ya que es la medida poco estable.
Es la diferencia en valor entre las porciones de datos de mayor valor(Máx) y de menor valor (Mín).
         
Rango=Máx-Mín.

VARIANZA: Promedio de los cuadrados de las desviaciones  medidas alrededor de la  media.

Población:

Muestra:

EJEMPLO: Haya la Varianza y la desviación de las siguen es edades: 5,6,6,7,8.
POBLACIÓN:La formula nos dice sigma al cuadrado es igual a la sumatoria de X menos el promedio al cuadrado entre el numero de datos.
Para poder sustituir los valores de la formula primero sacaremos el promedio:
Promedio=32/5=6.4 años
σ²=(5-6.4)²+(6-6.4)²+(6-6.4)²+(7-6.4)²+(8-6.4)²
    -------------------------------------------------------------
                                   5
σ²=1.96+0.16+0.16+0.36+2.56
    ----------------------------------------
                         5
σ²=5.2
    -------
       5
σ²=1.04 años varianza
σ=a 1.04 sácale la raíz cuadrada para obtener la desviación.
σ=1.01 años.

MUESTRA:La formula nos dice muestra es igual a la sumatoria de X menos el promedio al cuadrado entre el numero de datos menos uno.
Usaremos los siguientes datos para después sustituirlos en la formula:
Peso en Kg 52,55,58.
Promedio=165/3 =55Kg
s²=(52-55)²+(55-55)²+(58-55)²
    -------------------------------------
                        2
s²=9+0+9
   ------------
         2
s²=9 Kg Varianza
s= raíz cuadrada de 9
s=3Kg. 




MEDIA, MEDIANA Y MODA PARA DATOS AGRUPADOS.

EJEMPLO:
Haya la media, mediana y moda de las siguientes horas trabajadas.

Horas
x
f
F
xf
55-60
57.5
5
5
287.5
60-65
62.5
18
23
1125
65-70
67.5
20
43
1350
70-75
72.5
50
93
3625
75-80
77.5
17
110
1317.5
80-85
82.5
16
126
1320
85-90
87.5
4
130
350
Total

130

9375


"X" Se calcula sumando las horas y dividiéndolas entre dos.
(55+60)/2=57.5
(60+65)/2=62.5
(65+70)/2=67.5
(70+75)/2=72.5
(75+80)/2=77.5
(80+85)/2=82.5
(85+90)/2=87.5

"f" Es la frecuencia absoluta.

"F" La obtienes sumando la frecuencia absoluta (f), pasando el primer valor como esta.
5+18=23
23+20=43
43+50=93
93+17=110
110+16=126
126+4=130

"xf" La obtendrás multiplicando la marca de clase(x) con la frecuencia absoluta(f).
(57.5)(5)=287.5
(62.5)(18)=1125
(67.5)(20)=1350
(72.5)(50)=3625
(77.5)(17)=1317.5
(82.5)(16)=1320
(87.5)(4)=350
9375 es el resultado de la suma de todos los valores.

Con ayuda de la tabla sera más sencillo calcular la media, mediana y moda.

MEDIA:
La formula nos indica que la media equivale a la sumatoria de xf entre el numero de datos.
La suma de la multiplicación de los valores de x por f da como resultado: 9375, estos se dividirá entre 130.
9375/130=72.11
La media es 72.11 horas.

MEDIANA:
La formula nos indica que la mediana es igual a limite inferior (Li) más la amplitud (a) por el resultado de la resta del numero de datos entre dos (N/2) menos la frecuencia absoluta acumulada (Fi-1) entre la posición que ocupe la mediana en la frecuencia absoluta (fi).
Para saber que posición ocupa la mediana debes dividir el numero de datos entre dos:
130/2=65.
El resultado lo buscaras en los datos de la tabla que se encuentren en la "F", si el valor no esta revisa entre que datos esta el valor y elige el que va después de el. En este caso el valor se encuentra entre 43 y 93 por lo que elegiremos 93. Para calcular la mediana sustituiremos los datos de la formula según la fila previamente elegida.
Li=70
A=5
Fi-1=43
fi=50
N/2=65

Me=70+5(65-43)
              -------------
                    50
Me=70+5(22)
              -------
                50
Me=70+5(.44)
Me=70+2.2
La mediana es igual a 72.2

MODA:
Para desarrollar la formula de la moda tomaremos los datos de la fila que tengan mayor repetición en su frecuencia absoluta (f). La formula nos indica que la moda es igual a la suma del limite inferior (Li) más la amplitud(a) por el resultado de la resta de la frecuencia absoluta (fi) menos el dato anterior de la frecuencia absoluta (fi-1)  entre el resultado de la frecuencia absoluta (fi) menos el dato anterior de la frecuencia absoluta (fi-1) más el resultado de la frecuencia absoluta (fi) menos el dato que sigue de la frecuencia absoluta (fi+1).
En este caso la fila coincidió con la de la mediana por lo que algunos valores serán los mismos:
Li=70
A=5
fi=50
fi-1=20
fi+1=17

Mo=70+5      (50-20)
             ( --------------------)
               (50-20)+(50-17)
 Mo=70+5     (30)
                (-------------)
                  (30)+(33)
Mo=70+5   30
                (-------)
                    63
Mo=70+5(.47)
Mo=70+2.38
La moda es igual a 72.38

¿COMO GRÁFICAR LA MEDIANA?

En un histograma los intervalos de clase o "clases" son sucesivos y no hay huecos entre clases para mostrar la naturaleza continúa de la variable. Cada barra se levanta sobre un intervalo de clase y la altura de la barra señala la frecuencia relevada para la clase. Las barras se dibujan pegadas, y no separadas como en las variables discretas, para indicar que la variable continúa puede asumir cualquiera de los valores comprendidos entre la primera y la ultima clase. Es una gráfica construida a partir de segmentos de linea que unen las marcas de clase de los intervalos de clase de un histograma, si se usan FA o FR, sino se unen los límites superiores de cada clase en el caso de usarse FAA o FRA.

EJEMPLO:
Sacar la media, mediana y moda del promedio de tus calificaciones: 10,10,10,9,10,10,8,10,10.
Media:10+10+10+9+10+10+8+10+10=/9
              87/9=9.66
Mediana:8,9,10,10,10,10,10,10,10.
                  n+1=/2
                  9+1=10
                  10/2=5
La mediana es 10 ya que se encuentra en la quinta posición.
Moda: La moda es "10".


MEDIDAS DE TENDENCIA CENTRAL

Las medidas de tendencia central son instrumentos que toman todos los datos de una muestra concentrándolos en un solo y único valor.
MEDIA.
MEDIANA.
MODA.

MEDIA ARITMÉTICA: Es el promedio de la suma de todos los datos dividido entre el numero de datos. Valores extremos es lo que sube demasiado o bajo el promedio. Se representa con la siguiente formula: 
Se lee como "X barra" o "media de la muestra"; es la suma de valores X y dividiendo entre el número de estos valores, n.



MEDIANA : Es el valor que divide al conjunto de valores en dos partes iguales. Posición de la mediana: (n+1)/2 cuando "n" es impar, la posición de la mediana coincide con el lugar que ocupa uno de los datos. Si "n" es par, se localizará entre los dos datos centrales. La mediana es el valor medio o             media aritmética. 
               
MODA: Es el dato que se repite con mayor frecuencia. Puede existir también multimoda que significa más de una.

EJEMPLO 1: Haya la media, mediana y moda de los siguientes datos. 6,3,8,6,4.
Media: 6+3+8+6+4=/5
              27/5= 5.4
Mediana: Para encontrar la mediana debes ordenar de menor a mayor los datos.
3,4,6,6,8
n+1÷2
5+1=/2
6/2=3
La mediana se encuentra en la tercera posición que es el "6".
Moda: La moda es el numero "6" ya que este se repite dos veces.

EJEMPLO 2: Haya la media, mediana y moda. 6,8,8,10,9,5.
Media:6+8+8+10+9+5=/6
             46/6= 7.6
Mediana: 5,6,8,8,9,10
n+1÷2
6+1=/2 
7/2=3.5
La mediana se encuentra entre los dos ochos por lo que los sumaremos y dividiremos entre dos.
8+8=16
16/2=8
Moda: la moda es "8".

                                                                

martes, 23 de octubre de 2018

TABLA DE FRECUENCIAS CON DATOS AGRUPADOS EN INTERVALOS.

Si tenemos un numero muy grande de datos, estos se agrupan en intervalos, para no tener que realizar tablas muy largas con datos diferentes. También se agrupan en intervalos cuando las variables son continuas.
los datos se agrupan en intervalos, llamados clases.

CLASES: Limites de clase: cada intervalo tiene un limite inferior, que pertenece a ese intervalo (cerrado por la izquierda con un corchete) y un limite superior que no pertenece (abierto por la derecha).

NUMERO DE INTERVALOS:Regla de sturges: 1+3.3 log n (n es el numero de datos).

RANGO: Es la diferencia entre los valores máximos y mínimos de nuestros datos. (Dato mayor menos Dato menor).

AMPLITUD DE FRECUENCIA: Una forma sencilla de determinar los intervalos es dividir el rango de la serie de valores entre el numero de intervalos que se desean establecer.

MARCA DE CLASE: Se obtienen calculando el promedio de los extremos de cada intervalo. m=Xmín +(Xmáx-Xmín)
                                                                      -------------------
                                                                                  2

EJEMPLO:
Se encuestan a 10 personas donde se les pregunta su edad y los datos obtenidos fueron: 25,27,30,20,23,27,29,33,40 y 25.
a) Encuentra el numero de intervalos (1+3.3log n)
b) Encuentra el valor del rango.
c) La amplitud de frecuencia.
d) Realiza la tabla de frecuencia.
e) Encuentra la marca de clase.

a)1+3.3 log n(10)=4.3 =4
b)40-20=20
c)20/4=5
d)
EDAD
FRECUENCIA
ABSOLUTA
FR
FRA
FRAC
MARCA DE
CLASE
[20-25)
2
20%
2
20%
22.5
[25-30)
5
50%
7
70%
27.5
[30-35)
2
20%
9
90%
32.5
[35-40]
1
10%
10
100%
37.5
TOTAL
10
100


120
 e)20+25/2=22.5
   25+30/2=27.5
   30+35/2=32.5
   35+40/2=37.5

DISTRIBUCIÓN DE FRECUENCIA

Las primeras tareas de la estadística descriptiva son: ordenar, clasificar y resumir los datos obtenidos en alguna investigación, para ello se concentran en:

 TIPOS DE FRECUENCIA.
FRECUENCIA ABSOLUTA (fa): Es el numero de veces que se repite un mismo dato o valor de una variable.

FRECUENCIA RELATIVA (fr): Esta se obtiene dividiendo su frecuencia absoluta entre el numero total de elementos. Se puede expresar  en fracción, con valores decimales o en porcentaje.

FRECUENCIA ACUMULADA (fac): Se obtiene sumando la frecuencia absoluta correspondiente a este valor, con las frecuencias absolutas de todos los valores anteriores a el.

FRECUENCIA RELATIVA ACUMULADA (frac): Se obtiene sumando la frecuencia relativa correspondiente a este valor, con las frecuencias relativas de todos los valores anteriores a el. Se puede expresar en fracción, en valor decimal o porcentaje.

EJEMPLO:

 Día
Frecuencia
Absoluta
Frecuencia Relativa
Frecuencia
Acumulada
Frecuencia Relativa
Acumulada
Fracción
Decimal
Porcentaje
Lunes
132
132/1000
0.132
13%
132
13
Martes
96
96/1000
0.096
10%
228
23
Miércoles
48
48/1000
0.048
5%
276
28
Jueves
125
125/1000
0.120
13%
401
41
Viernes
160
160/1000
10160
16%
561
57
Sábado
380
380/1000
0.380
38%
941
95
Domingo
59
59/1000
0.059
6%
1000
101
TOTAL
1000

1
100%