ESTADISTICA .....
maviel alberto
mateo martinez grupo 533
bloque 3........
Media
Es la medida de tendencia
central mas utilizada, también llamada promedio el símbolo que se utiliza para
representarla es X( equis barra)
En datos no agrupados es igual a
la suma de los valores dividida entre el numero de ellos.
La media es un estadístico
y seria una aproximación del parámetro poblacional.
En algunas ocaciones la
formula para calcular la media sufre algunas modificaciones
Esta se utiliza cuando se tienen
los datos ya utilizados en una tabla de frecuencia simple a la que se le puede
agregar una columna con el encabezado fX(la multiplicación de la frecuencia del
dato por su valor) y se suman los resultados obteniendo con
ello ∑ FX, lo cual se dividirá entre el valor de n .
Cuando la variable incluye
valores muy dispares o extremos la media pierde representatividad.
En datos agrupados:
1.- Se hallan las marcas de
clases de todos los intervalos ( para sacar la marca de clases se suman ambos
limites de los intervalos y se divide entre dos).
2.- Para cada intervalo se
multiplica la frecuencia absoluta por la marca de clase.
3.- Se suman todos los
resultados de las multiplicaciones anteriores.
4.- La suma anterior se didvide
entre le numero de datos.
Su formula es la siguiente :
En donde :
X* = a media o promedio
f = a frecuencia absoluta
X= Marca de clase
N = numero de datos
Mediana
Es el valor que divide el grupo
de datos en dos partes iguales, 50% por debajo de el y 50% por arriba del mismo
se utiliza el símbolo Me.
En datos no agrupados :
1.- Se ordenan los datos de
mayor a menor
2.- Se indentifica el valor que
se ubica en medio de los datos:
a) Cuando el numero de datos n
es impar la mediana conincidirá con uno de los valores quedando justamente en
medio de ellos.
b) Cuando n es
par la mediana es el promedio de los dos valores centrales
Para conocer la posición de la
mediana existe una formula muy útil que es la siguiente:
Esta nos indica el lugar que
ocupa la mediana adentro de los datos ya ordenados de menor a mayor pero no
calcula de manera directa el valor de la misma.
En los datos agrupados se
denomina ampliutud o anchura del intervalo al tamaño de este y se calcula
obteniendo la diferencia entre los limites reales del intervalo estos e
obtienne de restar y sumar media unidad a los limites inferior y superior del
intervalo.
Datos agrupados :
1.- se identifica el intervalo
que contiene el valor de la mediana para ello conocer que lugar ocupa esta
mediante la formula
Al ubicar donde recae la mediana
podemos tener una idea aproximada de su valor conociendo los limites del
intervalo.
2.- Se calcula la frecuencia
acumulada fa ( correspondiente al intervalo que contiene a mediana)
3.- Se indentifica la frecuencia
abosoluta f del intervalo que contiene la mediana
4.- Se mide la amplitud o
anchura que contiene la mediana
5.-Se indentifica el limite real
inferior L del intervalo que contiene la mediana.
6.- Teniendo los valores
ateriores se aplica la siguiente formula
Moda
En datos
no agrupados:
La moda
es el dato o valor de la variable que ocurre con mayor frecuencia el símbolo
que se utiliza es Mo.
Los
datos que tengan la misma frecuencia y esta sea la mas alta entonces decimos
que se tiene dos modas o que le conjunto de dota es BIMODAL, si fueran 3 o mas
datos los que representaran dichas características el conjunto es MULTIMODAL.
Pasos
para hallar la moda:
1. Organiza los datos en una tabla de
frecuencia simple
2. Identifica el dato con la mayor frecuencia y
ese será la moda
Importante:
el valor de la moda lo encontramos dentro de los valores de la variable
La moda
puede hallarse cuando se trata de variables medidas en cualquier escala:
nominal, ordinal, de intervalo o de razón.
Para los
datos agrupados en intervalos tendremos que la moda será la marca de clase de
ese intervalo.
Decimos
que se presentan una asimetría positiva cuando la mayor parte de los datos se
concentran en los valores menores (hacia la izquierda) del eje horizontal. Por
otro lado, en la asimetría negativa la mayor parte de los datos se concentran
en los valores mayores (hacia la derecha) del mismo.
El
coeficiente de asimetría es positivo cuando justamente la forma del histograma
presenta una asimetría positiva, es negativo cuando la asimetría es negativa y
es cero cuando la forma es simétrica
Para
poder proceder a sacar la moda se utiliza la siguiente formula
en donde
L1 =
Limite inferior de la clase modal
fi =
frecuencia absoluta de la clase modal
fi -1 =frecuencia
inmediata inferior de la clase modal
fi ₊ 1=
frecuencia absoluta inmediata a la clase modal
Medidas de variabilidad
Rango, varianza y desviación
estándar
Las medidas de variabilidad
también llamadas de dispersión indican ciertos aspectos del conjunto de datos
que no nos lo dicen las medidas de tendencia central
Una medida de tendencia central
se emplea para ubicar el centro de un conjunto de datos a esta dimensión se le
conoce comúnmente como variación o dispersión
Calculo de las medidas de
variabilidad para datos no agrupados
Rango
Se calcula hallando la
diferencia (resta) entre los valores máximo y mínimo
Rango= R= Valor máximo—Valor
Mínimo
Desviación estándar
Es la medida de variabilidad mas
adecuada por sus propiedades algebraicas, se le conoce también como desviación
típica
La desviación estándar es la
medida de la variación de los valores con respecto a la media.
Es una especie de desviación
promedio con respecto a la media, la desviación estándar se calcula de la
siguiente forma:
Donde:
X= valores de los datos
X=media
n= numero de datos
para calcula la desviación
estándar se procede de la siguiente manera:
1.calcular el valor de la media
2. restar la media de cada valor
individual para tener una lista de desviaciones de la forma
(x
3. elevar al cuadrado cada una
de las diferencias obtenidas en el paso anterior. Recuerda que al elevar al
cuadrado un numero negativo este se vuelve positivo
4. sumar todos los resultados
obtenidos. Este valor es el de
)
5. divide el total del paso 4
entre el numero de los datos n
6. calcular la raíz cuadrada del
resultado anterior
La varianza
Es una medida de variabilidad
que se obtiene elevando al cuadrado la desviación estándar.
Se simboliza por
Así que una vez obtenida
la desviación estándar , solo hay que elevar al cuadrado su valor y con ello
obtendremos el valor de la varianza
Calculo de la desviación
estándar y la varianza de datos agrupados
Para calcular la desviación
estándar y la varianza en datos agrupado se aplica la misma formula cuando se
tenían los datos en una tabla de frecuancias simple, esta es cuando, se aplica
la formula:
Solo que ahora x es la marca de
clase del intervalo, recuerda que en este caso aplicamos 7 pasos, una vez ya
calculadas las marcas de clase ya respectivas
Relacion entre la desviación
estándar y el rango
Para obtener una estimación de
la desviación estándar cuando se conoce el rango de los datos existe una forma
sencilla s=
EJEMPLOS
Problema para datos No
Agrupados
Hallar las medidas de tendencia
central y de variabilidad a la siguiente situación se encuesto a 300
personas preguntándoles el numero de hijos que tienen:
No. Hijos
|
No. Personas
|
||
X
|
f
|
fx
|
fA
|
0
|
78
|
78
|
78
|
1
|
90
|
90
|
168
|
2
|
32
|
64
|
200
|
3
|
25
|
75
|
225
|
4
|
50
|
200
|
275
|
5
|
15
|
75
|
290
|
6
|
10
|
60
|
300
|
∑=300
|
∑642
|
= = 2.14
*La media correspondiente a 2.14
*El 50% de las personas tiene de
0 a 1 hijo y el otro 50% de 2 a 6 hijos
*La moda es igual a 1 hijo
Desviación estándar
78
– 2.14 = 75.86
|
5754.7
|
448866.6
|
90
– 2.14 = 87.86
|
7719.3
|
694737
|
64–
2.14 = 61.86
|
3826.6
|
122451.2
|
75–
2.14 = 72.86
|
5308.5
|
265425
|
200–
2.14 =197.86
|
39148.5
|
1957425
|
75–
2.14 = 72.86
|
5308.5
|
79627.5
|
60–
2.14 = 57.86
|
3347.7
|
334477
|
∑3602009.3
|
S= 109.57
S2= 12006.6
Problema
para Datos Agrupados
En un
hospital se tomo la temperatura de 100 pacientes ,hallar las medidas de
tendencia central y variabilidad :
Intervalos
|
Frecuencia
|
X
|
fx
|
fa
|
10-11
|
3
|
15.5
|
46.5
|
3
|
12-13
|
2
|
18.5
|
37
|
5
|
14-15
|
15
|
21.5
|
322.5
|
20
|
16-17
|
12
|
24.5
|
294
|
32
|
18-19
|
23
|
27.5
|
632.5
|
55
|
20-21
|
14
|
30.5
|
427
|
69
|
22-23
|
23
|
33.5
|
770.5
|
92
|
24-25
|
3
|
36.5
|
109.5
|
95
|
26-27
|
3
|
39.5
|
118.6
|
98
|
28-29
|
2
|
42.5
|
85
|
100
|
∑100
|
∑290
|
∑2843
|
Mo= bimodal
15.5 -
28.43 = -12.93
|
167.18
|
501.5
|
18.5 -
28.43 = -9.93
|
98.6
|
197.2
|
21.5 –
28.43 = -6.93
|
48.02
|
720.3
|
24.5 –
28.43 = -3.93
|
15.44
|
185.25
|
27.5 -
28.43 = -.93
|
.86
|
19.7
|
30.5 -
28.43 = 2.7
|
7.29
|
102.06
|
33.5 -
28.43 = 5.7
|
32.49
|
747.27
|
36.5 -
28.43 = 8.07
|
65.12
|
195.36
|
39.5 -
28.43 = 11.07
|
122.5
|
367.5
|
42.5 -
28.43 = 14.07
|
197.9
|
395.8
|
∑=
3431.9
|
S = 5.8
Varianza
S2= 34.31
BLOQUE
4....
Excel:
análisis de datos de dos variables en una tabla
Para
ilustrar nuestro ejemplo utilizaremos la fórmula del área del
triangulo (base x altura / 2). Lo primero que debemos hacer es introducir los
datos como si solo quisiéramos conocer el área del
triangulo para unos valores concretos de la base y la altura. En nuestro
ejemplo, la base es igual a 10 (celda B1), la altura es 5 (celda B2) y la
fórmula (=B1*B2/2) para calcular el área la hemos puesto en la celda C3.
Ahora sigue los siguiente pasos:
Ahora sigue los siguiente pasos:
Excel XP
1- Selecciona el rango de celdas que van a formar la tabla para el análisis de datos. En el ejemplo (Figura 1) el rango es B3:E7. Es muy importante notar que la celda donde hemos puesto la fórmula (fondo amarillo en la figura 1) tiene que estar en el angulo superior izquierdo de la tabla.
2- Con el rango de celdas de la tabla seleccionado, dirígete el menú "Datos" y pulsa sobre "Tabla..."
3- El cuadro de diálogo que aparece te solicita "Celda de entrada (fila)", que en nuestro ejemplo es B1, y "Celda de entrada (columna)", que en el ejemplo es B2. Rellénalas y pulsa "Aceptar".
4- Ahora, para que la tabla se rellene automáticamente con los valores del área del triángulo en función de la base y la altura, escribe los distintos valores de la base en las celdas C3,D3 y E3 (fondo anaranjado, figura 1) y de la altura en las celdas B4, B5, B6 y B7 (fondo verde en figura 1).
Excel 2007 y superior
En este caso, para introducir los datos "Celda de entrada (fila)" y "Celda de entrada (columna)" tendrás que seleccionar la pestaña "Datos" y en el grupo de herramientas "Herramientas de datos" pinchar sobre "Análisis Y si" y seleccionar "Tabla de datos..."
The 6 Best Casino Restaurants in Atlanta - Mapyro
ResponderEliminarAtlanta's 광주광역 출장안마 7 Best Casino 과천 출장마사지 Restaurants 구리 출장안마 · 거제 출장안마 The Venetian · The Biltmore · Dunder · 제주 출장안마 The Biltmore.