martes, 1 de octubre de 2013

ESTADISTICA

                                                                       BLOQUE       1
ALUMNO:  MAVIEL ALBERTO MATEO MARTINEZ                               GRUPO:  533

                                                                  ESTADÍSTICA
La estadística es una ciencia formal que estudia la recolección, análisis e interpretación de datos de una muestra representativa, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadística es más que eso, es decir, es la herramienta fundamental que permite llevar a cabo el proceso relacionado con la investigación científica.
Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las ciencias de la salud hasta elcontrol de calidad. Se usa para la toma de decisiones en áreas denegocios o instituciones gubernamentales.
La estadística se divide en dos grandes áreas:
Ambas ramas (descriptiva e inferencial) comprenden la estadística aplicada. Hay también una disciplina llamada estadística matemática, la que se refiere a las bases teóricas de la materia. La palabra «estadísticas» también se refiere al resultado de aplicar un algoritmo estadístico a un conjunto de datos, como en estadísticas económicasestadísticas criminales, entre otros.


Muestra estadística

En estadística una muestra estadística (también llamada muestra aleatoria o simplemente muestra) es un subconjunto de casos o individuos de una población estadística.
Las muestras se obtienen con la intención de inferir propiedades de la totalidad de la población, para lo cual deben ser representativas de la misma. Para cumplir esta característica la inclusión de sujetos en la muestra debe seguir una técnica de muestreo. En tales casos, puede obtenerse una información similar a la de un estudio exhaustivo con mayor rapidez y menor coste (véanse las ventajas de la elección de una muestra, más abajo.

Población Finita: es medible
Es aquella que indica que es posible alcanzarse o sobrepasarse al contar, y que posee o incluye un número limitado de medidas y observaciones; por ejemplo el número de alumnos de un centro de enseñanza.
Población Infinita: imposible de medir
Es infinita si se incluye un gran conjunto de medidas y observaciones que no pueden alcanzarse en el conteo. Son poblaciones infinitas porque hipotéticamente no existe límite en cuanto al número de observaciones que cada uno de ellos puede generar; por ejemplo si se realizara un estudio sobre los productos que hay en el mercado. Hay tantos y de tantas calidades que esta población podría considerarse infinita.

FENOMENO ESTADISTICO
Todo experimento que puede repetirse indefinidamente, para el cual existe un intervalo de resultados definidos que se dan de manera aleatoria, es decir, impredecible. Cada repetición del experimento se denomina experiencia o prueba. Ejemplo de fenómenos estadísticos son el lanzamiento de una moneda o el tiro de un dado.


FENOMENO ALEATORIO
    De acuerdo a lo visto anteriormente, un fenómeno aleatorio tiene la particularidad que de al ser observado, no se puede predecir con exactitud cual será el resultado observado.El presente cociente:

    Nº de veces que se da un resultado particular
    -----------------------------------------------------------------
    Nº de observaciones
    es la forma básica para determinar la probabilidad de ocurrencias de un fenómeno en particular.
    Características de un Fenómeno Aleatorio
    Las características de un fenómeno aleatorio tiene los siguientes rasgos pertinentes:
    1. Se podría repetir indefinidamente las observaciones bajo condiciones esencialmente invariables.
    2. Se es capaz de describir todos los posibles resultados de una observación, aún cuando no es posible establecer lo que será un resultado particular.
    3. Los resultados individuales de las observaciones repetidas pueden ocurrir de manera accidental, pero cuando el número de observaciones es grande aparece el patrón de regularidad estadística.
FENOMENO DETERMINISTA

En estadística, un suceso determinista es un experimento o fenómeno que da lugar a un resultado cierto o seguro, es decir, cuando partiendo de unas mismas condiciones iniciales tenemos la certeza de lo que va a suceder. La relación causa-efecto se conoce en su totalidad.
Por ejemplo, todos los fenómenos que siguen las leyes de la física clásica, como puede ser la caída de un cuerpo. Cuando un experimento o fenómeno no es determinista estamos ante un experimento aleatorio.

Variable

El término variable puede referirse a uno de los siguientes artículos de Wikipedia:
En Matemática, Lógica, Estadística y Ciencias


TIPOS DE MUESTREO

Muestreo probabilístico

Forman parte de este tipo de muestreo, todos aquellos métodos para los que puede calcular la probabilidad de extracción de cualquiera de las muestras posibles. Este conjunto de técnicas de muestreo es el más aconsejable, aunque en ocasiones no es posible optar por él. En este caso se habla de muestras probabilísticas, pues no es en rigor correcto hablar de muestras representativas dado que, al no conocer las características de la población, no es posible tener certeza de que tal característica se haya conseguido.


Muestreo sistemático

Se utiliza cuando el universo o población es de gran tamaño, o ha de extenderse en el tiempo. Primero hay que identificar las unidades y relacionarlas con el calendario (cuando proceda). Luego hay que calcular una constante, que se denomina coeficiente de elevación K= N/n; donde N es el tamaño del universo y n el tamaño de la muestra. Determinar en qué fecha se producirá la primera extracción, para ello hay que elegir al azar un número entre 1 y K; de ahí en adelante tomar uno de cada K a intervalos regulares. Ocasionalmente, es conveniente tener en cuenta la periodicidad del fenómeno.

Muestreo estratificado

Consiste en la división previa de la población de estudio en grupos o clases que se suponen homogéneos con respecto a alguna característica de las que se van a estudiar. A cada uno de estos estratos se le asignaría una cuota que determinaría el número de miembros del mismo que compondrán la muestra. Dentro de cada estrato se suele usar la técnica de muestreo sistemático, una de las técnicas de selección más usadas en la práctica.

Muestreo por estadios múltiples

Esta técnica es la única opción cuando no se dispone de lista completa de la población de referencia o bien cuando por medio de la técnica de muestreo simple o estratificado se obtiene una muestra con unidades distribuidas de tal forma que resultan de difícil acceso. En el muestreo a estadios múltiples se subdivide la población en varios niveles ordenados que se extraen sucesivamente por medio de un procedimiento de embudo. El muestreo se desarrolla en varias fases o extracciones sucesivas para cada nivel.
Por ejemplo, si tenemos que construir una muestra de profesores de primaria en un país determinado, éstos pueden subdividirse en unidades primarias representadas por circunscripciones didácticas y unidades secundarias que serían los propios profesores. En primer lugar extraemos una muestra de las unidades primarias (para lo cual debemos tener la lista completa de estas unidades) y en segundo lugar extraemos aleatoriamente una muestra de unidades secundarias de cada una de las primarias seleccionadas en la primera extracción.



                                               BLOQUE  2



10 EJEMPLOS :

1.- encontrar la media 
La media es la suma de los valores de los elementos  dividida por la cantidad de éstos. Es conocida también como promedio, o media aritmética.
 

Fórmula de la media:
 

Media Poblacional = µ = X
                                          N
 

 = sumatoria
µ = media
N = número de elementos
X = valores o datos

Esta fórmula se lee:
“mu es igual a la sumatoria de x dividido entre N”
 

                                        _
Media Muestral:      x  =  x
                                          n

 

Ejemplo:  Calcule la media de los siguientes  números:
 10 , 11 , 12 , 12 , 13
 

1. Sumar las cantidades       < 10 + 11 + 12 + 12 + 13 = 58>
2. Dividir la suma por la cantidad de elementos    < 58/5>
3. El resultado es la media    <11.6>
 

Por lo tanto, la media de los 5 números  es 11.6. Note que la media resulta un número que está entre el rango de elementos; en este caso, 11.6 está entre 10,11,12 y 13. 


2.-  encontrar  la mediana
Por lo tanto, la mediana es 12. 
La mediana es el valor del elemento intermedio cuando todos los elementos se ordenan.
Fórmula de la mediana:
Mediana =  X[n/2 +1/2]            La parte de [n/2 + 1/2] representa la posición.
 

Donde X es la posición de los números y n  es el número de elementos.
Ejemplo:  Buscar la mediana de los siguientes números:
 2   4   1   3  5   6   3
Primero, hay que ordenarlos:
 1       2       3       3       4       5       6
  X  X2     X3      X4     X5    X6     X7        ( Las posiciones de los números)
 

Mediana =  X[7/2 + ½]
  X[3.5 + .5]          < Se cambió el ½ a .5>
  X4                 < La mediana está en la posición 4>
Por lo tanto, la mediana es  3.
 

Ejemplo: Buscar la mediana del ejemplo anterior de la media.
Números del ejemplo anterior:  10,12,13,12,11
1. Hay que ordenarlos, en este caso  de forma ascendente; aunque también puede ser descendente.
10 , 11 , 12 , 12 , 13
2. Buscar el elemento intermedio.
 

10 , 11 , 12 , 12 , 13
 

El elemento del medio es 12. 

3.- Encontrar la moda
La moda es el valor que se presenta el mayor número de veces.
Ejemplo 1: Buscar la moda de:
  5     12    9    5    8    7    1
Como la moda es el número que más se repite, la moda es 5.
 

Ejemplo 2: Buscar la moda de:
14    16    18    16    15    12    14    14    16    18   20   16   16
El 14 se repite 3  veces.
El 18 se repite 2  veces.
El 16 se repite 5 veces.

Por lo tanto, la moda es 16. 


4.-  
Los pesos de los 65 empleados de una fábrica vienen dados por la siguiente tabla:
Peso[50, 60)[60, 70)[70, 80)[80,90)[90, 100)[100, 110)[110, 120)
fi81016141052
Construir la tabla de frecuencias.
Representar el histograma y el polígono de frecuencias.

xifiFiniNi
[50, 60)55880.120.12
[60, 70)6510180.150.27
[70, 80)7516340.240.51
[80,90)8514480.220.73
[90, 100)9510580.150.88
[100, 110)1055630.080.96
[110, 120)1152650.030.99
65

Histograma

histograma


5.-
Se ha aplicado test a los empleados de una fábrica, obteniéndose las siete tabla:

fi
[38, 44)7
[44, 50)8
[50, 56)15
[56, 62)25
[62, 68)18
[68, 74)9
[74, 80)6
Dibujar el histograma y el polígono de frecuencias acumuladas.

fiFi
[38, 44)77
[44, 50)815
[50, 56)1530
[56, 62)2555
[62, 68)1873
[68, 74)982
[74, 80)688
histograma de frecuencias acumuladas





6.-Los datos siguientes corresponden a los tiempos de reacción de una muestra de 33 sujetos, medidos en centésimas de segundo:


55, 51, 60, 56, 64, 56, 63, 63, 61, 57, 63, 50, 49, 70, 72, 54, 48, 53, 58, 66, 68, 45, 74, 65, 58, 61, 62, 59, 64, 57, 63, 52, 67
Con los datos anteriores construya una distribución de frecuencia, agrupados en 5 clases de igual amplitud (=5). El límite inferior de la primera clase es 45. Finalmente calcule la media (3 Pts), la mediana(3Pts)
.

a.- ¿Cuáles son las etapas de la investigación estadística ? Menciónelas solamente (1 Pts)

b.- ¿Qué se entiende por MUESTRA ALEATORIA.? (0.5Pts)

c.- ¿ Será cierto que la suma de las desviaciones de las observaciones con respecto a su media es 
         cero?  (0.5 Pts)
d.- Dados los siguientes datos.¿ Calcule la mediana? (2 Pts)
     12, 10, 4, 18, 24, 36


Respuestas:                

     

Tabla de Frecuencia
INTERVALOSPtos MediosFrec.Abs. Frc.Abs.AcFrec. Rel.Frec. Rel Acum.Density
[45,50[47.53 30.0909090.0909090.018182
[50,55[52.55 80.1515150.2424240.030303
(55,60)57.58 160.2424240.4848480.048485
[60,65[62.510 260.303030.7878790.060606
[65,70[67.54 300.1212120.9090910.024242
[70,75]72.53 330.09090910.018182
 n = 33
                                               


 


7.-Los siguientes datos representan la temperatura del fluido de descarga de una planta para el tratamiento de aguas negras, durante varios días consecutivos ( Presentado por: Cabeza Mariannis)
  5   8  10  14  15  23   25   28   29  30
30  35  36  40  43  44  44   45   45   46
46  46  47  48  48  49  49   49   49   50
50  50  50  51  51  51  52   53   55   57
60  66  70  72  75  75  84   84   88   94             n= 50
Buscamos el valor menor y mayor del conjunto de datos y determinamos su rango (=R)
Xmin = 5
Xmay = 94                       Luego determinamos el RANGO (=R)
                                     R = Xmay - Xmin  = 94 - 5 = 91
                                     Determinamos el numero de clases (= NC)
                                    
                                      
                                     
                                     Ahora calculamos la amplitud de clases (=Ac)
                                     Ac= R/Nc = 91 / 7 = 13
Con los datos anteriores construimos nuestra Distribución de Frecuencias
 Clases
 Xi
 fi
Fi 
ni 
 Ni
 fi * Xi
 (Xi - 47.42)2
 fi * (Xi - 47.42)2
   5     18
 12
 5
 5
 0.10
0.10 
58
 1255
 6275
  18    31
 25
 6
 11 
  0.12 
 0.22 
147
 503
 3018
 31   44     
 38
 6
 17
  0.12 
0.34
 225
 89
   534
   44   57 
  51 
23 
 40
  0.46 
 0.80
 1162
 13
    299
   57   70 
 64
 3
 43
  0.06 
  0.86 
 191
 275
    825
   70   83 
  77 
 3
 46
  0.06 
  0.92 
 230
 875
   2625
   83   96 
  90 
 4
 50
 0.08
 1
 358
 1813
   7252
 n = 50
 1
 2371
 20828
Calculemos ahora la Media aritmética, la mediana, la moda, el primer cuartil, el tercer cuartil, Desviación Cuartílica, Coeficiente de Variación, Varianza y Desviación Típica:
Media aritmética: 
Varianza:
La Desviación Típica: 
La Mediana.
Para su cálculo debemos encontrar la clase medianal, la que contiene a la mediana. Para ello dividimos el número de observaciones (n=50) entre 2 y buscamos el resultado en la columna de la frecuencia acumulada (= Fi ). En este ejemplo, n= 25 y se corresponde con la clase:
(44 - 57)
Aplicamos la fórmula:

La Moda.
Para el cálculo de la moda, buscamos la clase que tenga la frecuencia absoluta simple de mayor tamaño y esa será la clase modal. En nuesro ejemplo se corresponde con la misma clase de la mediana; es decir: (44-57) y aplicamos la siguiente fórmula:
Coeficiente de Variación (=CV )
Es el cociente entre la desviación típica entre la media aritmética, multiplicado por cien para expresarlo en porcentaje

Primer Cuartíl.
El primer cuartil (= Q1) se calcula determinando primero su clase, para ello se busca el valor 1/4*n, en nuestro ejemplo tenemos que: 1/4*50=12.5 = 13  y este resultado se busca por la frecuencia absoluta acumulada y vemos que está comprendido en la tercera clase:
 31 - 44 
Una vez determinada la clase que corresponde al primer cuartíl, aplicamos la fórmula:
Tercer Cuartil
De manera parecida calculamos el tercer cuartil (= Q3). Determinamos su clase buscando el valor 3/4*n = 0.75*50 = 38 y este resultado se busca en la columna de la frecuencia absoluta acumulada y vemos que se localiza en la cuarta clase: 44 - 57

Desviación Cuartílica.(= DQ)
Se calcula dividiendo entre dos la diferencia del tercer menos el primer cuartil.








8.-  . La distribución de las puntuaciones en una escala de hostilidad, de una muestra de 160 individuos, se refleja en la siguiente distribución:
 Intervalos
 fi
 Fi
 ni
 Ni
 0         10
 8
 8
 5%
 5%
 10       20
 22
 30
 13.8%
 18.8%
 20       30
 32
 62
 20%
 38.8%
 30       40
 44
 106
 27.5%
 66.3%
 40       50
  28 
  134 
  17.5 %
 83.8 %
 50       60
 20
 154
 12.5%
 96.3%
 60       70
 6
 160
 3.7%
 100%
 Totales
 n= 160
 100%

a) ¿Entre cuáles valores se encuentra el 50% central de los individuos?
b) Calcule el percentil 27
c)  ¿A partir de cuál puntuación se encuentra el 12% de los sujetos más hostiles?
d)  Si descontamos el 15% de los individuos menos hostiles y el 15% de los más hostiles. ¿En cuál intervalo de puntuación se encuentran los restantes?
Tomado de: Problemas de Análisis de Datos. Dr. José M. Salinas
Respuestas:
a) El 50% de los individuos se encontrará entre el Percentil 25 y el percentil 75. El P25 deja por debajo el 25% inferior, y el P75  dejará por encima el 25% superior. Por consiguiente entre ambos percentiles  se encontrará el 50% central. Para calcular el percentil 25, determinamos el 25% de n ( =0.25*160) = 40, buscamos éste valor por la columna de la frecuencia absoluta acumulada (=Fi) y vemos que se encuentra en el inetrvalo 20 - 30 y aplicamos la fórmula:
Para encontrar el percentil 75, determinamos el 075 * n = 0.75* 160 = 120 y vemos que éste valor se encuentra en el intervalo: 40  - 50 y aplicamos la fórmula:
Luego el 50% buscado estará entre los dos valores anteriores (23.13 a 45)
b) El percentil 27, estará en: 0.27 *n = 0.27* 160 = 43.2. Este valor se encuentra en la frecuencia acumulada correspondiente al intervalo: 20  -- 30 y su valor es dado por la fórmula:
 
c) El valor que deja por encima el 12% de lo sujetos más hostiles, es  el mismo que deja por debajo el 88% con menores puntuaciones de hostilidad; por tanto debemos calcular el percentil 88. El 88% del tamaño de la muestra vale 140.8 (=0.88*n). Aplicando la fórmula, tenemos:
d) Se aplica un razonamiento parecido al caso a. Buscamos el percentil 15 que deja por debajo el 15% de los sujetos con menor hostilidad y el percentil 85 que dejara por encima al 15% de los sujetos con mayor hostilidad, aplicamos las fórmulas:


9.-Hemos medido la variable neurotismo en un grupo de individuos, obteniendo los siguientes resultados:
     3, 5, 3, 6, 4, 2, 8, 3, 7, 5, 8, 9, 4, 5, 5, 3
Se pide calcular la Desviación Media (= DM) y la Desviación Típica (= s).
Solución:
Calculamos primero la media:

Ahora calculamos las desviaciones de cada valor con respecto a la media, tomamos valores absolutos de las desviaciones para calcular la Desviación Media y luego elevamos al cuadrado las desviaciones para encontrar la Desviación Típica.
 xi
 fi
xj= xi - 5
 / x/
 x 2j
 fi* xi
 fi * xj2
 2
 1
 -3
 9
 2
 9
 3
 4
 -2
 2
 4
 12
 16
 4
 2
 -1
 1
 1
 8
 2
 5
 4
 0
 0
 0
 20
 0
 6
 1
 1
 1
 1
 6
 1
 7
 1
 2
 2
 4
 7
 4
 8
 2
 3
 3
 9
 16
 18
 9
 1
 4
 4
 16
 9
 16

 16

16 
 44
 80
 66
En base a la tabla anterior calculamos, la Desviación Media (= DM), según la fórmula:
Ahora calcularemos la Varianza (= s2) y la Desviación Típica (= s)
Dios habla por las matemáticas
8) En la ejecución de un estudio para determinar la situación de empleo a un grupo de profesionales, se seleccionó una muestra de éstos de forma aleatoria para conocer la composición por categoría profesional. Construya una distribución de frecuencias, identifique la variable, de ejemplo de estadísticos. Hacer el gráfico de sector, barras e histogramas:
Administrador           Economista       Abogado                  ingeniero
Contador                   Abogado           Administrador          médico
Abogado                   Contador           Ingeniero                 economista
Administrador           Abogado           Contador                  ingeniero
Abogado                   Médico              Médico
     

Profesiones 
 fi
Fi 
Adm 
 3
Abog 
 5
 8
Inge 
 3
11 
Cont 
 4
15 
 Econom
 2
17 
Medico 
 3
20 

 20
  





10.-Los siguientes datos representan la presión sanguínea tomada a 30 personas, las cuales se sometieron a un examen de laboratorio.
 
108  113 136122 130 114
 115 132 123 110 126 109
 125 122 119 118 119 106
 115 124 118 111 124 113
 124 109 121 121 108 119

Se pide:
a.) Construir una tabla de distribución de frecuencias, con seis clases de amplitud cinco cada una.
b.) Calcular la media, la mediana y la moda
c.) Calcular la varianza
d.) Calcular la Desviación Cuartílica

Solución:

a.) El rango, viene dado por:  R=Xmax - Xmin  = 136-106=30
b.) Cálculo de la media:

 Clases     f i      Fi     xi     ni       Ni

 106 -----111 7 7108.5  23% 23%631.75 
 111 -----116 5 12 113.5 17% 40% 101.25
 116 -----121 7 19 118.523% 63%  1.75
 121 -----126  8 27 123.527% 90%  242.00
 126 -----131 1 28 128.53% 93%  110.25
 131 -----136 2 30 133.57% 100%  480.50
 Totales: 30100%  1567.50

c.) Cálculo de la Mediana (=Md)

d.) Cálculo de la Moda (=Mo)

e.) Cálculo de la Varianza (=S2)
f.) Cálculo del Primer Cuartíl (=Q1)
g.) Cálculo del Tercer Cuartil (=Q3)
h.) Cálculo de la Desviación Cuartílica(= DQ)
https://mavielmateo.blogspot.com/b/post-preview?token=sqtWeEEBAAA.vhFWf73-XtSQNShvJoU3vg.xvSo6Hy2mBxHasTy_s-72Q&postId=4091921627815794875&type=POST