50% encontró este documento útil (2 votos)
2K vistas148 páginas

Estadistica I

Este documento presenta los temas de distribuciones muestrales, estimación de parámetros, determinación del tamaño de la muestra y prueba de hipótesis en estadística. Incluye secciones sobre distribuciones normales, curvas normales estandarizadas y aplicaciones de distribuciones normales, con ejemplos numéricos.

Cargado por

Juan Corpus
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd
50% encontró este documento útil (2 votos)
2K vistas148 páginas

Estadistica I

Este documento presenta los temas de distribuciones muestrales, estimación de parámetros, determinación del tamaño de la muestra y prueba de hipótesis en estadística. Incluye secciones sobre distribuciones normales, curvas normales estandarizadas y aplicaciones de distribuciones normales, con ejemplos numéricos.

Cargado por

Juan Corpus
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd

ESTADISTICA I

 DISTRIBUCIONES MUESTRALES

1.1 Introducción.

1.1.1 Teorema de Combinación Lineal

1.1.2 Teoría del Muestreo.

1.1.3 Teorema de Limite central.

1.2 Distribución Muestral.

1.2.1 Distribución Muestral de la Media.

1.2.2 Distribución Muestral de la Diferencia de Medias.

1.2.3 Distribución Muestral de la Proporción.

1.2.4 Distribución Muestral de la Diferencia de Proporciones

1.2.5 Distribución Muestral de la Varianza.


 ESTIMACIÓN DE PARÁMETROS

2.1 Introducción. 

2.1.1 Características de un Buen Estimador.

2.1.2 Estimación Puntual.

2.2 Intervalos de confianza para la Media y la Proporción poblacional.

2.2.1 Intervalo de Confianza para la Media. 

2.2.2 Intervalo de Confianza para la Diferencia de Medias.

2.2.3 Intervalos de Confianza para la Proporción.

2.2.4 Intervalos de Confianza para la Varianza


 DETERMINACIÓN DEL TAMAÑO DE LA
MUESTRA.

3.1 Tamaño de la muestra para la media y para la proporción poblacional.

3.1.1 Basado en la media de la Población.


 
3.1.2 Basado en la Proporción de la Población.

3.1.3 Basado en la Diferencia entre las Medias de la Población .


 PRUEBA DE HIPÓTESIS
4.1 Introducción.

4.1.1 Errores Tipo I y Tipo II.


 
4.1.2 Potencia de la Prueba.
 
4.2 Formulación y Pruebas de Hipótesis.

4.2.1 Formulación de Hipótesis Estadísticas.


 
4.2.2 Prueba de Hipótesis para la Media.
 
4.2.3 Prueba de Hipótesis para la Diferencia de Medias.
 
4.2.4 Prueba de Hipótesis para la Proporción.
 
4.2.5 Prueba de Hipótesis para la Diferencia de Proporciones.
 
4.2.6 Prueba de Hipótesis para la Varianza.
DISTRIBUCION NORMAL

 La distribución normal (también conocida como


distribución de Gauss) es la distribución más utilizada en
la estadística. Constituye un buen modelo para muchas,
aunque no para todas las poblaciones continuas.
 Un número ilimitado de variables aleatorias continuas
tiene una distribución normal o aproximadamente
normal.
 Curva Normal .
 Para un gran número de variables aleatorias observadas en la naturaleza poseen una
distribución de frecuencia que tiene más o menos la forma de montículo o curva .
La función que genera la curva normal es la siguiente:.

Probabilidad = AREA BAJO LA CURVA .


LA DISTRIBUCIÓN NORMAL ESTÁNDAR

 La distribución normal estándar es la distribución normal de la variable estándar z


(llamada “valor estándar” o “valor z”).
Propiedades de la distribución normal estándar
 1. El área total bajo la curva normal es igual a 1.
 2. La distribución es amontonada y simétrica; se extiende indefinidamente
 en ambas direcciones y tiende a, pero nunca toca, el eje horizontal.
 3. La distribución tiene una media de 0 y una desviación estándar de 1.
 4. La media divide el área a la mitad, 0.50 a cada lado.
 5. Casi toda el área está entre z = –3.00 y z = 3.00.
CURVA NORMAL ESTANDARIZADA.
Ejercicios(uso de la tabla z)

 Encuentra el área bajo la curva normal estándar a la izquierda de


z = –1.52
 Encuentra el área bajo la curva normal a la izquierda de z
= 1.52: P(z < 1.52).
 Encuentra el área bajo la curva normal a la derecha de z =
–1.52: P(z > –1.5
 Encuentra el área bajo la curva normal entre z = –1.36
y z = 2.14: P(–1.36 < z < 2.14)
Aplicaciones de las distribuciones
normales
 Valor estándar z
Ejercicio 1
Considera los puntajes de cociente de inteligencia (CI) para personas. Los
puntajes CI tienen distribución normal, con una media de 100 y una
desviación estándar de 16. Si una persona se elige al azar, ¿cuál es la
probabilidad de que su CI esté entre 100 y 115? Esto es: ¿cuál es P(100 <
x < 115)?
Ejercicio 2
Encuentra la probabilidad de que una persona seleccionada al azar
tenga un CI mayor que 90 ( = 100. = 16).
Ejercicio 3
 Estudios realizados demuestran que el uso de gasolina para autos
compactos vendidos en Estados Unidos está normalmente
distribuido, con una media de 25.5 millas por galón (mpg) y una
desviación estándar de 4.5 mpg. ¿Qué porcentaje de compactos
recorre 30 mpg o más?
 Trabajar con kilómetros por litro.
 1 km = 0.6213 millas
 1 galón = 3.7854 litros
Ejercicio 4
 Las láminas de aluminio utilizadas para fabricar latas de
bebida tienen un espesor (en milésimas de pulgada) que se
distribuye normalmente con una media de 10 y desviación
estándar de 1.3. Una lámina particular tiene un espesor de
10.8 milésimas de pulgadas. Determine el puntaje z.
 Trabajar en SI (milímetros)
Ejercicio 5
 Considerando la misma media y deviación típica del
ejercicio anterior.
 El espesor de cierta lámina tiene un puntaje z de -1.7.
Determine el espesor de la lámina en las unidades
originales en milésimas de pulgada.
Ejercicio 6

 Los tiempos de vida de las baterías en cierta aplicación se


distribuyen normalmente con media de 50 horas y
desviación estándar de cinco horas. Determine la
probabilidad de que se elija aleatoriamente una batería que
dure entre 42 y 52 horas.
Ejercicio 7
 Un proceso fabrica cojinetes de bolas cuyos diámetros se distribuye normalmente
con media de 2.505 cm y desviación estándar de 0.008 cm. Las especificaciones
requieren que el diámetro esté dentro del intervalo 2.5 ± 0.01 cm. ¿Qué
proporción de cojinetes de bolas cumple con la especificación?
Ejercicio 8
 En una gran clase, supón que tu profesor te dice que necesitas obtener una
calificación en el 10% superior de tu clase para conseguir una A en un examen
particular. A partir de experiencias pasadas, puedes estimar que la media y la
desviación estándar en este examen serán 72 y 13, respectivamente. ¿Cuál será la
calificación mínima necesaria para obtener una A? (Supón que las calificaciones
tendrán una distribución aproximadamente normal.)
Ejercicio 9
Las puntuaciones de una prueba estandarizada se distribuyen normalmente
con media de 480 y desviación estándar de 90.
a) ¿Cuál es la proporción de puntuaciones mayores a 700?
b) ¿Qué proporción de las puntuaciones se encuentra entre
420 y 520?
Ejercicio 10
El departamento de carnes en un supermercado local específicamente prepara sus paquetes de
“1 libra” de carne molida, para que haya una variedad de pesos, algunos ligeramente más y
otros ligeramente menos de 1 libra. Suponga que los pesos de estos paquetes de “1 libra” están
normalmente distribuidos con una media de 1.00 libra y una desviación estándar de .15 libras.
a. ¿Qué proporción de los paquetes pesará más de una libra?
b. ¿Qué proporción de los paquetes pesará entre .95 y1.05 libras?
c. ¿Cuál es la probabilidad de que un paquete de carne molida seleccionado al azar pese menos
de .80 libras?
Ejercicio 11
Cierto tipo de pieza para automóvil tiene un promedio de
duración de tres años, con una desviación estándar de 0,5
años. Suponga que las duraciones de las piezas están
normalmente distribuidas y encuentre la probabilidad de que
una pieza determinada tenga un tiempo de duración de más
de 3,5 años.
Ejercicio 12
 En un proceso industrial el diámetro de una arandela es muy importante. El
comprador establece en sus especificaciones que el diámetro debe ser de 3,0 ±
0,01 mm. La condición es que no acepta ninguna arandela que se salga de estas
especificaciones. Se sabe que en el proceso el diámetro de las arandelas tienen
distribución normal con media de 3,0 mm y una desviación estándar de 0,005
mm. ¿Qué porcentaje de arandelas será rechazado?.
Teoría del muestreo
Los métodos estadísticos están basados en la idea de analizar una muestra tomada de una
población. Para trabajar con esta idea, la muestra se debe elegir de manera adecuada.
 El estudio de las muestras permite hacer estimaciones de características
desconocidas de la población (tales como media, desviación típica, proporciones,
etc). Estas estimaciones se hacen a partir del conocimiento de las características
de las muestras (media, desviación típica, proporción, etc).
 Las características o medidas obtenidas de una muestra se llaman estadísticos; y
las medidas correspondientes a la población parámetros. Cuando una medida
muestral o estadístico es utilizada como representante de una característica
poblacional o parámetro se denomina estimador.
Ventajas de la utilización de las muestras

 1) El costo es menor y se puede obtener un mejor rendimiento del


dinero invertido.
 2) Se obtiene una disminución notable del tiempo necesario para
alcanzar la información.

Cuando una muestra posee 30 o más datos se denomina grandes


muestras y si la muestra tiene menos de 30 observaciones se denomina
pequeñas muestras.
Al procedimiento utilizado para elegir una muestra se denomina
Muestreo.
Muestreo con o sin reemplazamiento

 Con reemplazamiento cuando un elemento de la población puede ser escogido


varias veces para formar parte de la muestra.

 Sin reemplazamiento cuando un elemento de la población solo puede ser


seleccionado una sola vez para formar parte de la muestra.
 Por ejemplo, digamos que se quiere conocer la estatura de los estudiantes
de la Universidad Tamaulipeca, al considerar una muestra de 100
estudiantes. ¿Cómo se deben elegir los 100 estudiantes que se medirían?
Algunos métodos son malos. Por ejemplo, elegir a los estudiantes de las
listas del fútbol americano y de los equipos de basquetbol daría como
resultado una muestra que indudablemente no representaría la distribución
de estatura de la población de estudiantes.
 Se podría pensar que sería razonable usar alguna muestra
convenientemente obtenida; por ejemplo, todos los estudiantes que
viven en cierta área o todos aquellos que se inscribieron en el curso
de estadística para la ingeniería. Después de todo, no hay razón para
pensar que la estatura de estos estudiantes debiera ser diferente de la
estatura, en general, de los estudiantes. Sin embargo, muestras así
no son ideales, porque pueden volverse engañosas en formas no
previstas. Los mejores métodos del muestreo implican el muestreo
aleatorio.
Teorema de limite central

 El teorema del límite central es un teorema fundamental de probabilidad y


estadística. El teorema describe la distribución de la media de una muestra
aleatoria proveniente de una población con varianza finita. Cuando el tamaño de
la muestra es lo suficientemente grande, la distribución de las medias sigue
aproximadamente una distribución normal.
 El teorema de límite central le permite aplicar estos procedimientos útiles a
poblaciones que son considerablemente no normales.
Teorema de limite central

   importante resultado en Probabilidades y Estadística es el llamado Teorema del Límite


Un
Central que dice que si de una población infinita con media μ y varianza se extraen
muestras aleatorias de tamaño n, entonces la media muestral se comporta
aproximadamente como una variable aleatoria normal con media igual a la media
poblacional y con varianza igual a la varianza poblacional dividida por el tamaño de la
muestra, siempre que n sea grande. Lo importante de este resultado es que es
independiente de la forma de la distribución de la población. Es decir:
 Cuando n es grande. Estandarizando, esto es equivalente a:

Si la población es bastante simétrica entonces, un tamaño de muestra n


de aproximadamente 30 es suficiente para una buena aproximación a la
normal. Si la población es bastante asimétrica, entonces el tamaño de
muestra debe ser mucho más grande.
En MINITAB se puede tratar de corroborar el Teorema del Límite Central a
través de un proceso de simulación.

Ejemplo 1 Considerar una población que consiste de 3, 4,


6, 8, 10, 11, 12, 15, 20.
 Primero calculamos la media y desviación estándar de dicha población.
 Segundo, extraemos 30 muestras de tamaño 4 de dicha población, ejecutando
4 veces la siguiente secuencia Calc-Random Data-Sample from columns.
Guardar cada una de las 4 observaciones de las muestras en 4 columnas
distintas: Obs1, Obs2, Obs3, y Obs4.
  Tercero,calculamos las medias de todas esas muestras usando la
opción Row Statistics del menú Calc y tratamos de ver gráficamente
al menos si hay acercamiento a Normalidad. Asimismo se debe
observar que la media de todas estas medias debería estar cerca de μ
y su varianza cerca de σ /.
 Cuarto comparar el histograma de la población con el histograma de
las medias muestrales.
  Interpretación:
Notar que la media de las medias muestrales es μ x =
10.108 que está bien cerca de la media poblacional μ = 9.89 .
Además la desviación estándar de la media muestral es 2.806
mientras que es igual a 5.42/2=2.71 ambos valores también están
relativamente cerca. El histograma si está un poco alejado de la
normalidad. Si se incrementa el tamaño de las muestras se puede
notar una mejor aproximación a la Normal.
DISTRIBUCIONES MUESTRALES

 Distribución muestral de medias.


 Distribución muestral para diferencias de medias.
 Distribución muestral de proporciones y diferencias.
 Distribución muestral de varianzas.
¿Cómo calculo probabilidades para la media
muestral ?
 Encuentre µ y calcule
 Escriba el evento de interés en términos de x(barra) y localice el área apropiada en la
curva normal.
 Convierta los valores necesarios de x(barra) en valores z usando.

 Use la tabla
Ejercicio 1. Los infantes de jardín de niños tienen estaturas que poseen
una distribución aproximadamente normal en torno a una media de 39
pulgadas y una desviación estándar de 2 pulgadas. Se toma una
muestra aleatoria de tamaño 25 y se calcula la media x. ¿Cuál es la
probabilidad de que este valor medio esté entre 38.5 y 40.0 pulgadas?
Distribución muestral de medias.

Ejercicio 1. En una universidad grande, la media de la edad de los


estudiantes es 22.3 años y la desviación estándar es de cuatro años. Se
toma una muestra aleatoria de 64 estudiantes. ¿Cuál es la probabilidad
de que la edad promedio de estos estudiantes sea mayor a 23 años?
Ejercicio 2. Los pesos de las personas que suben a un ascensor se
distribuyen normalmente con media igual a 125 libras y desviación
estándar de 30 libras. Un grupo de 9 personas sube al ascensor:
a) ¿Cuál es la probabilidad de que el peso promedio del grupo sea
menor de 100 libras?
Ejercicio 3. La duración de la enfermedad de Alzheimer desde el
principio de síntomas hasta el fallecimiento varía de 3 a 20 años; el
promedio es 8 años con una desviación estándar de 4 años. El
administrador de un gran centro médico al azar selecciona los registros
médicos de 30 pacientes de Alzheimer ya fallecidos, de la base de
datos del centro médico y anota la duración promedio. Encuentre las
probabilidades aproximadas para estos eventos:
1. La duración promedio es menor a 7 años.
2. La duración promedio excede de 7 años.
 Ejercicio 5. Una empresa eléctrica fabrica baterías que tienen una
duración que se distribuye aproximadamente en forma normal, con
media de 800 horas y desviación estándar de 40 horas. Encuentre la
probabilidad de que una muestra aleatoria de 16 baterías tenga una
vida promedio de menos de 775 horas.
Distribución Muestral de Diferencia de Medias

  
Suponga que se tienen dos poblaciones distintas, la primera con media 1 y
desviación estándar σ1, y la segunda con media µ2 y desviación estándar σ2. Más
aún, se elige una muestra aleatoria de tamaño n1 de la primera población y una
muestra independiente aleatoria de tamaño n2 de la segunda población; se calcula
la media muestral para cada muestra y la diferencia entre dichas medias. La
colección de todas esas diferencias se llama distribución muestral de las
diferencias entre medias.
 La fórmula que se utilizará para el calculo de probabilidad del estadístico de diferencia de
medias es:
Ejemplo 1
 En un estudio para comparar los pesos promedio de niños y niñas de sexto grado en una escuela
primaria se usará una muestra aleatoria de 20 niños y otra de 25 niñas. Se sabe que tanto para niños
como para niñas los pesos siguen una distribución normal. El promedio de los pesos de todos los
niños de sexto grado de esa escuela es de 100 libras y su desviación estándar es de 14.142, mientras
que el promedio de los pesos de todas las niñas del sexto grado de esa escuela es de 85 libras y su
desviación estándar es de 12.247 libras. Si x barra 1 representa el promedio de los pesos de 20 niños
y x barra 2 el promedio de los pesos de una muestra de 25 niñas, encuentre la probabilidad de que el
promedio de los pesos de los 20 niños sea al menos 20 libras más grande que el de las 25 niñas.
Ejemplo 2
Uno de los principales fabricantes de televisores compra los tubos de rayos catódicos a
dos compañías. Los tubos de la compañía A tienen una vida media de 7.2 años con una
desviación estándar de 0.8 años, mientras que los de la B tienen una vida media de 6.7
años con una desviación estándar de 0.7. Determine la probabilidad de que una muestra
aleatoria de 34 tubos de la compañía A tenga una vida promedio de al menos un año
más que la de una muestra aleatoria de 40 tubos de la compañía B.
Ejemplo 3
Se prueba el rendimiento en km/L de 2 tipos de gasolina, encontrándose una desviación
estándar de 1.23km/L para la primera gasolina y una desviación estándar de 1.37km/L para la
segunda gasolina; se prueba la primera gasolina en 35 autos y la segunda en 42 autos.
 a) ¿Cuál es la probabilidad de que la primera gasolina de un rendimiento promedio mayor
de 0.45km/L que la segunda gasolina?
 b) ¿Cuál es la probabilidad de que la diferencia en rendimientos promedio se encuentre
entre 0.65 y 0.83km/L a favor de la gasolina 1?.
Ejemplo 4
 Se hizo un estudio en dos distritos de la capital acerca del consumo promedio diario de
carne. Supongamos que los valores de consumo de carne en los dos distritos están
distribuidos normalmente con promedios de 350 y 400 gramos respectivamente y con
desviaciones estándar de 95 y 90respectivamente. ¿Cuál es la probabilidad de que la
diferencia del consumo promedio en dos muestras aleatorias de tamaño 36 cada
una tomadas en cada distrito, sea de 30 gramos o menos?
Ejemplo 5
 Una empresa analiza la motivación laborar de sus trabajadores en dos plantas . El jefe de recursos
humanos señala que la planta 1 la media aritmética en una prueba de motivación es de 45 con una
varianza de 70 , y en la planta 2 la media es de 48 con una varianza de 75. Si seleccionamos una
muestra aleatoria de 40 trabajadores de la planta 1 y otra de 50 de la planta 2, obtener:
 La probabilidad de que la muestra de la planta 1 tenga una media en motivación laborar que sea al
menos 2 puntos superior a la media de la planta 2
Distribución muestral de Proporciones

 Existen ocasiones en las cuales no estamos interesados en la media


de la muestra, sino que queremos investigar la proporción de
artículos defectuosos o la proporción de personas con teléfono, etc
en la muestra. La distribución muestral de proporciones es la
adecuada para dar respuesta a estas situaciones.
 Esta distribución se genera de igual manera que la distribución muestral de
medias, a excepción de que al extraer las muestras de la población se calcula el
estadístico proporción(p=x/n en donde “x” es el número de éxitos u
observaciones de interés y “n” el tamaño de la muestra) en lugar de la media de
cada muestra que era lo que calculamos antes.
Ejercicio 1
 Una fabrica de puntillas produce el 5% de ellas con algún
defecto . Si se toma una muestra aleatoria de 243 puntillas
¿Cuál es la probabilidad de que mas del 3% tenga algún
defecto.
Ejercicio 2
 Se ha determinado que 85.1% de los estudiantes de una
universidad fuman cigarrillos. Se toma una muestra
aleatoria de 200 estudiantes. Calcular la probabilidad de
que no más de 80% de alumnos de la muestra fume.
Ejercicio 3

 Suponer que de la gente que solicita ingresar a una


compañía, 40% pueden aprobar un examen de aritmética
para obtener el trabajo. Si se tomara una muestra de 20
solicitantes, ¿Cuál sería la probabilidad de que 50% o más
de ellos aprobaran?
Ejercicio 4
Una fabrica de pasteles , en su producción habitual , el 3% de pasteles
son defectuosos.
Un cliente recibe un pedido de 500 pasteles de la fabrica.
¿Cuál es la probabilidad de que encuentre mas de 4% de pasteles
defectuosos.?
Estadística Inferencial.
La inferencia, específicamente la toma y predicción de decisiones,
tiene siglos de antigüedad y desempeña un papel muy importante en la
vida de casi todas las personas. Veamos a continuación algunas
aplicaciones:
 Un metalurgista desea determinar si un nuevo tipo de acero es más resistente a
altas temperaturas que el actual.
 Una consumidora desea estimar el precio de venta de su casa antes de ponerla en
el mercado.
La inferencia estadística se ocupa de tomar decisiones o predicciones acerca de
parámetros, es decir, las medidas numéricas descriptivas que caracterizan a una
población.
Los parámetros son la media poblacional µ, la desviación poblacional estándar σ y la
proporción p.
En inferencia estadística, un problema práctico se expone de otra forma en el marco
de una población con un parámetro específico de interés.
Por ejemplo, el metalurgista podría medir el promedio de coeficientes de expansión
de ambos tipos de acero y luego comparar sus valores.
Tipos de estimadores

Un estimador. es una regla, a menudo expresada como una


fórmula, que indica cómo calcular el valor de una estimación
con base en las mediciones contenidas en una muestra
Por ejemplo, la media muestral:
Los estimadores se usan en dos formas diferentes:

Estimación puntual: Con base en datos muestrales, se calcula un solo


número para estimar el parámetro poblacional. La regla o fórmula que
describe este cálculo se denomina estimador puntual y el número
resultante recibe el nombre de estimación puntual.

Estimación de intervalo: Con base en datos muestrales, dos números


se calculan para formar un intervalo dentro del cual se espera esté el
parámetro. La regla o fórmula que describe este cálculo se denomina
estimador de intervalo y el par de números resultantes se llama
estimación de intervalo o intervalo de confianza.
Estimación puntual
En una situación práctica, puede haber varias estadísticas que podrían usarse como
estimadores puntuales para un parámetro poblacional. Para determinar cuál de las opciones es
mejor, se necesita saber cómo se comporta el estimador en muestreo repetido, descrito por su
distribución muestral.
Por medio de analogía, considere en disparar un revólver a un blanco. El parámetro de interés
es la diana a la cual se disparan balas. Cada bala representa una sola estimación muestral,
disparada por el revólver, que representa el estimador.
Las distribuciones muestrales dan información que se puede usar para seleccionar el mejor
estimador. ¿Qué características serían valiosas? Primero, la distribución muestral del
estimador puntual debe estar centrada sobre el verdadero valor del parámetro a ser
estimado. Esto es, el estimador no debe subestimar o sobreestimar de manera consistente al
parámetro de interés. Un estimador como éste se dice que es insesgado.
Se dice que un estimador de un parámetro es insesgado si la media de su distribución es igual
al verdadero valor del parámetro. De otro modo, se dice que el estimado está sesgado.
La segunda característica deseable de un estimador es que la dispersión (medida por la
varianza) de la distribución muestral debe ser tan pequeña como sea posible. Esto asegura
que, con una alta probabilidad, una estimación individual caerá cerca del valor verdadero del
parámetro. Las distribuciones muestrales para dos estimadores insesgados, una con una
varianza pequeña y la otra con una varianza más grande, como se ve en la figura
Error de estimación
La distancia entre una estimación y el valor real aproximado del
parámetro recibe el nombre de error de estimación.
Para cualquier estimador puntual con una distribución normal, la regla
empírica dice que aproximadamente 95% de todas las estimaciones
puntuales estarán a no más de dos (o más exactamente, 1.96)
desviaciones estándar de la media de esa distribución.
Esto implica que la diferencia entre el estimador puntual y el verdadero
valor del parámetro será menor a 1.96 desviaciones estándar o 1.96
errores estándar (SE).
Esta cantidad, llamada el 95% de margen de error (o simplemente
“margen de error”).
El 95% de margen de error cuando n >30 se estima como:
Ejercicio 1
1.¿Cuáles son dos características del mejor estimador puntual para un parámetro poblacional?

2.Calcule el margen de error al estimar una media poblacional m para estos valores:
a. N = 50, s2 =4
b. n =500, s2 = 4
c. n =5000, s2 = 4
Ejercicio 2
Una muestra aleatoria de n =50 osos polares produjo un peso
promedio de 980 libras con una desviación estándar de 105
libras. Use esta información para estimar el peso promedio
de todos los osos polares del Ártico.
Ejercicio 3
Una geóloga que trata de estudiar el movimiento de los cambios relativos en la
corteza terrestre, en un lugar en particular, encontró numerosas fracturas en la
estructura local de rocas. En un intento por determinar el ángulo medio de las
roturas, ella muestreó n=50 fracturas y encontró que la media muestral y desviación
estándar eran de 39.8° y 17.2°, respectivamente. Estime la dirección angular media
de las fracturas y encuentre el margen de error para su estimación.
Ejercicio 4
 Las estimaciones de la biomasa de la Tierra, es decir, la cantidad total de vegetación que
hay en los bosques del planeta, son importantes para determinar la cantidad de dióxido
de carbono no absorbido que se espera permanezca en la atmósfera terrestre. Suponga
que una muestra de 75 terrenos de un metro cuadrado, escogidos al azar en bosques
boreales de América del Norte, produjo una biomasa media de 4.2 kilogramos por metro
cuadrado (kg/m2), con una desviación estándar de 1.5 kg/m2. Estime el promedio de
biomasa para los bosques boreales de América del Norte y encuentre el margen de error
para su estimación.
Estimación de intervalo
Un estimador de intervalo es una regla para calcular dos
números, por ejemplo a y b, para crear un intervalo del que
usted está completamente seguro que contiene el parámetro
de interés. El concepto de “completamente seguro” significa
“con gran probabilidad”.
Medimos esta probabilidad usando el coeficiente de
confianza, designado por 1-.
La probabilidad de que un intervalo de confianza contenga el
parámetro estimado se denomina coeficiente de confianza.
Por ejemplo, es frecuente que los experimentadores construyan
intervalos de confianza de 95%, lo cual significa que el coeficiente de
confianza, o la probabilidad de que el intervalo contenga el parámetro
estimado, sea .95. Se puede aumentar o reducir la cantidad de certeza
si se cambia el coeficiente de confianza. Algunos valores que por lo
general usan experimentadores son .90, .95, .98 y .99.
Construcción de un intervalo de confianza
Confianza o precisión

 En la práctica, cuando se calcula un intervalo de confianza, se debe decidir qué nivel de


confianza se utilizará. Esta decisión implica un intercambio, porque los intervalos con
niveles de confianza más grandes son menos precisos. Por ejemplo, un intervalo de
confianza de 68% especifica la media poblacional dentro de , mientras que un
intervalo de confianza de 95% especifica a éste solamente dentro de ; por tanto, tiene
sólo casi la mitad de la precisión del intervalo de confianza de 68%
 A)Confianza
68%
 B)Confianza
95%
 C)Confianza
99.7%
Ejercicio 1
 Encuentre un intervalo de confianza de 90% para una media poblacional m para estos
valores:
Ejercicio 2
 Un científico interesado en vigilar contaminantes químicos en alimentos y, por lo tanto, la
acumulación de contaminantes en la dieta humana, seleccionó una muestra aleatoria de n
=50 adultos hombres. Se encontró que el promedio de ingesta diaria de productos lácteos
fue de x barra= 756 gramos por día, con una desviación estándar de s= 35 gramos por
día. Use esta información muestral para construir un intervalo de confianza de 68% para la
ingesta diaria media de productos lácteos para hombres.
Ejercicio 3
La altura en centímetros de los individuos de una población se puede
aproximar por una distribución normal.
En una muestra aleatoria simple de 500 individuos se ha obtenido una
altura media de 174 cm y una desviación típica igual a 20cm. Obtenga
un intervalo de confianza al 89%.
Ejercicio 4
Se ha obtenido una muestra de 25 alumnos de una facultad para estimar la
calificación media de los expedientes de los alumnos en la facultad. Se sabe por otros
cursos que la desviación típica de las puntuaciones en dicha facultad es de 2.01.
La media muestral fue 4.9.
1. Intervalo de confianza al 65%
2. Intervalo de confianza al 75%
Ejercicio 5

En una muestra aleatoria de 53 especímenes de concreto, la media de la porosidad


(en %) fue de 21.6 y la desviación estándar de 3.2.
a) Determine un intervalo de confianza de 70% para la media de la porosidad de los
especímenes de este tipo de concreto.
b) Determine un intervalo de confianza de 80% para la media de la porosidad de los
especímenes de este tipo de concreto.
Ejercicio 6
Los vuelos de una empresa de aviación tienen una duración bimestral
aproximadamente distribuida de forma normal con una desviación
estándar de 40 horas. Si una muestra de 30 vuelos tiene una duración
promedio de 780 horas, encuentre los intervalos de confianza de 96%
para la media de la población de todos los vuelos de esta empresa.
Ejercicio 7
Se encuentra que la concentración promedio de zinc de una muestra de
36 cereales es de 2.6 gramos por miligramo. Encuentre los intervalos
de confianza de 95% y 99% para la concentración media de zinc en el
cereal. Suponga que la desviación estándar de la población es 0.3.
Intervalo de confianza para la diferencia de
medias.
Ejercicio 1

Construya un intervalo de confianza del 94% para la diferencia real


entre las duraciones de dos marcas de focos, si una muestra de 40
focos tomada al azar de la primera marca dio una duración media de
418 horas, y una muestra de 50 focos de otra marca dieron una
duración media de 402 horas. Las desviaciones estándares de las dos
poblaciones son 26 horas y 22 horas, respectivamente.
Ejercicio 2
 Las resistencias al desgaste de dos tipos de llantas para automóvil se compararon en
muestras de pruebas en camino de n1 n2 =100 llantas para cada tipo. El número de millas
hasta el completo desgaste se definió como una cantidad específica de desgaste de la
llanta. Los resultados de la prueba se muestran en la tabla 8.4. Estime (µ1-µ2), la
diferencia en la media de millas hasta el completo desgaste, usando un intervalo de
confianza de 93%.
Ejercicio 3

Se midió cinco veces el contenido de carbono (en partes por millón) para cada una de las dos
placas de silicio diferentes.
 Las mediciones fueron:
 Placa A: 1.10 1.15 1.16 1.10 1.14
 Placa B: 1.20 1.18 1.16 1.18 1.15
 Determine un intervalo de confianza de 99% para la diferencia en contenido de carbono
entre las dos placas
Estimación por intervalo de una proporción
Ejercicio 1
 En una muestra aleatoria, 145 personas de 450, a quienes se aplicó una vacuna contra la
influenza, experimentaron cierto síntoma de incomodidad. Construir un intervalo de
confianza del 80% para la proporción poblacional de personas que experimentaron algún
síntoma de incomodidad por la vacuna.
Ejercicio 2
Un fabricante de refresco compra latas de aluminio de un distribuidor externo. Se selecciona
una muestra aleatoria de 70 latas de un envío grande, se prueba la resistencia de cada una
aplicando una carga creciente en los lados de la lata hasta que se perfora. De las 70 latas, 52
satisfacen la especificación para la resistencia de perforación.
Determine un intervalo de confianza de 95% para la proporción de latas que satisface la
especificación en el envío.
Ejercicio 3
En cierto día, se fabricó gran número de fusibles, cada uno tasado a 15 A. Al extraer una
muestra de 75 de la producción del día, se encontró que 17 de ellos tenían amperajes de
quemado mayores de 15 A.
Determine un intervalo de confianza de 88% para la proporción de fusibles fabricada ese día,
cuyo amperaje de quemado es mayor que 15 A.
Ejercicio 4

Los aceros inoxidables pueden ser susceptibles al agrietamiento de corrosión por tensión bajo
ciertas condiciones. Un ingeniero especializado en materiales está interesado en determinar la
proporción de fallas de aleaciones de acero que son atribuibles al agrietamiento de corrosión
por tensión. En una muestra de 100 fallas, 20 eran ocasionadas por el agrietamiento de
corrosión por tensión. Encuentre un intervalo de confianza de 75% para la proporción de fallas
ocasionadas por el agrietamiento de corrosión por tensión.
Ejercicio 5
Una muestra aleatoria de 985 “probables” electores, o sea los que probablemente voten en la
próxima elección, fueron encuestados durante un maratón telefónico realizado por el Partido
Republicano. De ellos, 592 indicaron que tenían la intención de votar por la candidata
republicana. Construya un intervalo de confianza de 70% para p, la proporción de electores
probables de la población que tienen la intención de votar por la candidata republicana.
Intervalo de confianza para la diferencia entre
dos proporciones.
Ejercicio 6
En una prueba del efecto de la humedad en conexiones eléctricas, se probaron 100 conexiones
eléctricas bajo condiciones húmedas y 150 en condiciones secas. Veinte de las primeras
fallaron y sólo diez de las segundas no pasaron la prueba. Determine un intervalo de confianza
de 90% para la diferencia entre las proporciones de las conexiones que fallaron, húmedas y
secas.
Ejercicio 7

 En una muestra aleatoria de 80 automóviles conducidos en altitudes bajas, 15 produjeron


más de 10 g de contaminación de masa particulada por galón de combustible consumido.
En una muestra aleatoria de 90 automóviles conducidos en altitudes altas, 10 contaminaron
en las mismas circunstancias. Determine un intervalo de confianza de 60% para la
diferencia entre las proporciones para vehículos a alta y baja altitudes.
Ejercicio 8
 De 1 200 piezas de grava de una planta, 250 piezas se clasificaron como “grandes”. De
1000 piezas de otra planta, 100 también lo fueron. Determine un intervalo de confianza de
75% para la diferencia entre las proporciones de piezas de grava grandes producidas en las
dos plantas.
Ejercicio 9

Se comparan dos procesos para fabricar cierto microchip. Se seleccionó una muestra de 400
chips de un proceso menos costoso, donde 62 estaban defectuosos. Se seleccionó una muestra
de 100 chips de un proceso más costoso, pero 12 tenían defecto.
Determine un intervalo de confianza de 65% para la diferencia entre las proporciones de los
chips defectuosos producidos por los dos procesos.
Determinación del tamaño de una muestra

Suponga que queremos reunir datos muestrales con el objetivo de estimar alguna proporción
de la población. ¿Cómo sabemos cuántos elementos muestrales deben obtenerse?
Para una población infinita.
Para una población finita
Ejercicio 10
 A usted lo contrató la Ford Motor Company para hacer investigación de mercado, por lo
que debe estimar el porcentaje de hogares que poseen un vehículo.
1.- ¿Cuántos hogares debe entrevistar si desea tener una confianza del 94% de que su
porcentaje muestral tiene un margen de error de tres puntos porcentuales?
2.- Calcule el tamaño muestral para una población de 1200 hogares
Suponga que en años anteriores la proporción de hogares que tenían un vehículo fue del 40
%.
Ejercicio 11
Interesados por la seguridad en el campus, los oficiales universitarios quieren estimar el porcentaje
de estudiantes que porta una pistola, un cuchillo u otra arma. ¿Cuántos estudiantes que se
seleccionen al azar deben encuestarse para tener una confianza del 95% de que el porcentaje de la
muestra tiene un margen de error de tres puntos porcentuales?
a. Suponga que otro estudio indicó que el 7% de los estudiantes universitarios llevan armas (según
un estudio de Cornell University).
b. Suponga que no existe información disponible que pueda utilizarse para estimar el porcentaje de
estudiantes universitarios que portan armas.
c. ¿Cual seria el tamaño maestral si contamos con una población de 900 alumnos.?
Ejercicio 12
Suponga que un sociólogo quiere determinar el porcentaje actual de hogares de Estados
Unidos que utiliza el correo electrónico. ¿Cuántos hogares deben encuestarse para tener una
confianza del 95% de que el porcentaje muestral es erróneo por no más de cuatro puntos
porcentuales?
a. Utilice el siguiente resultado de un estudio pionero: en 1997, el 16.9% de
los hogares estadounidenses usaban correo electrónico (según datos de The
World Almanac and Book of Facts).
b. Suponga que no tenemos información previa que sugiera un posible valor
de p.
c. Calcule el tamaño muestral para una población de 1300 hogares.
Ejercicio 13
Se desea estimar la proporción de las 1000 familias que viven en el municipio de san Lorenzo
y que tienen un ingreso alto, para eso se definen los siguientes criterios
Nivel de confianza = 95%
Proporción de familias de ingreso alto =0.10
Error máximo tolerable = 8%
Tamaño de muestra para estimar la media.
Ejercicio 14
Suponga que queremos estimar la media de la puntuación de CI para la población de
profesores de estadística. ¿Cuántos profesores de estadística deben seleccionarse al
azar para efectuar pruebas de CI, si queremos tener una confianza del 95% de que la
media muestral estará dentro de 2 puntos de CI de la media poblacional? por lo
regular las pruebas de CI se diseñaron para que la media sea 100 y la desviación
estándar sea 15.
Ejercicio 15
Un economista quiere estimar la media de los ingresos por el primer año de trabajo de los
graduados universitarios que demostraron gran sabiduría al tomar un curso de estadística.
¿Cuántos ingresos de este tipo deben encontrarse si queremos tener un nivel de confianza del
95% de que la media muestral está dentro de $500 de la media poblacional real? Suponga que un
estudio previo reveló que para ingresos de este tipo, =$6250.
Ejercicio 16
Nielsen Media Research quiere estimar la media de la cantidad de tiempo (en
minutos) que los estudiantes universitarios que estudian tiempo completo emplean
viendo la televisión cada día de la semana. Calcule el tamaño de muestra necesario
para estimar esta media con un margen de error de 15 minutos. Suponga que se
desea un nivel de confianza del 96%. Suponga también que un estudio piloto
mostró que la desviación estándar se estima en 112.2 minutos.
Ejercicio 17
¿Cuántas mujeres será necesario estudiar para estimar la media de
glucemia de las embarazadas que han acudido al servicio de paritorio
de un determinado hospital? Estableciendo un nivel de confianza del
95%, con un error 5 mg ; A partir de la prueba piloto se obtuvo una
desviación de 20 mg.
Prueba de Hipótesis.

En estadística, una hipótesis es una aseveración o afirmación


acerca de una propiedad de una población.
Una prueba de hipótesis (o prueba de significancia) es un
procedimiento estándar para probar una aseveración acerca
de una propiedad de una población.
Las siguientes afirmaciones son típicas de las hipótesis (aseveraciones) que se
prueban usando procedimientos estudiados en este capítulo.
● Un reportero asevera que la mayoría de los conductores estadounidenses se
pasan la luz roja.
● Investigadores médicos aseveran que la temperatura corporal media de adultos
sanos no es igual a 98.6°F.
● Cuando se utiliza equipo nuevo para fabricar altímetros de aviones, los
altímetros nuevos resultan mejores ya que se reduce la variación en los errores,
de manera que las lecturas son más consistentes.
Ejemplo 1
Industria pro-cuidado, Ltd. alguna vez ofreció un producto llamado ‘Elige su genero’, el cual, según
aseveraciones publicitarias,permitía a las parejas “incrementar sus posibilidades de tener un niño hasta
en un 85%, y de tener una niña hasta en un 80%”. ‘Elige su genero’ estaba disponible en paquetes
azules para parejas que deseaban niño y paquetes rosas para parejas que deseaban una niña. Suponga
que realizamos un experimento con 100 parejas que desean tener niñas, y todas ellas siguen el “sistema
casero fácil de usar” ‘elige su genero’, descrito en el paquete rosa. Con el propósito de probar la
aseveración del incremento de posibilidades de tener niñas, suponemos que ‘Elige su genero’ no tiene
efecto alguno. Basados en el sentido común y sin método estadístico formal, ¿qué debemos concluir
acerca del supuesto de que ’Elige su genero’ no tiene efecto alguno, si 100 parejas lo utilizaron y
tuvieron 100 bebés conformados por:
a. 52 niñas
b. 97 niñas
SOLUCIÓN
a. Generalmente esperamos que nazcan alrededor de 50 niñas
por cada 100 nacimientos. El resultado de 52 niñas es cercano
a 50, por lo que no debemos concluir que el producto ‘Elige su
genero’ es eficaz. Si las 100 parejas no hubiesen utilizado
métodos especiales de selección del género, el resultado de 52
niñas podría ocurrir fácilmente por azar. El supuesto de que
‘Elige su genero’ no tiene efecto alguno parece ser correcto.
No existe evidencia suficiente para decir que ‘Elige su genero’
sea eficaz.
b. Es extremadamente improbable que el resultado de 97 niñas en 100
nacimientos suceda por azar. Nosotros podríamos explicar el
nacimiento de 97 niñas mediante una de dos maneras: se trata de un
evento extremadamente poco común que ha ocurrido por azar, o ‘Elige
su genero’ es eficaz. La probabilidad extremadamente baja de que
resulten 97 niñas es una fuerte evidencia en contra del supuesto de que
‘Elige su genero’ no tiene efecto alguno. Parece ser eficaz.
Componentes de una prueba de hipótesis
formal.
Hipótesis nula y alternativa
● La hipótesis nula (denotada por H0) es la afirmación de que el valor de un parámetro de
población (como una proporción, media o desviación estándar) es igual a un valor aseverado.
Las siguientes son hipótesis nulas críticas del tipo considerado en este capítulo:

La hipótesis nula se aprueba en forma directa, en el sentido de que asumimos que es


verdadera, y llegamos a una conclusión para rechazar H0 o no rechazar H0.
La hipótesis alternativa (denotada por H1 o Ha) es la afirmación de que el
parámetro tiene un valor que, de alguna manera, difiere de la hipótesis nula.
Para los métodos de este capítulo, la forma simbólica de la hipótesis alternativa debe emplear
alguno de estos símbolos: ≠ o< o >. A continuación
se incluyen nueve ejemplos diferentes de hipótesis alternativas que incluyen proporciones,
medias y desviaciones estándar:
Estadístico de prueba
El estadístico de prueba es un valor calculado a partir de datos muéstrales, que se utiliza para
tomar la decisión sobre el rechazo de la hipótesis nula.
El estadístico de prueba sirve, por lo tanto, para determinar si existe evidencia significativa en
contra de la hipótesis nula.
Nivel de significancia

El nivel de significancia (denotado por ) es la probabilidad de que el


estadístico de prueba caiga en la región crítica, cuando la hipótesis
nula es verdadera.
Si el estadístico de prueba cae en la región crítica, rechazaremos la
hipótesis nula, de modo que  es la probabilidad de cometer el error
de rechazar la hipótesis nula cuando es verdadera.
Las opciones comunes para  son 0.05, 0.01 y 0.10, aunque el más
común es 0.05.
Valor critico

Un valor crítico es cualquier valor que separa la


región crítica (donde rechazamos la hipótesis
nula) de los valores del estadístico de prueba
que no conducen al rechazo de la hipótesis nula.
Dos colas, cola izquierda, cola derecha
Las colas en una distribución son las regiones extremas limitadas por los valores
críticos. Algunas pruebas de hipótesis incluyen dos colas, otras la cola derecha y
otras la cola izquierda.
Prueba de dos colas: La región crítica se encuentra en dos regiones extremas (colas)
bajo la curva.
Prueba de cola izquierda: La región crítica se encuentra en la región extrema
izquierda (cola) bajo la curva.
Prueba de cola derecha: La región crítica se encuentra en la región extrema derecha
(cola) bajo la curva.
Valor p
El valor P (o valor de p o valor de probabilidad) es la
probabilidad de obtener un valor del estadístico de prueba
que sea al menos tan extremo como el que representa a los
datos muestrales, suponiendo que la hipótesis nula es
verdadera. La hipótesis nula se rechaza si el valor P es muy
pequeño, tanto como 0.05 o menos.
Ejemplo 1
Un proceso manufacturero usado por una fábrica durante los últimos años da una
producción media de 100 unidades por hora con una desviación estándar de 8
unidades. Se acaba de introducir en el mercado una nueva máquina para realizar ese
tipo de producto. Aunque es muy cara comparada con la que está ahora en uso, si la
media de producción de la nueva máquina es de más de 150 unidades por hora, su
adopción daría bastantes beneficios.
Para decidir si se debiera comprar la nueva máquina, a la gerencia de la fábrica se le
permite hacer un ensayo durante 35 horas, hallándose un promedio de 160 unidades
por hora. Con ésta información qué decisión se debe tomar si se asume un nivel de
confianza del 𝛼 = 0.01.
Siguiendo los pasos de la prueba de hipótesis tenemos:
1.El parámetro de interés es 𝜇, el promedio de producción de unidades.
2. La hipótesis nula es 𝐻0: 𝜇 = 150
La hipótesis alternativa es 𝐻𝑎: 𝜇 > 150
3. El nivel de significancia es 𝛼 = 0.01
4. El estadístico de prueba es:
Conclusiones

El valor del estadístico de prueba está en la zona de rechazo de la


hipótesis nula, por lo tanto, se acepta que la producción promedio
por hora es superior a las 150 unidades y asumiendo un riesgo del
1%, se puede comprar la nueva máquina.
Ejercicio 18
Se está calibrando una balanza al pesar una pesa de prueba de 1 000 g 60 veces. Las 60
lecturas de la balanza tienen una media de 1 000.6 g y desviación estándar de 2 g. Usar nivel
significancia del 0.05
1.-Formular las hipótesis.
2.-Obtener valor critico.
3. Obtener valor prueba.
4. Se acepta la hipótesis nula o se rechaza y se acepta la alternativa
Justifica tu respuesta.
Ejercicio 19
La salud de una población de osos en el Yellowstone National Park se
verifica por medio de mediciones periódicas, tomadas de osos
anestesiados. Una muestra de 54 osos tiene un peso medio de 182.9
libras. Suponiendo que sabemos que σ es igual a 121.8 libras, utilice
un nivel de significancia de 0.10 para probar la aseveración de que la
media poblacional de todos los pesos de osos es menor que 200 libras.
Ejercicio 20

Se obtiene una muestra aleatoria de 100 bebés y se descubre que la


circunferencia media de las cabezas es de 40.6 cm. Suponiendo que
sabemos que la desviación estándar poblacional es de 1.6 cm, utilice
un nivel de significancia de 0.05 para probar la aseveración de que la
circunferencia media de las cabezas de todos los bebés de dos meses
de edad es igual a 40.0 cm.
Ejercicio 21
Cuando las personas fuman, la nicotina que absorben se convierte en
cotinina, que es susceptible de medición. Una muestra de 40
fumadores tiene un nivel medio de cotinina de 172.5. Suponiendo que
sabemos que σ es igual a 119.5, utilice un nivel de significancia de
0.01 para probar la aseveración de que el nivel medio de cotinina de
todos los fumadores es igual a 200.0.
Ejercicio 22
Se esta estudiando el rendimiento de un proceso químico. De la experiencia, se sabe que la
desviación estándar del rendimiento es de 3.2. En la tabla 6.5 están los resultados del
rendimiento obtenidas los últimos 40 días en la planta de operación ¿Existe evidencia de que
el rendimiento no es del 90%?
Utilizar 𝛼 = 0.05.
Pruebas de hipótesis para la proporción
poblacional
 Estadístico de prueba:
Ejercicio 23
Un proveedor de placas semiconductoras afirma que de todas las placas que
suministra, sólo 10% son defectuosas. Se prueba una muestra de 400 placas, y 50 de
ellas, 12.5%, presentan defectos. ¿Se puede concluir que esta afirmación es falsa?
Utilice un nivel de significancia del 0.01.
Ejercicio 24
Un fabricante afirma que por lo menos el 90% de las piezas de una maquinaria
que se fabrican en una empresa cumplen con las especificaciones del producto.
Una inspección de 200 de esas piezas reveló que 160 de ellas cumplían con las
especificaciones. Pruebe si lo que afirma el fabricante es cierto. Utilizar 𝛼 = 0.05.
Ejercicio 25
 Una encuesta realizada por Bancomer a 35 clientes indicó que un poco más
del 74 por ciento tenían un ingreso familiar de más de $200,000 al año. Si
esto es cierto, el banco desarrollará un paquete especial de servicios para este
grupo. La administración quiere determinar si el porcentaje verdadero es
mayor del 60 por ciento antes de desarrollar e introducir este nuevo paquete
de servicios. Los resultados mostraron que 74.29 por ciento de los clientes
encuestados reportaron ingresos de $200,000 o más al año. Utilizar un nivel
de significancia del 0.05.
Ejercicio 26
Un político afirma que tiene el 55 % de los votos. Para demostrarlo, se
obtiene una muestra aleatoria donde 66 personas afirmaron el gusto
por el candidato y 54 no lo aceptan. Demuestra si la afirmación del
político es cierta a un nivel de significancia del 0.1.
Ejercicio 27
Se quiere demostrar que menos del 30% de los estudiantes de una institución educativa,
requiere más  de 3 horas al día para hacer sus tareas.
Se desarrolla una encuesta y se encuentra que de una muestra de 250 estudiantes, 73
estudiantes requieren más de 3 horas al día.
¿Se puede comprobar lo requerido a un nivel de significancia del 0.05?
Prueba de hipótesis sobre igualdad de dos medias,
varianzas conocidas.

En algunos problemas de investigación, se tiene el interés en comparar las


medias de dos poblaciones distintas con muestras aleatorias
independientes de tamaños 𝑛1 y 𝑛2. Por ejemplo, comparar el rendimiento
de dos maquinas de ensamble, comparar una encuesta de opinión sobre
que opinan lo hombres con respecto a que opinan las mujeres, la calidad
de un producto de un proveedor con respecto a otro proveedor, etc.
Estadístico de prueba.
Ejercicio 28
Un constructor está considerando dos lugares alternativos para construir un centro comercial. Como los
ingresos de los hogares de la comunidad son una consideración importante en ésta selección, desea probar
que el ingreso promedio de la primera comunidad excede al promedio de la segunda comunidad por lo
menos $1,500 diarios. Con la información de un censo realizado el año anterior se sabe que la desviación
estándar del ingreso diario de la primera comunidad es de $1,800 y la desviación estándar de la segunda es
de $2,400. Se toma una muestra aleatoria de 30 hogares de la primera comunidad, encuentra que el ingreso
promedio es de $35,500 y con una muestra de 40 hogares de la segunda comunidad el ingreso promedio es
de $34,600. Pruebe la hipótesis con un nivel de significancia 𝛼 = 0.05.
Ejercicio 29
Un diseñador de productos está interesado en reducir el tiempo de secado de una pintura. Se
prueban dos fórmulas de pintura; la fórmula 1 tiene el contenido químico estándar y la fórmula
2 tiene un nuevo ingrediente secante que tiende a reducir el tiempo de secado. De la
experiencia se sabe que la desviación estándar del tiempo de secado es ocho minutos y esta
variabilidad inherente no debe verse afectada por a adición del nuevo ingrediente. Se pintan 35
placas con la fórmula 1 y otras 35 con la fórmula 2. Los dos tiempos promedio de secado
muestrales son 116 minutos para la fórmula 1 y 112 minutos para la fórmula 2. ¿A qué
conclusión puede llegar el diseñador del producto sobre la eficacia del nuevo ingrediente, al
nivel de significancia 0,01?
Ejercicio 30
 Una compañía desea comparar el aumento de peso en bebés que consumen su producto contra los
que consumen el competidor. En un estudio previo se obtuvo que la marca 1° tiene una desviación
estándar de 1.2kg y la marca 2° de 1.4 kg. Una muestra de 40 bebés que usan la 1ª marca reveló un
aumento promedio de peso de 3.2 kg en los primeros tres meses después de nacidos .Una muestra de
55 bebés que usan la 2ª marca indica un aumento promedio de 4.2 kg . Con un nivel de significancia
de 0.05 ¿Es posible concluir que los bebés que consumieron el producto de la marca 2 ganaron más
peso ?
Errores tipo I y tipo II
Cuando se prueba una hipótesis nula llegamos a la conclusión de rechazarla o no rechazarla. Dichas conclusiones
pueden ser correctas o incorrectas (incluso cuando hacemos todo correctamente). La tabla 7-1 resume
 los dos distintos tipos de errores que llegan a cometerse, junto con los dos tipos de
 decisiones correctas. Distinguimos entre los dos tipos de errores denominándolos
 errores tipo I y tipo II.
 ● Error tipo I: El error de rechazar la hipótesis nula cuando en realidad es
 verdadera. Se utiliza el símbolo a (alfa) para representar la probabilidad de
 un error tipo I.
 ● Error tipo II: El error de no rechazar la hipótesis nula cuando en realidad
 es falsa. Se utiliza el símbolo b (beta) para representar la probabilidad de
 un error tipo II.

También podría gustarte