E Statistic A
E Statistic A
ii
2.3 Evento .................................................................................................................................. 32
2.3.1 Evento Complementar .................................................................................................... 33
2.3.2 Eventos Independentes .................................................................................................. 33
2.3.3 Eventos Mutuamente Exclusivos .................................................................................... 34
2.4 Definição Clássica de Probabilidade .................................................................................... 35
2.5 Definição Axiomática de Probabilidade ................................................................................ 35
2.6 Probabilidade Condicional .................................................................................................... 35
2.7 Teorema da Probabilidade Total .......................................................................................... 36
2.8 Teorema de Bayes ............................................................................................................... 37
Lista de Exercícios no. 2 - Probabilidades ............................................................................... 38
VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE DISCRETA ................... 40
3.1 Definições ............................................................................................................................ 40
3.2 Distribuições de Probabilidade Discreta ............................................................................... 42
3.2.1 Distribuição binomial ...................................................................................................... 42
3.2.2 Distribuição de Poisson .................................................................................................. 44
3.2.3 Distribuição Hipergeométrica .......................................................................................... 46
Lista de Exercícios no. 3 – Distribuições de Probabilidade Discreta ........................................ 48
VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE CONTÍNUA .................. 51
4.1 Definições ............................................................................................................................ 51
4.2 Distribuições de Probabilidade Continua .............................................................................. 53
4.2.1 Distribuição Exponencial ................................................................................................ 53
4.2.2 Distribuição de Weibull ................................................................................................... 54
4.2.3 Distribuição normal ou Gaussiana .................................................................................. 57
4.2.3.1 Distribuição normal padronizada ou reduzida .............................................................. 59
4.2.4 Distribuição 2 ( qui-quadrado) ..................................................................................... 60
4.2.5 Distribuição “ t ” de Student ............................................................................................ 61
4.2.6 Distribuição F de Snedecor ............................................................................................ 62
Lista de Exercícios no. 4 – Distribuições de Probabilidade Contínua ...................................... 63
NOÇÕES DE AMOSTRAGEM E DISTRIBUIÇÕES AMOSTRAIS.............................................. 65
5.1 Introdução ............................................................................................................................ 65
5.2 Amostragem Probabilística ................................................................................................... 65
5.2.1 Amostragem Aleatória Simples (AAS) ............................................................................ 65
5.2.2 Amostragem Sistemática ................................................................................................ 66
5.2.3 Amostragem Estratificada............................................................................................... 66
5.3 Distribuições Amostrais ........................................................................................................ 67
5.3.1 Distribuição Amostral de Médias .................................................................................... 67
Teorema Central do Limite ......................................................................................................... 70
5.3.2 Distribuição Amostral de Proporções .............................................................................. 70
5.3.3 Distribuição Amostral da Variância ................................................................................. 71
ESTIMAÇÃO DE PARÂMETROS .............................................................................................. 72
6.1 Introdução ............................................................................................................................ 72
6.2 Estimador e Estimativa ......................................................................................................... 72
iii
6.3 Qualidades de um Estimador ............................................................................................... 72
6.4 Estimação por Pontos .......................................................................................................... 73
6.4.1 Estimador da Média Populacional .................................................................................. 73
6.4.2 Estimador da Variância Populacional ............................................................................. 73
6.4.3 Estimador do Desvio Padrão Populacional ..................................................................... 74
6.4.4 Estimador da Proporção Populacional ............................................................................ 74
6.5 Estimação por Intervalo ........................................................................................................ 74
6.5.1 Intervalo de Confiança para Média populacional ............................................................ 74
6.5.2 Intervalo de Confiança para Diferença entre Duas Médias Populacionais 1 e 2 ...... 78
6.5.3 Intervalo de Confiança para a Variância Populacional .................................................... 82
6.5.4 Intervalo de Confiança para o Desvio Padrão Populacional ........................................... 83
6.5.5 Intervalo de Confiança para Proporção Populacional ..................................................... 83
6.6 Dimensionamento da Amostra ............................................................................................. 84
6.6.1 Estimação da Média Populacional .................................................................................. 84
6.6.2 Estimação da Proporção Populacional ........................................................................... 85
Lista de Exercícios no. 5 - Intervalos de Confiança ................................................................ 86
Testes de Hipóteses .................................................................................................................. 89
7.1 Etapas para Testes de Hipóteses......................................................................................... 89
7.1.1 Nível de Significância ..................................................................................................... 89
7.1.2 Erro Estatístico ............................................................................................................... 89
7.2 Testes Estatísticos Paramétricos ......................................................................................... 90
7.2.1 Teste para a Média Populacional ................................................................................... 90
7.2.1.1 Quando a variância populacional 2 é Conhecida ...................................................... 90
7.2.1.2 Quando a variância populacional 2 é desconhecida ................................................. 91
7.2.2 Teste para a Proporção Populacional ............................................................................. 93
7.2.3 Teste para a Variância Populacional .............................................................................. 95
7.2.4 Teste para a Diferença entre Duas Médias Populacionais.............................................. 96
7.2.4.1 Quando as variâncias populacionais 12 e 22 são Conhecidas .................................. 96
7.2.4.2 Quando as variâncias populacionais 12 e 22 são Desconhecidas............................. 98
7.2.5 Duas Amostras Emparelhadas ..................................................................................... 102
7.2.6 Teste para Igualdade de Duas Variâncias .................................................................... 103
Lista de Exercícios no. 6 – Testes de Hipóteses ................................................................... 106
TESTES DE ADERÊNCIA ....................................................................................................... 109
Introdução ................................................................................................................................ 109
8.1 Teste Qui-quadrado de Aderência...................................................................................... 109
8.2 Teste de Lilliefors ............................................................................................................... 113
Lista de Exercícios no. 7 – Testes de Aderência ................................................................... 115
ANÁLISE DA VARIÂNCIA ........................................................................................................ 117
Introdução ................................................................................................................................ 117
9.1 Fundamentos da ANOVA ................................................................................................... 117
9.2 Análise da Variância a um Critério de Classificação ........................................................... 119
iv
9.3 Comparações Múltiplas entre Médias................................................................................. 123
9.3.1 Teste de Scheffé .......................................................................................................... 123
Lista de Exercícios no. 8 – Análise da Variância ................................................................... 127
ANÁLISE DE CORRELAÇÃO E REGRESSÃO SIMPLES ....................................................... 129
10.1 Introdução ........................................................................................................................ 129
10.2 Diagrama de Dispersão .................................................................................................... 129
10.3 Análise de Correlação ...................................................................................................... 129
10.3.1 Coeficiente de Correlação Linear de Pearson ............................................................ 129
10.3.1.1 Teste de Hipóteses para Coeficiente de Correlação ................................................ 132
10.4 Análise de Regressão Linear Simples .............................................................................. 133
10.4.1 Estimação dos Parâmetros......................................................................................... 133
10.4.2 Testes de Hipóteses na Regressão ........................................................................... 136
10.4.2.1Teste t ..................................................................................................................... 136
10.4.2.2 Análise da Variância ................................................................................................ 137
10.4.3 Coeficiente de Determinação ou Explicação............................................................... 140
10.5 Ajuste de Curva Geométrica (ou Função Potência) .......................................................... 143
10.5.1 Estimativa dos Coeficientes........................................................................................ 143
10.5.2 Testes de Hipóteses na Regressão ............................................................................ 144
10.5.2.1 Análise da Variância ................................................................................................ 144
10.5.3 Coeficiente de Determinação ou Explicação............................................................... 145
10.6 Ajuste de Função Exponencial ......................................................................................... 147
10.6.1 Estimativa dos Coeficientes........................................................................................ 148
10.6.2 Testes de Hipóteses na Regressão ............................................................................ 149
10.6.2.1 Análise da Variância ................................................................................................ 149
10.6.3. Coeficiente de Determinação ou Explicação .............................................................. 149
Lista de Exercícios no. 9 – Análise de Correlação e Regressão ............................................ 152
ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA ......................................................................155
11 Introdução ........................................................................................................................... 154
11.1 Regressão Linear com 2 Variáveis Independentes ........................................................... 154
11.1.1 Estimativas dos Coeficientes de Regressão ............................................................... 154
11.1.2 Teste para Verificar a Significância da Regressão ..................................................... 155
11.1.3 Cálculo do Coeficiente de Determinação ou Explicação ............................................. 155
Lista de Exercícios no. 10 – Análise de Regressão Linear Múltipla ....................................... 160
CONTROLE ESTATÍSTICO DO PROCESSO .......................................................................... 161
12 Introdução ........................................................................................................................... 161
12.1 Gráficos de Controle ........................................................................................................ 161
12.2 Gráfico de Controle para Variáveis................................................................................... 162
12.2.1 Gráfico de Controle de X ........................................................................................... 162
12.2.2 Gráfico de Controle de R ............................................................................................ 163
12.3 Gráfico de Controle para Atributos ................................................................................... 167
12.3.1 Gráfico de Controle para Fração de Não Conformes (Gráfico p) ................................ 167
Lista de Exercícios no. 11 – Controle Estatístico do Processo .............................................. 170
v
BIBLIOGRAFIA ........................................................................................................................ 173
TABELAS ................................................................................................................................. 174
TABELA A1.1 – ÁREAS SOB A CURVA NORMAL ............................................................... 174
TABELA A1.2 – ÁREAS SOB A CURVA NORMAL ............................................................... 175
TABELA A2 - DISTRIBUIÇÃO ‘ t ’ DE STUDENT .................................................................. 176
TABELA A3 - DISTRIBUIÇÃO DE 2 ................................................................................... 177
TABELA A4 - DISTRIBUIÇÃO ‘F’ DE SNEDECOR (Nível de significância de 1%) ................ 178
TABELA A5 - DISTRIBUIÇÃO ‘F’ DE SNEDECOR (Nível de significância de 5%) ................ 179
TABELA A6 - DISTRIBUIÇÃO ‘F’ DE SNEDECOR (Nível de significância de 10%) .............. 180
TABELA A7 - VALORES CRÍTICOS ( dc ) PARA TESTE DE LILLIERFORS ....................... 181
SOLUÇÕES DAS LISTAS DE EXERCÍCIOS ........................................................................... 182
vi
ESTATÍSTICA DESCRITIVA
Introdução
Estatística é a ciência que trata da coleta, organização, descrição, análise e interpretação dos
dados experimentais. A FIGURA 1, a seguir, mostra o contexto em que se situa o estudo completo
da Estatística, aqui subdividido em Estatística Descritiva e Estatística Indutiva (ou Inferência
Estatística).
Estatística
Indutiva
A Estatística Descritiva é a parte que trata da organização e descrição de dados, através dos
cálculos de médias, variâncias, estudo de gráficos, tabelas etc.
A Teoria das Probabilidades permite-nos modelar os fenômenos aleatórios, ou seja, aqueles em
que está presente a incerteza. É uma ferramenta fundamental para a inferência estatística.
A Estatística Indutiva compreende um conjunto de técnicas baseadas em probabilidades, que a
partir de dados amostrais, permite-nos tirar conclusões sobre a população de interesse.
A Amostragem é o ponto de partida para um estudo estatístico. O estudo de qualquer fenômeno,
seja ele natural, social, econômico ou biológico, exige a coleta e a análise de dados estatísticos.
A coleta de dados é, pois, a fase inicial de qualquer pesquisa.
1
1 ESTATÍSTICA DESCRITIVA
Variável aleatória é aquela cujo valor numérico não é conhecido antes da sua observação. Esta
tem uma distribuição de probabilidades associada, o que permite calcular a probabilidade de
ocorrência de certos valores.
Geralmente, utilizam-se letras maiúsculas (X, Y, Z...) para designar as variáveis aleatórias, e
minúsculas (x, y, z...) para indicar particulares valores dessas variáveis. O comportamento de uma
variável aleatória é descrito por sua distribuição de probabilidade.
Exemplo: Suponha que em um lote de 10 parafusos, 2 são defeituosos. A variável aleatória
X=número de parafusos defeituosos, na escolha de 3 parafusos com reposição, pode assumir os
seguintes valores:
0 , se s = PPP
1, se s = DPP ou s = PDP ou s = PPD
X(s) =
2, se s = DDP ou s = DPD ou s = PDD
3, se s = DDD
0 (8 10 ) 3 = 0,512
1 3 (8 10 ) 2 (2 10 ) = 0,384
2 3 (8 10 ) (2 10 ) 2 = 0,096
3 (2 / 10 ) 3 = 0,008
2
A função de repartição ou função de distribuição acumulada da variável aleatória X é definida
por Fx (x)=Px (X ≤ x),x ∈ R, ou seja, é definida como sendo a probabilidade de X assumir um valor
menor ou igual a x. Como exemplo tem-se o QUADRO 2.
1 3 (8 10 ) (2 10 ) = 0,384
2
0,896
2 3 (8 10 ) (2 10 ) 2 = 0,096 0,992
3 (2 / 10 ) 3 = 0,008 1,000
3
Exemplo:
2,4 para 2
13,4 14
16,1 16
----- ----
31,9 32
Uma variável pode se apresentar das seguintes formas, quanto aos valores assumidos:
1.o Escala nominal: o nível nominal de mensuração é caracterizado por dados que consistem em
nomes, rótulos ou categorias apenas.
Por exemplo, seja X, a variável “cor” dos automóveis vendidos durante um determinado mês.
Neste caso, a variável X assume as categorias “prata”, “branco”, “preto”, etc., sendo denominada
politômica. Quando assume somente duas categorias é denominada dicotômica. Não tem
significado aritmético ou de quantificação, não se faz cálculos, apenas a contagem.
2.o Escala ordinal: no nível ordinal de mensuração os dados podem ser arranjados em alguma
ordem, mas diferenças entre os valores dos dados ou não podem ser determinados ou não são
significativas.
Exemplo: Seja X a variável que indica a qualidade de um determinado produto. Tem-se então: A
(indicando melhor qualidade), B (qualidade intermediária) e C (pior qualidade).
3.º Escala intervalar: o nível intervalar de mensuração é como o nível ordinal, com a propriedade
adicional de que a diferença entre quaisquer dois valores de dados é significativa. No entanto, os
dados nesse nível não têm um ponto inicial zero natural (quando o nada da quantidade está
presente).
Exemplo: As escalas para medir temperaturas como a Fahrenheit e a Celsius são exemplos de
escalas intervalar. Não se pode afirmar que 40oC é duas vezes mais quente que uma temperatura
de 20oC, embora se possa dizer que a diferença entre 20 oC e 40oC é a mesma que entre 75 oC e
95oC. No entanto, não há um ponto inicial natural. O valor 0 oC, pode parecer um ponto inicial, mas
é arbitrário e não significa ausência total de calor.
Outro exemplo: os anos 1000, 2000, 1400, 1900. O tempo não começa no ano 0, de modo que o
ano 0 é arbitrário e não um ponto inicial zero natural que represente nenhum tempo.
4.º Escala de razão: o nível de mensuração de razão é o nível intervalar com a propriedade
adicional de que há também um ponto inicial zero natural (onde o zero indica que nada da
quantidade está presente). Para valores nesse nível, diferenças e razões, são ambas significativas.
Esse nível de mensuração é chamado de nível de razão porque o ponto inicial zero torna as razões
significativas.
Exemplo: diâmetro de cilindros de automóveis, por exemplo.
De acordo com o nível de mensuração, a variável pode ser classificada em qualitativa ou
quantitativa. Variável qualitativa é aquela cujo nível de mensuração é nominal ou ordinal,
enquanto a quantitativa é aquela em que o nível de mensuração é intervalar ou de razão.
A variável quantitativa pode ser ainda discreta ou contínua, sendo a primeira resultante de
contagem, assumindo somente valores inteiros, e a última de medições, assumindo qualquer valor
4
no campo dos números reais. Apresentam-se, a seguir, os conceitos de variáveis quantitativas
discretas e contínuas.
Variável aleatória discreta: uma variável aleatória X é discreta se o conjunto de valores possíveis
de X for finito ou infinito numerável.
Nominal
Qualitativa
Ordinal
Variável
Discreta
Quantitativa
Contínua
FONTE: A autora
FONTE: A autora
1.3 TABELAS
Uma tabela deve apresentar os dados de forma resumida, oferecendo uma visão geral do
comportamento do fenômeno analisado.
Uma tabela é constituída dos seguintes elementos:
1 - Título: é a indicação que precede a tabela e contém a identificação de três fatores do fenômeno.
a) A data a qual se refere;
5
b) o local onde ocorreu o evento;
observados.
• Frequência Relativa ( fr ):
fi k
fr = e fri = 1
n i=1
Quando uma variável quantitativa discreta assume poucos valores, pode-se considerar que cada
valor seja uma classe e que existe uma ordem natural nessas classes.
6
TABELA 1 - DISTRIBUIÇÃO DE FREQUÊNCIAS DO NÚMERO DE
UNIDADES NÃO CONFORMES DE COMPUTADORES
PRODUZIDOS DURANTE 10 DIAS
NÚMERO DE DEFEITOS NÚMERO DE DIAS (Freq.)
4 2
5 2
6 2
7 2
8 2
FONTE: MONTEGOMERY, D. C.
NOTA: A produção diária é de 100 computadores.
Quando se tratar de uma variável quantitativa discreta que pode assumir um grande número de
valores distintos, a construção da tabela de frequências e de gráficos considerando cada valor
como uma categoria fica inviável. A solução é agrupar os valores em classes ao elaborar a tabela.
Segundo Bussab e Morettin (2002), a escolha dos intervalos dependerá do conhecimento que o
pesquisador tem sobre os dados. Assim, a definição do número de intervalos ou classes é
arbitrária. Mas, vale lembrar que, quando se utiliza um pequeno número de intervalos pode-se
perder informações, e ao contrário, com um grande número de intervalos pode-se prejudicar o
resumo dos dados.
Existem duas soluções para a definição do número de intervalos bastante utilizadas que são:
1) Se o número de elementos (n) for menor ou igual a 25 então o número de classes (k) é igual a
5; se n for maior que 25, então o número de classes é aproximadamente a raiz quadrada positiva
de n. Ou seja:
Para n 25, k = 5
▪ Amplitude total ou “range” (At): É a diferença entre o maior e o menor valor observados no
conjunto de dados.
A t = X máx − X min
▪ Amplitude dos intervalos ou das classes (h): É a divisão da amplitude total (At) pelo número de
intervalos (k).
At
Ou seja: h
k
7
1.3.2.2 VARIÁVEL CONTÍNUA
Quando a variável quantitativa em estudo é contínua, que assume muitos valores distintos, o
agrupamento dos dados em classes será sempre necessário, na construção das tabelas de
frequências.
Exemplo 1: A tabela abaixo apresenta as medidas de uma dimensão de uma peça produzida por
um processo de usinagem. Construir a tabela de distribuição de frequências em classes.
102,8 - 136,4 - 110,1 - 115,9 - 118,5 - 149,3 - 125,3 - 144,8 - 129,7 - 132,7
135,0 – 108,2 - 138,1 - 138,6 - 139,6 - 144,4 - 125,9 - 145,2 - 145,7 – 120,4
ROL:
102,8 - 108,2 - 110,1 - 115,9 - 118,5 - 120,4 - 125,3 - 125,9 - 129,7 - 132,7
135,0 - 136,4 - 138,1 - 138,6 - 139,6 - 144,4 - 144,8 - 145,2 - 145,7 - 149,3
A t = X máx − X min = 149 ,3 − 102,8 = 46,50
k=5
A t 46,50
h= = = 9,3 10
k 5
TABELA 2 - DISTRIBUIÇÃO DE FREQUÊNCIAS DAS MEDIDAS
DE UMA DIMENSÃO DAS PEÇAS PRODUZIDAS
POR UM PROCESSO DE USINAGEM
INTERVALO DE
fi fr fac
CLASSES
102,8 |--- 112,8 3 0,15 3
112,8 |--- 122,8 3 0,15 6
122,8 |--- 132,8 4 0,20 10
132,8 |--- 142,8 5 0,25 15
142,8 |--- 152,8 5 0,25 20
TOTAL 20 1,00
FONTE: Elaborada pela autora.
Exemplo 2: O tempo necessário para se realizar certa operação industrial foi cronometrado (em
segundos), sendo feita 30 determinações:
45 - 37 - 39 - 48 - 51 - 40 - 53 - 49 - 39 - 41 - 45 - 43 - 45 - 34 - 45
41 - 57 - 38 - 46 - 46 - 58 - 57 - 36 - 58 - 35 - 31 - 59 - 44 - 57 - 35
ROL:
31 - 34 - 35 - 35 - 36 - 37 - 38 - 39 - 39 - 40 - 41 -41 - 43 - 44 - 45
45 - 45 - 45 - 46 - 46 - 48 - 49 - 51 - 53 - 57- 57 - 57 - 58 - 58 – 59
8
TABELA 3 - DISTRIBUIÇÃO DE FREQUÊNCIAS DO TEMPO
NECESSÁRIO PARA REALIZAÇAO DE CERTA
OPERAÇÃO INDUSTRIAL
INTERVALO DE
CLASSES
fi fr fac
31 |---- 36 4 0,13 4
36 |---- 41 6 0,20 10
41 |---- 46 8 0,27 18
46 |---- 51 4 0,13 22
51 |---- 56 2 0,07 24
56 |---- 61 6 0,20 30
TOTAL 30 1,00
FONTE: Elaborada pela autora.
1.4 GRÁFICOS
O objetivo do gráfico é passar para o leitor uma visão clara do comportamento do fenômeno em
estudo, uma vez que os gráficos transmitem informação mais imediata do que uma tabela.
A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais:
b) Clareza: o gráfico deve possibilitar uma correta interpretação dos valores representativos do
fenômeno em estudo.
Este é um gráfico usado para apresentar dados organizados em intervalos de classes, utilizado
principalmente para representar a distribuição de variáveis contínuas.
8
7
6
5
4
3
2
1
0
76 105 134 163 192 221 250
Classes
9
1.4.3 DIAGRAMA DE RAMO E FOLHAS (STEM AND LEAF PLOT)
Este diagrama é muito útil para uma primeira análise dos dados.
Passos para construir um diagrama de ramo e folhas:
4. a partir daí colocam-se os valores na folha. O valor zero, significa que há informação e que é
um número inteiro. Já, quando naquele valor inteiro não existe observações, não colocar nada,
deixar em branco;
10 28 2
11 058 3
12 0559 4
13 256889 6
14 44559 5
3 145567899 9
4 0113455556689 13
5 13777889 8
10
1.4.4 GRÁFICO DE BOXPLOT OU DA CAIXA
Não há um consenso sobre a definição de um outlier. Porém, no caso do boxplot em geral, a maior
parte das definições considera que pontos acima do valor do 3º quartil somado a 1,5 vezes a IQ
ou os pontos abaixo do valor do 1º quartil diminuído de 1,5 vezes a IQ, são considerados outliers.
11
GRÁFICO 4 – GRÁFICO DE CONTROLE DE MÉDIAS
74,015 LSC=74,01
74,010
74,005
_
_
X=LC=74,00
74,000
73,995
73,990
LIC=73,99
1 3 5 7 9 11 13 15 17 19 21 23 25
Amostras
Estimador ou estatística é uma função dos valores da amostra, ou seja, é uma variável aleatória,
pois depende dos elementos selecionados para compor a amostra.
Ao analisarmos a distribuição de frequências de uma variável quantitativa, proveniente de uma
amostra, deve-se verificar basicamente três características:
▪ Localização;
▪ Variabilidade ou Dispersão;
▪ Forma.
As medidas de tendência central fazem parte, juntamente com as de posição, das chamadas
medidas de localização, e indicam onde se concentra a maioria dos dados.
1 N
E( X ) = = xi
N i=1
12
b) Para dados agrupados em classes
k
x i fi
E( X ) = = i =1
(população)
N
2. E ( X .K ) = k E ( X)
E ( X Y ) = E ( X) E( Y )
E ( X .Y ) = E ( X) . E( Y )
5. E ( X − X) = 0 v.a. centrada
1) Suponha que um engenheiro esteja projetando um conector de náilon para ser usado em uma
aplicação automotiva. O engenheiro estabelece como especificação do projeto uma espessura de
3/32 polegadas, mas está inseguro acerca do efeito dessa decisão na força da remoção do
conector.
Oito unidades do protótipo são produzidas e suas forças de remoção são medidas (em libras-força):
12,6 - 12,9 - 13,4 - 12,3 - 13,6 - 13,5 - 12,6 - 13,1. A média da força de remoção será:
1n
X= xi
n i=1
X=
1
12,6 + 12,9 + 13,4 + 12,3 + 13,6 + 13,5 + 12,6 + 13,1 = 104 = 13,0 libras-força
8 8
13
2) Considere a seguinte distribuição:
TABELA 4 - DISTRIBUIÇÃO DE FREQUENCIAS DO TEMPO
NECESSÁRIO PARA REALIZAÇÃO DE CERTA
OPERAÇÃO INDUSTRIAL
INTERVALO DE
fi fr fac
CLASSES
31 |---- 36 4 0,13 4
36 |---- 41 6 0,20 10
41 |---- 46 8 0,27 18
46 |---- 51 4 0,13 22
51 |---- 56 2 0,07 24
56 |---- 61 6 0,20 30
TOTAL 30 1,00
FONTE: Elaborada pela autora.
Solução:
INTERVALO DE
fi xi x i fi
CLASSES
31 |---- 36 4 33,5 134,0
36 |---- 41 6 38,5 231,0
41 |---- 46 8 43,5 348,0
46 |---- 51 4 48,5 194,0
51 |---- 56 2 53,5 107,0
56 |---- 61 6 58,5 351,0
TOTAL 30 1365,0
k
x i fi 1365
i =1
X= = = 45,50
n 30
3) Seja a distribuição de frequências a seguir. Calcular a média das medidas da dimensão das
peças.
14
INTERVALO DE
CLASSES
fi xi x i fi
102,8 |--- 112,8 3 107,8 323,4
112,8 |--- 122,8 3 117,8 353,4
122,8 |--- 132,8 4 127,8 511,2
132,8 |--- 142,8 5 137,8 689,0
142,8 |--- 152,8 5 147,8 739,0
TOTAL 20 2616,0
k
x i fi 2616
i =1
X= = = 130,8
n 20
1.5.1.2 MEDIANA
A mediana é o valor que ocupa a posição central do conjunto de observações de uma variável,
dividindo o conjunto em duas partes iguais, sendo que 50% dos dados tomam valores menores
ou iguais ao valor da mediana e os 50% restantes, acima do seu valor.
1. ordenar os dados em ordem crescente (pode ser também na ordem decrescente, mas não é
comum e pode atrapalhar na hora de calcular as medidas de posição)
2. o lugar ou posição que a mediana ocupa é:
(n − 1)
PosM e = 2 +1
4
A mediana é independente dos valores extremos, porque ela só leva em consideração os valores
de posição central.
Exemplo de aplicação:
1) Considerando-se as forças de remoção, medidas em uma amostra de oito unidades do protótipo
(em libras-força): 12,6 - 12,9 - 13,4 - 12,3 - 13,6 - 13,5 - 12,6 - 13,1.
2) Os dados que seguem são os resultados da inspeção diária de todas as unidades de computadores
produzidos durante os últimos 10 dias. O número de unidades não-conformes são:
4-7-5-8-6-6-4-5-8-7
Calcular a mediana.
15
Rol: 4 - 4 - 5 - 5 - 6 - 6 - 7 - 7 - 8 - 8
(10 − 1)
PosMe = 2 + 1 = 5,5
4
6+6
Me = =6
2
onde:
L i é o limite inferior da classe que contém a mediana;
n é o número de elementos do conjunto de dados;
' fac é a frequência acumulada da classe anterior a que contém a mediana;
fi é a frequência simples da classe que contém a mediana;
h é o intervalo ou amplitude da classe que contém a mediana.
1) Seja a distribuição de frequências a seguir. Calcular a mediana das medidas da dimensão das
peças.
Solução:
n 20
1) O passo inicial é calcular = = 10 ;
2 2
INTERVALO DE fi fac
CLASSES
102,8 |--- 112,8 3 3
112,8 |--- 122,8 3 6
122,8 |--- 132,8 4 10
132,8 |--- 142,8 5 15
142,8 |--- 152,8 5 20
TOTAL 20
( n 2 ) − fac
Me = L i + h
fi
16
( 20 2 ) − 6
Me = 122,8 + 10 = 132,8
4
Solução:
INTERVALO DE fi fac
CLASSES
31 |---- 36 4 4
36 |---- 41 6 10
41 |---- 46 8 18
46 |---- 51 4 22
51 |---- 56 2 14
56 |---- 61 6 30
TOTAL 30
n 30
= = 15
2 2
( n 2 ) − fac
Me = Li + h
fi
(15 ) − 10
Me = 41 + 5 = 44,125
8
1.5.1.3 MODA
A moda, representada por Mo , é o valor que apresenta maior frequência. Ela pode não existir
(distribuição amodal), ter somente um valor (unimodal) ou pode ter dois ou mais (bimodal ou
multimodal), principalmente quando a variável assume muitos valores.
Exemplo:
17
b) Dados agrupados em classes
d1 (moda de Czuber)
Mo = Li + h
d1 + d2
Onde:
L i : é o limite inferior da classe que contém a moda;
d1 : é a diferença entre a frequência da classe que contém a moda e a frequência da classe vizinha
anterior;
d 2 : é a diferença entre a frequência da classe que contém a moda e a frequência da classe vizinha
posterior.
Exemplos:
1) Dada a distribuição de frequências a seguir, calcular a moda.
Solução:
Tem-se que a média e a mediana da distribuição são, respectivamente:
X = 45,50
Me = 44,125
Logo, pelo método de Pearson, a moda será: Mo = 3Me − 2 X = 3 44,125 − 2 45,50 = 41,375
Aplicando o método de Czuber tem-se:
d1 2
Mo = Li + h = 41 + 5 = 42,67
d1 + d2 2+4
2) Seja a distribuição de frequências a seguir. Calcular a moda das medidas da dimensão das
peças.
18
TABELA 9 – DISTRIBUIÇÃO DE FREQUÊNCIAS
DAS MEDIDAS DE UMA DIMENSÃO
DAS PEÇAS
INTERVALO DE CLASSES fi
102,8 |--- 112,8 3
TOTAL 20
Solução:
X = 130,8
( 20 2 ) − 6
Me = 122,8 + 10 = 132,8
4
1.5.2.1 QUARTIL
São três medidas ( Q1 , Q 2 e Q 3 ) que dividem o conjunto de dados em 4 partes iguais, sendo que
a cada quartil correspondem 25% dos dados.
(n − 1)
PosQi = i + 1, i = 1, 2, 3
4
Exemplo 2: Os dados abaixo são as medidas de uma dimensão de uma peça produzida por um
processo de usinagem.
102,8 - 108,2 - 110,1 - 115,9 - 118,5 - 120,4 - 125,3 - 125,9 - 129,7 - 132,7
135,0 - 136,4 - 138,1 - 138,6 - 139,6 - 144,4 - 144,8 - 145,2 - 145,7 - 149,3
(20 − 1)
PosQ1 = 1 + 1 = 5,75 (5,75º elemento),
4
Logo, Q1 = 118,5 + (120,4 − 118,5) * 0,75 = 119,925
(20 − 1)
PosQ2 = 2 + 1 = 10,5 (10,5º elemento),
4
Logo, Q 2 = 132,7 + (135 ,0 − 132,7) * 0,5 = 133,85
(20 − 1)
PosQ3 = 3 + 1 = 15,25 (15,25º elemento),
4
Logo, Q 3 = 139,6 + (144,4 − 139,6) * 0,25 = 140,80
n
PosQi = i , i = 1, 2, 3
4
( PosQi ) − fac
Qi = L i + h
fi
onde:
Exemplos:
20
TABELA 10 – DISTRIBUIÇÃO DE FREQUÊNCIAS
DAS MEDIDAS DE UMA DIMENSÃO
DAS PEÇAS
INTERVALO DE fac
CLASSES
fi
102,8 |--- 112,8 3 3
112,8 |--- 122,8 3 6
122,8 |--- 132,8 4 10
132,8 |--- 142,8 5 15
142,8 |--- 152,8 5 20
TOTAL 20
Solução:
20
a) PosQ1 = 1 =5
4
5−3
Q1 = 112,8 + 10 = 119,47
3
20
PosQ2 = 2 = 10
4
10 − 6
Q2 = 122,8 + 10 = 132,80
4
20
PosQ3 = 3 = 15
4
15 − 10
Q 3 = 132,8 + 10 = 142,80
5
21
1.5.3.1 AMPLITUDE TOTAL
A amplitude total mede a distância entre o valor máximo e mínimo. Ela é uma estatística
rudimentar, pois embora forneça uma noção de dispersão, não diz qual é sua natureza.
A t = Xmáx − Xmin
Exemplo de aplicação:
Tem-se que:
Exemplo: considerando os dados referentes aos diâmetros (em cm) de peças de automóveis e
os quartis correspondentes, já calculados anteriormente, calcular a amplitude interquartil.
(9 − 1)
PosQ1 = 1 + 1 = 3,0 (3º elemento), logo Q1 = 12,6
4
(9 − 1)
PosQ3 = 3 + 1 = 7,0 (7º elemento), logo Q 3 = 13,5
4
IQ = 13,5 − 12,6 = 0,9
22
Exemplo de aplicação:
Os dados a seguir são diâmetros (em cm) de peças de automóveis:
12,3 - 12,6 - 12,6 - 12,9 - 13,1 - 13,4 - 13,5 - 13,6 - 15,0. Tem-se que: X = 13,22
xi xi − X
12,3 0,92
12,6 0,62
12,6 0,62
12,9 0,32
13,1 0,12
13,4 0,18
13,5 0,28
13,6 0,38
15,0 1,78
5,22
n
xi − X 5,22
i =1
DM = = = 0,58
n 9
INTERVALO DE xi − X x i − X fi
fi xi
CLASSES
31 |---- 36 4 33,5 12,0 48
36 |---- 41 6 38,5 7,0 42
41 |---- 46 8 43,5 2,0 16
46 |---- 51 4 48,5 3,0 12
51 |---- 56 2 53,5 8,0 16
56 |---- 61 6 58,5 13,0 78
TOTAL 30 212
k
x i − X fi 212
i =1
DM = = = 7,0667 7,07
n 30
23
1.5.3.4 VARIÂNCIA E DESVIO PADRÃO
Propriedades da Variância
1. V (k ) = 0 , onde k=constante
V ( X − Y ) = V( X) + V( Y ) − 2COV( X, Y )
(x i − )
1 N
2 = 2
(variância)
N i=1
= 2 (desvio padrão)
S2 =
1 n
(
xi − X
n − 1 i=1
2
) (variância)
S = S2 (desvio padrão)
24
S2 =
1 n
(
xi − X
n − 1 i=1
)
2
=
5,1556
9 −1
= 0,6445
S = 0,80
(x i − ) fi (x i − ) fi
k k
2 2
2 = i=1
k
= i=1
(variância)
N
fi
i=1
= 2 (desvio padrão)
S2 = = (variância)
k
n −1
fi − 1
i=1
S = S2 (desvio padrão)
Exemplo:
INTERVALO DE
fi xi ( x i − X ) 2 fi
CLASSES
TOTAL 20 3820,0
Dados: X = 130,8
k
(
x i − X fi
i =1
) 2
3820
S2 = = = 201,0526
n −1 20 − 1
S = 14,18
25
Exercício: Dada a distribuição de frequências a seguir, calcular a variância e o desvio padrão.
INTERVALO DE
fi
CLASSES
31 |---- 36 4
36 |---- 41 6
41 |---- 46 8
46 |---- 51 4
51 |---- 56 2
56 |---- 61 6
TOTAL 30
É uma medida de dispersão relativa. É definido como o quociente entre o desvio padrão e a média,
multiplicado por 100, para expressar porcentagem.
Em algumas situações é desejável comparar o grau de dispersão de dois conjuntos de dados com
unidades de medidas diferentes. Neste caso, deve-se usar o coeficiente de variação (CV), que
é uma medida de dispersão relativa, e ela não é afetada pelas unidades de medida da variável.
Ou ainda, quando as médias dos dois conjuntos de dados são muito distintas, neste caso faz-se
necessário utilizar uma medida de dispersão relativa.
CV = 100 coeficiente de variação populacional
S
CV = 100 coeficiente de variação amostral
X
Exemplo de aplicação: Para o exemplo tem-se:
26
Em alguns casos, apenas o conhecimento da forma da distribuição de frequências de uma variável
já nos fornece uma boa informação sobre o comportamento dessa variável.
n i =1
a3 = 32
1 k 2
( x i − X ) fi
n i =1
1 k 4
( x i − X ) fi
n i =1
a4 =
2
1 k 2
( x i − X ) fi
i =1
n
27
A curtose ou achatamento é mais uma medida com a finalidade de complementar a caracterização
da dispersão em uma distribuição. Esta medida quantifica a concentração ou dispersão dos
valores de um conjunto de dados em relação às medidas de tendência central em uma distribuição
de frequências. Uma distribuição é classificada quanto ao grau de achatamento como:
INTERVALO DE
CLASSES
fi
102,8 |--- 112,8 3
112,8 |--- 122,8 3
122,8 |--- 132,8 4
132,8 |--- 142,8 5
142,8 |--- 152,8 5
TOTAL 20
Solução:
INTERVALO DE
fi xi ( xi − X ) ( x i − X ) fi ( x i − X ) 2 fi ( x i − X ) 3 fi ( x i − X ) 4 fi
CLASSES
102,8 |--- 112,8 3 107,8 -23 -69 1.587 -3.6501 839.523
112,8 |--- 122,8 3 117,8 -13 -39 507 -6.591 85.683
122,8 |--- 132,8 4 127,8 -3 -12 36 -108 324
132,8 |--- 142,8 5 137,8 7 35 245 1.715 12.005
142,8 |--- 152,8 5 147,8 17 85 1.445 24.565 417.605
TOTAL 20 0 3.820 -16.920 1.355.140
1 k 1
( x i − X ) fi
3
( −16.920)
n i =1 20
a3 = = 32
= -0,3205
32
1 k 1
( x i − X ) fi 20 3.820
2
i =1
n
28
1 k 1
( x i − X ) fi
4
1.355.140
n i =1 20
a4 = 2
= 2
= 1,8573
1 k 2 1
( x i − X ) fi 20 3.820
n i =1
A distribuição é platicúrtica.
INTERVALO DE
CLASSES
fi
31 |---- 36 4
36 |---- 41 6
41 |---- 46 8
46 |---- 51 4
51 |---- 56 2
56 |---- 61 6
TOTAL 30
Solução:
INTERVALO DE
fi xi ( xi − X ) ( x i − X ) fi ( x i − X ) 2 fi ( x i − X ) 3 fi ( x i − X ) 4 fi
CLASSES
31 |---- 36 4 33,5 -12 -48 576 -6.912 82.944
36 |---- 41 6 38,5 -7 -42 294 -2.058 14.406
41 |---- 46 8 43,5 -2 -16 32 -64 128
46 |---- 51 4 48,5 3 12 36 108 324
51 |---- 56 2 53,5 8 16 128 1.024 8.192
56 |---- 61 6 58,5 13 78 1.014 13.182 171.366
TOTAL 30 0 2.080 5.280 277.360
1 k 1
( x i − X ) 3 fi (5.280)
n i=1 30
a3 = = 32
= 0,3049
32
1 k 1
( x i − X ) fi 30 2.080
2
n
i=1
A distribuição é platicúrtica.
1. Conceitue:
a) População ou Universo;
b) Amostra;
c) Parâmetro;
29
d) Estatística ou medida amostral;
e) Variável aleatória discreta e exemplifique;
f) Variável aleatória contínua e exemplifique.
2. Uma importante característica de qualidade da água é a concentração de material sólido
suspenso. Em seguida são apresentadas 30 medidas de sólidos suspensos de um certo lago.
42,4 - 65,7 - 29,8 - 58,7 - 52,1 - 55,8 - 57,0 - 68,7 - 67,3 - 67,3 - 54,3 - 54,0 - 73,1 - 81,3 - 59,9
56,9 - 62,2 - 69,9 - 66,9 - 59,0 - 56,3 - 43,3 - 57,4 - 45,3 - 80,1 - 49,7 - 42,8 - 42,4 - 59,6 - 65,8
a) construir a distribuição de frequências em classes (usar k=6);
b) calcular as frequências relativa e acumulada;
c) construir o histograma de frequências.
3. O tempo necessário para se realizar certa operação industrial foi cronometrado (em segundos),
sendo feita 40 determinações:
45 - 37 - 39 - 48 - 51 - 40 - 53 - 49 - 39 - 41 - 45 - 43 - 45 – 34 - 45 - 35
41 - 57 - 38 - 46 - 46 - 58 - 57 - 36 - 58 - 35 - 31 - 59 - 44 - 57 - 45 - 44
38 - 43 - 33 - 56 - 47 - 48 - 44 - 49
a) construir a distribuição de frequências em classes (usar k=7);
b) calcular as frequências relativa e acumulada;
c) construir o histograma de frequências.
4. Foram obtidas oito medidas do diâmetro interno de anéis de pistão forjados de um motor de um
automóvel. Os dados (em mm) são:
74,001 - 74,003 - 74,015 - 74,000 - 74,005 - 74,002 - 74,005 - 74,004
Calcule a média, a mediana, a moda, o desvio médio, o desvio padrão e o coeficiente de variação
da amostra.
5. Os tempos de esgotamento de um fluído isolante entre eletrodos a 34 kV, em minutos são:
0,19 - 0,78 - 0,96 - 1,31 - 2,78 - 3,16 - 4,15 - 4,67 - 4,85 - 6,50 - 7,35 - 8,01 - 8,27 - 12,06 - 31,75 -
32,52 - 33,91 - 36,71 - 72,89.
Calcule a média, mediana, quartil 1, quartil 3, desvio padrão e coeficiente de variação e comente
os resultados obtidos. (Usar a fórmula de Sturges para calcular o número de classes).
6. O pH de uma solução é medido oito vezes por uma operadora que usa o mesmo instrumento.
Ela obteve os seguintes dados:
7,15 - 7,20 - 7,18 - 7,19 - 7,21 - 7,20 -7,16 - 7,18
Faça uma análise estatística dos dados e comente.
7. Prevenir a propagação de trinca de fadiga em estruturas de aviões é um importante elemento
de segurança em aeronaves. Um estudo de engenharia para investigar a trinca de fadiga em n=9
asas reportou os seguintes comprimentos (em mm) de trinca:
2,13 - 2,96 - 3,02 - 1,82 - 1,15 - 1,37 - 2,04 - 2,47 - 2,60
Calcule a média, os quartis (1,2 e 3), o desvio padrão e o coeficiente de variação da amostra.
Comente os resultados obtidos.
30
8. Uma amostra de 7 corpos de prova de concreto forneceu as seguintes resistências à ruptura
(kg/cm2 ):
340 - 329 - 337 - 348 - 351 - 360 - 354
Calcular a média, mediana, moda, variância, desvio padrão e coeficiente de variação. Comente
os resultados obtidos.
9. O tempo necessário para se realizar certa operação industrial foi cronometrado (em segundos),
sendo feita 20 determinações:
45 - 37 - 39 - 48 - 51 - 40 - 53 - 49 - 39 - 41 - 45 - 43 - 45 – 34 - 45 - 35 - 38 - 46 - 46 - 58
Faça uma análise estatística dos dados construindo a distribuição de frequências em classes
(calcule também as medidas de assimetria e curtose). Usar k=5.
10. As taxas de octanagem de combustível para motor, de várias misturas de gasolina foram
obtidas:
88,5 - 94,7 - 84,3 - 90,1 - 89,0 - 89,8 - 91,6 - 90,3 - 90,0 - 91,5 - 89,9
98,8 - 88,3 - 90,4 - 91,2 - 90,6 - 92,2 - 87,7 - 91,1 - 86,7 - 93,4 - 96,1
Faça uma análise estatística dos dados (calcule também as medidas de assimetria e curtose).
Usar k=5.
11. A propagação de trincas por fadiga em diversas peças de aeronaves tem sido objeto de muitos
estudos. Os dados a seguir consistem dos tempos de propagação (horas de vôo) para atingir um
determinado tamanho de trinca em furos de fixadores propostos para uso em aeronaves militares.
Usar k=5.
0,736 - 0,863 - 0,865 - 0,913 - 0,915 - 0,937 - 0,983 - 1,007
1,011 - 1,064 - 1,109 -1,132 - 1,140 - 1,153 - 1,253 - 1,394
12. O tempo necessário para se realizar certa operação industrial foi cronometrado (em
segundos), sendo feita 12 medições:
45 – 37 – 39 – 48 – 51 – 40 - 53 – 49 – 39 – 41- 45 – 43
13. As taxas de octanagem de combustível para motor, de várias misturas de gasolina foram
obtidas:
88,5 - 94,7 – 80,0 - 90,1 - 89,0 - 89,8 - 91,6 - 90,3 - 90,0 - 91,5 - 89,9
31
ELEMENTOS DE PROBABILIDADES
Definições
Definição 1: É o fenômeno que, mesmo repetidos várias vezes sob condições semelhantes,
apresentam resultados imprevisíveis. O resultado final depende do acaso.
2.3 EVENTO
A
S
Exemplo:
Seja o espaço amostral S = (c, c ),(c, n),(n, c ),(n, n), resultado do experimento de seleção de duas
peças, sendo c=peça conforme e n=peça não conforme.
Suponha que A seja o subconjunto de resultados para os quais, no mínimo uma peça seja
conforme. Então o evento A será: A = (c, c ),(c, n), (n, c ).
Por serem subconjuntos, é possível realizar a operação de união (U) entre conjuntos. A União de
Eventos representa a ocorrência de um evento OU de outro. Outra operação que pode ser feita
sobre Eventos é a intersecção (∩). A intersecção de eventos representa a ocorrência de um E
de outro.
32
União de eventos => A B
A B
Exemplos:
P (2 ) = P(no. 3 no dado 2 ) = 1 6
P ( 1 2 ) = P (1 E 2) = P ( 1) P ( 2 ) = 1 6 1 6 = 1 36
2) Suponha que numa produção diária de 850 peças fabricadas contenha 50 peças que não
satisfaçam as exigências dos consumidores. Duas peças são selecionadas, sendo que a primeira
peça é reposta antes da segunda ser selecionada. Qual é a probabilidade das duas peças serem
defeituosas?
50 50
P( D e D) = = 0,0035 0,35%
850 850
33
2.3.3 EVENTOS MUTUAMENTE EXCLUSIVOS
A
B
S
P ( A B ) = P ( A OU B) = P ( A ) + P (B )
Exemplos:
P ( A B ) = P ( A OU B) = P ( no. 3 ) + P (no. 4 ) = 1 6 + 1 6 = 1 3
Solução:
15
P(pequeno defeito) = = 0,15
100
10
P(não − conforme ) = = 0,10
100
75
P(perfeito) = = 0,75
100
75 15
a) P(perfeito ou pequeno defeito) = + = 0,90
100 100
15 10
b) P( pequeno defeito ou não − conforme ) = + = 0,25
100 100
34
2.4 DEFINIÇÃO CLÁSSICA DE PROBABILIDADE
1) 0 P ( A ) 1
P (A ou B ) = P ( A ) + P (B)
P (A B )
P ( A | B) = , AE
P (B )
Exemplo: O quadro a seguir fornece um exemplo de 400 itens classificados por falhas na
superfície e como defeituosos (funcionalmente).
FALHAS NA SUPERFÍCIE
DEFEITUOSO
Sim Não TOTAL
Sim 10 18 28
Não 30 342 372
TOTAL 40 360 400
a) Qual é a probabilidade do item ser defeituoso, dado que apresenta falhas na superfície?
b) Qual é a probabilidade de ter falhas na superfície dado que é defeituoso?
Solução:
35
A Probabilidade Condicional pode assumir a forma abaixo, chamada algumas vezes de
teorema da multiplicação de probabilidades:
P ( A B ) = P ( A | B) P ( B ) , ou de forma equivalente, P ( A B ) = P ( B | A ) P ( A )
Exemplos:
1) A probabilidade de que um conector elétrico que seja mantido seco falhe durante o período de
garantia de um computador portátil é 1%. Se o conector for molhado, a probabilidade de falha
durante o período de garantia será de 5%. Se 90% dos conectores forem mantidos secos e 10%
forem mantidos molhados, qual é a probabilidade dos conectores falharem durante o período da
garantia?
Solução:
36
Solução:
Uma das relações mais importantes envolvendo probabilidades condicionais é dada pelo
teorema de Bayes, que expressa uma probabilidade condicional em termos de outras
probabilidades condicionais.
P ( A i ).P ( B | A i )
P ( A i | B) = k
P ( A j ).P ( B | A j )
j=1
Exemplo: Uma determinada peça é produzida por três fábricas, 1, 2 e 3. Sabe-se que a fábrica 1
produz o dobro de peças que 2, e 2 e 3 produziram o mesmo número de peças durante um período
de produção especificado. Sabe-se também que 2% das peças produzidas por 1 e por 2 são
defeituosas, enquanto 4% daquelas produzidas por 3 são defeituosas. Todas as peças são
colocadas num depósito. Uma peça é retirada ao acaso do depósito e se verifica que é defeituosa.
Qual a probabilidade de que tenha sido produzida na fábrica 1?
1
P( A 1 ) =
2
P(B | A 2 ) = 0,02
1
P( A 2 ) =
4
P(B | A 3 ) = 0,04
1
P( A 3 ) =
4
37
P ( A i ).P ( B | A i )
P ( A i | B) = k
P ( A j ).P ( B | A j )
j=1
P ( A 1 ).P ( B | A 1 )
P ( A 1 | B) =
P ( A 1 ).P ( B | A 1 ) + P ( A 2 ).P ( B | A 2 ) + P ( A 3 ).P ( B | A 3 )
1 2 0,02
P ( A 1 | B) = = 0,40
1 2 0,02 + 1 4 0,02 + 1 4 0,04
2) Cada objeto manufaturado é submetido para exame com a probabilidade 0,55 a um controlador
e com a probabilidade 0,45 a um outro. A probabilidade de passar no exame é, segundo o
controlador, respectivamente igual a 0,90 e 0,98. Achar a probabilidade de que um objeto aceito
tenha sido examinado pelo segundo controlador.
1. De uma caixa contendo 100 peças entre as quais 10 são defeituosas se extraem quatro peças
ao acaso, sem reposição. Encontrar a probabilidade de que entre estas não ocorra:
a) nenhuma peça defeituosa;
b) nenhuma peça boa.
2. De um lote de 15 válvulas 10 são boas. Encontrar a probabilidade de que de 3 válvulas extraídas
ao acaso, sem reposição, 2 sejam boas.
3. Uma caixa contém 20 peças das quais 5 são defeituosas. Extraem-se duas ao acaso, sem
reposição. Qual a probabilidade de:
a) ambas serem boas?
b) ambas serem defeituosas?
c) uma boa e outra defeituosa?
4. Dois aparelhos de alarme independentes funcionam, no caso de avaria, com a probabilidade
0,95 e 0,90, respectivamente. Achar a probabilidade de que numa avaria funcione apenas um dos
aparelhos.
5. A probabilidade de que numa medição o erro ultrapasse o admitido é 0,4. Achar a probabilidade
de que em apenas uma medição de uma série de três o erro ultrapasse o admitido.
6. A probabilidade de que uma peça do tipo exigido se ache em cada uma de quatro caixas é
igual, respectivamente, a 0,60; 0,70; 0,80 e 0,90. Calcular a probabilidade de que tal peça se
encontre:
a) no máximo em três caixas;
b) pelo menos em duas caixas.
7. Um circuito elétrico é constituído de três elementos ligados em série que deixam de funcionar
com probabilidade p 1 = 0,10 ; p 2 = 0,15 ; p 3 = 0,20 , respectivamente. Achar a probabilidade de que
não haja corrente no circuito.
38
8. Um dispositivo de freio de automóvel consiste de três subsistemas, que devem funcionar
simultaneamente para que o freio funcione. Os subsistemas são um sistema eletrônico, um
sistema hidráulico e um ativador mecânico. Ao frear, a probabilidade de sucesso dessas unidades
é de 0,96, 0,95 e 0,95, respectivamente. Estime a confiabilidade do sistema, admitindo que os
subsistemas funcionem independentemente.
Comentário: Sistemas deste tipo podem ser representados graficamente, conforme ilustração
abaixo, onde os subsistemas A (eletrônico), B (hidráulico) e C (ativador mecânico), dispõem-se
em série. Considera-se a trajetória A-B como a trajetória do sucesso.
A B C
10. Respectivamente, 60 e 84 por cento das peças fornecidas por duas máquinas automáticas, a
produtividade da primeira sendo o dobro da segunda, são de alta qualidade. Tendo-se constatado
que uma peça escolhida ao acaso é de alta qualidade, achar a probabilidade de que provenha da
primeira máquina (teorema de Bayes).
11. Um relatório de controle de qualidade de transistores acusa os seguintes resultados por
fabricante e por qualidade:
FABRI- QUALIDADE
CANTE Aceitável Marginal Inaceitável TOTAL
A 128 10 2 140
B 97 5 3 105
C 110 5 5 120
39
VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE
PROBABILIDADE DISCRETA
3.1 DEFINIÇÕES
X X( s )
s
Exemplo: Uma caixa contém 4 válvulas, sendo duas perfeitas e duas defeituosas. Duas válvulas
são retiradas aleatoriamente da caixa e testadas (sendo representadas por D se a peça é
defeituosa e P se a peça é perfeita). O espaço amostral associado a este evento é:
S={PP,PD,DP,DD}
Seja a variável aleatória X=número de válvulas defeituosas. Os valores possíveis da
variável aleatória X, serão:
R X = { 0 ,1, 2 }
Tem-se que:
0 P( X = x i ) 1
P( X = x i ) = 1
xS
Exemplo1: No lançamento de duas moedas ao ar, tem-se que os possíveis resultados são: CC,
Ck, KC, KK (C=cara e K=coroa). Seja X, a variável aleatória número de caras. Então, X poderá
assumir os valores:
0 , se s = KK
X (s) = 1, se s = CK ou s = KC
2 , se s = CC
40
Exemplo 2: Em um processo de fabricação de semicondutores, 3 pastilhas de um lote são
testadas. Cada pastilha é classificada como “passa” ou “falha”. Suponha que a probabilidade de
uma pastilha passar no teste seja de 0,8 e que as pastilhas sejam independentes. Seja X a variável
número de pastilhas de um lote que passam no teste. A distribuição de probabilidade de X será:
P( x = 0) = P(f, f, f ) = (1 − 0,8)3 = 0,23 = 0,008
P( x = 1) = P(p, f , f ) ou P( f , p, f ) ou P( f , f , p) = 3 (0,80 0,20 0,20 ) = 3 0,032 = 0,096
P( x = 2) = P(p, p, f ) ou P(p, f , p) ou P( f , p, p) = 3 (0,80 0,80 0,20 ) = 3 0,128 = 0,384
P( x = 3) = P(p, p, p) = 0,8 3 = 0,512
X=x P( X = x )
0 0,008
1 0,096
2 0,384
3 0,512
F( x ) = P( X x )
F( x ) = P( x i )
xi x
Esperança
i=1
Exemplo 1: Seja X uma variável aleatória discreta que representa o número de peças defeituosas
em cada 5 peças inspecionadas. Sabendo-se que a probabilidade de uma peça ser defeituosa é
de 20%, obtém-se a seguinte distribuição de probabilidade:
xi 0 1 2 3 4 5
p (xi ) 0,3277 0,4096 0,2048 0,0512 0,0064 0,0003
41
E( X) = 1
i=1
+ ( 4 − 1) 2 0,0064 + (5 − 1) 2 0,0003
V( X) = 0,7997
Exemplo 2: O tempo T, em minutos, necessário para um operário processar certa peça é uma
variável aleatória com a seguinte distribuição de probabilidade:
t 2 3 4 5 6 7
P(t) 0,1 0,1 0,3 0,2 0,2 0,1
Calcular: E ( X ) e V ( X )
a) E( X) = x iP( x i )
i=1
V( X) = (2 − 4,6) 2 0,1 + (3 − 4,6) 2 0,1 + ( 4 − 4,6) 2 0,3 + (5 − 4,6) 2 0,2 + (6 − 4,6) 2 0,2 + (7 − 4,6) 2 0,1
V( X) = 2,04
Definição 4: Seja E um experimento com espaço amostral S. Sejam X = X(s) e Y = Y(s) duas
funções, cada uma associando um número real a cada resultado s S . Tem-se então que (X,Y)
é uma Variável Aleatória Bidimensional.
R XY
S
s X(s)
s
Y(s)
Seja o experimento: retirar uma barra de ferro de um lote e observar a dimensão (largura e o
comprimento); tem-se neste caso duas variáveis aleatórias X e Y.
42
n
P ( X = x ) = p x qn − x , x = 0 ,1, 2 ,, n e 0 p 1
x
A função de distribuição acumulada é dada por:
0 , se x 0
x n
F( x ) = P( X x ) = p k qn−k , se 0 x n
k =0 k
1, se x n
Exemplo 1: Seja X uma v.a. que indica o número de peças não conformes (não segue a
especificação definida no projeto de qualidade) produzidas pela máquina “Z”. Se a probabilidade
desta maquina produzir uma peça não conforme é de 15%, ao selecionar aleatoriamente 5 peças,
pede-se:
a) a probabilidade de nenhuma peça ser não conforme;
b) a probabilidade de todas as peças serem de acordo com especificação do projeto de qualidade;
c) obter a distribuição de probabilidade e o gráfico.
Solução:
a) n = 5
p = 0,15
q = 0,85
x=0 (peça não ser conforme)
5
P( X = 0) = (0,15 ) 0 (0,85 ) 5−0 = 0,4437
0
DISTRIBUIÇÃO DE PROBABILIDADE DE X
x P( X = x )
0 0,4437
1 0,3915
2 0,1382
3 0,0244
4 0,0022
5 0,0001
43
Gráficamente:
Exemplo 2: Seja X uma v.a. que indica o número de parafusos defeituosos produzidos pela
máquina “A”. Se a probabilidade desta maquina produzir um parafuso defeituoso é de 5%, ao
selecionar aleatoriamente dois parafusos, qual a probabilidade de ambos serem defeituosos?
p =probabilidade de ser defeituoso=0,05
1− p = probabilidade de ser perfeito=1-0,05=0,95
2
P ( X = 2) = (0,05 ) 2 (0,95 ) 2−2 = 0,0025 = 0,25 %
2
Ao selecionar 50 parafusos produzidos por esta máquina, espera-se uma média de 2,5
parafusos defeituosos, e uma variância de 2,4 (parafusos defeituosos)2.
A distribuição de Poisson pode ser aplicada a muitos casos práticos nos quais interessa o
número de vezes que um determinado evento pode ocorrer durante um intervalo de tempo ou
distância, área ou outra unidade de medida análoga.
Uma v.a. discreta X tem distribuição de Poisson se sua função de probabilidade é dada
por:
e − x
P ( X = x) = , x = 0 ,1, 2 , e 0 (probabilidade de sucesso)
x!
44
A função de distribuição acumulada é dada por:
0 , se x 0
F( x ) = P( X x ) =
x e − k
, se x 0
k =0 k !
Solução:
e −2 2 0 e −2 21 e −2 2 2
a) P( X 3) = P( X = 0) + P( X = 1) + P( X = 2) = + +
0! 1! 2!
DISTRIBUIÇÃO DE PROBABILIDADE DE X
X P( X = x )
0 0,1353
1 0,2707
2 0,2707
3 0,1804
4 0,0902
5 0,0361
6 0,0120
7 0,0034
8 0,0009
9 0,0002
10 0,0000
Gráficamente:
45
A função de distribuição acumulada:
Suponha que em um lote de N peças, k são defeituosas e (N-k) são perfeitas e escolhem-
se ao acaso, n peças desse lote ( n N ) . Pode-se estar interessado na probabilidade de selecionar
x peças dos k rotulados como defeituosos e (n-x) perfeitas dos (N-k) rotulados como perfeitas.
Esse experimento é chamado hipergeométrico.
Uma v.a. discreta X tem distribuição hipergeométrica se sua f.p. é dada por:
k N − k
x n − x
P( X = x ) =
N
n
0 , se x j
k N − k
k j n − j
F( x ) = P( X x ) = , se 0 x j
j=0 N
n
1 , se x j
46
Média: E( X) = n p
N−n k k
Variância: V( X) = npq , onde p = ; q = 1− .
N −1 N N
Exemplo 1: Pequenos motores elétricos são expedidos em lotes de 30 unidades. Antes que uma
remessa seja aprovada, um inspetor seleciona ao acaso 3 destes motores para inspeção. Se
nenhum dos motores inspecionados for defeituoso, o lote é aprovado. Se um ou mais dos motores
verificados forem defeituosos, o lote todo é inspecionado. Suponha que existam, de fato, 2
motores defeituosos no lote. Qual é a probabilidade de que a inspeção de todo o lote seja
necessária?
N=30 (número de casos total na população)
k=2 (número de casos favoráveis na população)
n=3 (tamanho da amostra)
x=1,2,3 (número de casos desfavoráveis na amostra)
2 30 − 2 2 28
0 3 − 0 0 3
P( X 1) = 1 − P( X = 0) = 1 − = 1− 1 − 0,8069 = 0,1931 = 19,31 %
30 30
3 3
DISTRIBUIÇÃO DE PROBABILIDADE DE X
x p(x)
0 0,8069
1 0,1862
2 0,0069
3 0,0000
Gráficamente:
47
A função de distribuição acumulada:
Exemplo 2: Uma empresa adquiriu diversas caixas, cada uma contendo 15 lâmpadas. Ela decidiu
fazer uma inspeção por amostragem sem reposição, analisando 5 lâmpadas de uma caixa. A
caixa será aceita caso encontre no máximo duas defeituosas. Qual a probabilidade de aceitar uma
caixa sabendo que a qualidade do produto é definida por 20% de defeituosos?
N=15
n=5
x2
k = 0,20 * 15 = 3
P( X 2) = P( X = 0) + P( X = 1) + P( X = 2)
1. O número de mensagens enviadas por hora, através de uma rede de computadores, tem a
seguinte distribuição:
x = número de
10 11 12 13 14 15
mensagens
p(x) 0,08 0,15 0,30 0,20 0,20 0,07
Calcular:
E(X);
V(X).
2. Seja X=o número de cilindros do motor do próximo carro a ser regulado em certa oficina. A
função de probabilidade é dada por:
48
x 4 6 8
p(x) 0,5 0,3 0,2
a) calcular E( X)
b) calcular V( X)
c) calcular
3. Um proprietário acaba de instalar 20 lâmpadas em uma nova casa. Supondo que cada lâmpada
tenha 0,20 de probabilidade de funcionar por mais de três meses, pede-se:
a) qual a probabilidade de ao menos cinco delas durarem mais de três meses?
b) qual o número médio de lâmpadas que deverão ser substituídas em três meses?
6. Um departamento de conserto de máquinas recebe uma média de 5 chamadas por hora. Qual
a probabilidade de que em uma hora selecionada aleatoriamente sejam recebidas:
a) Exatamente três chamadas?
b) Menos que três chamadas?
11. Num lote de 20 pneus enviadas a um fornecedor sabe-se que há 5 defeituosos. Um cliente vai
a esse fornecedor comprar 4 pneus. Qual a probabilidade de levar 1 defeituoso?
50
VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE
PROBABILIDADE CONTÍNUA
4.1 DEFINIÇÕES
f ( x ) 0 para todo x R X
f ( x)d( x) = 1.
−
Exemplo: Seja X uma variável contínua com função densidade de probabilidade dada por:
x
f (x) = , 2x6
16
f ( x ) = 0 , para qualquer outros valores.
4 2
Para x = 4 f (4) = =
16 8
6 3
Para x = 6 f (6) = =
16 8
A condição f ( x )d( x ) = 1 , indica que a área total limitada pela curva que representa f ( x ) e
−
o eixo das abcissas é igual a 1.
Seja o intervalo [a,b] de R X . A probabilidade de um valor de X pertencer a esse intervalo
b
será dada por: P(a X b) = a f ( x )dx , que representa a área sob a curva da função densidade
de probabilidade.
Para variáveis aleatórias contínuas, as probabilidades são interpretadas como áreas.
Sendo X uma variável aleatória continua, a probabilidade em um ponto é nula, então:
P(a X b) = P(a X b) = P(a X b) = P(a X b)
F( x ) = P( X x )
51
Exemplo: Seja X uma variável contínua com função densidade de probabilidade dada por:
x
f (x) = , 2x6
16
f ( x ) = 0 , para outros valores.
6
2 6 x 6 1 x2 1 2 32
F( x ) = f ( x )dx + f ( x )dx = 0 + dx = = 6 − 22 = =1
− 2 2 16 16 2 32 32
2
Esperança
E( X) = x f ( x )dx
−
Variância
Exemplo1: Seja X uma variável contínua com função densidade de probabilidade dada por:
x
f (x) = , 2x6
16
f ( x ) = 0 , para qualquer outros valores.
6 x 6 x
V ( X ) = ( x − 4,33 ) 2 dx = ( x 2 − 2 4,33 x + 4,33 2 ) dx
2 16 2 16
6 6 6
6 x 3 8,66 2 18,7489 x 1 x4 8,66 x 3 18,7489 x 2
V( X) = ( − x + ) dx = − +
2 16 16 16 16 4 16 3 16 2
2 2 2
52
1 6 4 − 2 4 8,66 6 3 − 2 3 18,7489 62 − 22
V( X) = − +
16 4 16 3 16 2
V( X) = 1,22
4
x2
4 4
0,25 2
E( X) = x 0,25dx = 0,25 x dx = 0,25 = 4 − 02 = 2
0 0 0
2 2
b) V( X) = x − E( X)2 f ( x )dx
−
3 4 x2
4
4 4
x 4
V( X) = x − 2 0,25dx = 0,25 ( x 2 − 4x + 4) dx = 0,25 − 4 + 4x 0
2
3 2 0
0 0
0
V( X) = 1,33
f ( x) = e −x , x0
F( x ) = P( X x ) = x0 e −x dx = 1 − e −x , x 0
Portanto: P( X x) = e −x
53
Essa distribuição tem papel importante na descrição de uma grande classe de fenômenos,
particularmente nos assuntos relacionados a teoria da confiabilidade.
Exemplo 1: O tempo de vida X (em horas) das lâmpadas elétricas fabricadas por uma
empresa é uma variável aleatória, tendo sua função densidade de probabilidade dada por:
− 0,002 x , se x 0
f ( x) = 0,002e
0 se x 0
a) qual a probabilidade do tempo de vida de uma lâmpada ser superior a 600 horas?
b) qual é o tempo de vida esperado?
Solução:
a) = 0,002
P( X 600) = 600 0,002e −0,002 x = − e −0,002 x 600 = 0 + e −0,002600 = 0,3012
1 1
b) E( X) = = = 500 horas
0,002
f (x) =
x −
−1
e
−( )x−
−
, para x
− −
em que: 0 , 0 , 0 .
54
onde:
x é a variável que define o período de vida útil podendo ser expresso em distância percorrida (km),
em número de ciclos (n) ou em tempo de funcionamento (h);
: é o parâmetro de forma, conhecido também como inclinação da distribuição de Weibull (é um
número puro, isto é, adimensional)
: é o parâmetro de escala
: é o parâmetro de posição ou localização.
E,
x-γ β
-( )
P(X ≥ x)=e η-γ
2
2 1
Variância: V( X) = ( − ) 1+ − 1+
2
OBS:
(n + 1) = n ! (para n natural) ou (n) = (n − 1) !
De modo geral: (n + 1) = n (n)
1
( ) =
2
Exemplo:
De um conjunto de dados sobre o tempo de vida X de certo sistema, os parâmetros de uma
distribuição de Weibull são estimados como = 4 e = 0,5 , em que X é medido em milhares de
b) P( X 5) ;
c) P( X 10 )
55
Solução:
1 1
a) E( X) = + 1 + = 0 + 4 1 + = 4 (3) = 4 2 ! = 8
0,5
x− 5−0
0,5
− −
b) P( X 5) = e =e 4 = e −1,118034 = 0,326922 0,3269
x− 10 − 0
0,5
− −
c) P( X 10) = 1 − e = 1− e 4 = 1 − e −1,5811 = 1 − 0,2057 = 0,7943 0,7943
onde: x 0 , 0 , 0
a) Tem-se que:
1 1
E ( X) = 1 + = 5000 1 + = 5000 ( 3 ) = 5000 2 = 10 .000 horas
1 2
56
b) P ( X 6.000 ) = 1 − P( X 6.000 ) = 1 − F(6.000 )
1/ 2
−
6000
P ( X 6.000) = 1 − 1 − e 5000 = e −1,095 = 0,3340
Exemplo 2: Suponha que a vida de um mancal de rolamento siga uma distribuição de Weibull
com parâmetros = 2 e = 10 .000 horas.
a) determine a probabilidade de um mancal durar no mínimo 8.000 horas;
b) determine o tempo médio até haver uma falha de um mancal;
Solução:
a) P ( X 8.000 ) = 1 − P( X 8.000 ) = 1 − F(8.000 )
P ( X 8.000 ) = 0,5273
1
b) E ( X) = 1 + = 10 .000 1 + = 10 .000 ( ) = 10 .000 0,8862 = 8.862 horas
1 3
2 2
2
1 x −
1 −
2
f ( x) = e , x R, R , R + ,
2
F( x ) = P( X x ) = x
= x 1 − ( )
1 x − 2
2
− f ( x)d( x) − e dx
2
Média: E ( X ) =
Variância: V ( X ) = 2
Quando se deseja especificar que a variável aleatória X, segue distribuição normal com
média e variância 2 , usa-se a notação: X ~ N ( ; 2 ) .
57
Uma das características importantes é que a partir desses dois parâmetros será possível
calcular, por exemplo, a percentagem de valores que deverão estar acima ou abaixo de um
determinado valor da variável aleatória, ou entre esses dois valores definidos etc.
P( a X b ) = b 1 − ( )
1 x − 2
2
a e dx
2
Representação Gráfica:
− 3 − 2 − + + 2 + 3
F( x ) =
1 x − ( )
1 x − 2
dx
− e 2
2
reduzida.
Os parâmetros da distribuição são:
Média: E ( Z ) = 0
Variância: V ( Z ) = 1
Gráfico da distribuição normal padrão:
f(z)
= 0,2508
= 0,0005
P (0,2485 X 0,2515 ) = ?
59
0,2485 − 0,2508
Z1 = = −4,6
0,0005
0,2515 − 0,2508
Z2 = = 1,4
0,0005
= 0,8
f x ( 2 ) = 2
1
( )( 2)−1 e
2 − 2 2
, 2 0 ,
(2)
2
2 ~ 2 ( ) ou 2 ~ 2 .
Utilização da distribuição 2
a) P (0 2 32 ) = 0,975
60
Deseja-se obter o valor de 32 de maneira que, abaixo dele se encontrem a área
correspondente a 97,5%.
O valor é igual a: 32 = 9,3484
b) P ( 2 10
2
) = 0,900
( + 1) ( +1)
−
2 t 2 2
f (t) = 1+ , t R ,
2
A distribuição t é simétrica em relação a t = 0 , sendo que, quando → ela tende para
uma distribuição normal com média 0 e variância 1 (distribuição normal padronizada). O único
parâmetro que a define e caracteriza a sua forma é o número de graus de liberdade (número
de observações livres para variar). Quando se deseja indicar que uma variável aleatória t segue
uma distribuição t de Student com graus de liberdade, usa-se a seguinte notação t ~ t ( ) ou
t ~ t .
a) P ( t t 5 ) = 0,05
Deseja-se obter o valor de t 5 tal que abaixo dele se encontrem 5% da área da distribuição.
61
b) P ( t t 8 ) = 0,10
Deseja-se obter o valor de t 8 tal que acima dele se encontrem 10% da área da distribuição.
1
( 1 + 2 ) 1 1
−1
2 1 2 F 2
f (F) = , F 0,
1+ 2
1 2 2
1 2
2 2 1 +
2
F
Utilização da distribuição F
a) P F F(6, 10 ) = 0,01
Deseja-se obter o valor de F6 ,10 tal que abaixo dele estejam 1% da área da distribuição.
F(6, 10 ) = 5,39
b) P F F(3, 5) = 0,05
Deseja-se obter o valor de F3 , 5 tal que acima dele estejam 5% da área da distribuição.
F(3, 5) = 5,4095
62
LISTA DE EXERCÍCIOS NO. 4 – DISTRIBUIÇÕES DE PROBABILIDADE CONTÍNUA
2. Suponha que um componente eletrônico tenha um tempo de vida X (em unidades de 1.000
horas) que é considerado uma variável aleatória com função densidade de probabilidade
f ( x ) = e − x , x 0 . Qual é a probabilidade de x 0,9 ?
3. O tempo (em horas) necessário para reparar uma máquina é uma variável aleatória
exponencialmente distribuída com parâmetro = 1/ 2 . Determine a probabilidade de que o tempo
de reparo exceda duas horas.
4. Suponha que uma variável aleatória X seja distribuída como Weibull, com parâmetros = 250
, = 0,25 , e parâmetro = 0 .
a) calcular a média e a variância da variável aleatória X.
b) calcular a probabilidade P(5000 X 7000 ).
7. Seja X a variável aleatória que representa os diâmetros dos parafusos produzidos por certa
máquina. Supondo que essa variável tenha distribuição normal com média igual 2 cm e desvio
padrão igual a 0,04 cm. Qual a probabilidade de um parafuso ter o diâmetro com valor entre 2 e
2,05 cm ?
8. A tensão de ruptura (em newtons) de uma fibra sintética é representada por X e distribuída
como N (800,12 2 ) . O controle de qualidade na fabricação da fibra exige uma tensão de no mínimo
772 N. Uma amostra da fibra é randomicamente testada. Qual é a probabilidade de obtermos
P( X 772) ?
9. Suponha que as frequências indesejáveis para um determinado sinal elétrico tenham uma
variação normal com média 60 Hz e desvio padrão 15 Hz.
a) Qual a probabilidade desse sinal elétrico possuir componentes entre 40 e 70 Hz devido a essas
frequências indesejáveis?
b) Qual a maior frequência do sinal para que a probabilidade de contaminação por frequências
indesejáveis seja de 10%?
63
10. A vida média de certo aparelho é de oito anos, com desvio padrão de 1,8 ano. O fabricante
substitui os aparelhos que acusam defeito dentro do prazo de garantia. Se ele deseja substituir
no máximo 5% dos aparelhos que apresentem defeito, qual deve ser o prazo de garantia?
11. Um processo industrial produz peças com diâmetro médio de 2,00” e desvio padrão de 0,01”.
As peças com diâmetro que se afaste da média por mais de 0,03” são consideradas defeituosas.
Admitida a normalidade:
a) qual a percentagem das peças defeituosas?
b) qual a percentagem de peças perfeitas?
12. Uma empresa usa anualmente milhares de lâmpadas elétricas, que permanecem acesa
continuamente, dia e noite. A vida de uma lâmpada pode ser considerada uma variável aleatória
normal, com média de 50 dias e desvio padrão de 15 dias. Em 1º de janeiro a companhia instalou
8.000 lâmpadas novas. Aproximadamente quantas deverão ser substituídas em 1º de fevereiro?
13. O diâmetro do eixo principal de um disco rígido segue a distribuição normal com média 25,08
in. e desvio padrão 0,05 in. Se as especificações para esse eixo são 25,00 0,15 in. Determine o
percentual de unidades produzidas em conformidades com as especificações.
64
NOÇÕES DE AMOSTRAGEM E DISTRIBUIÇÕES AMOSTRAIS
5.1 INTRODUÇÃO
é o método mais simples e mais importante para selecionar uma amostra probabilística;
consiste em listar todas as unidades elementares enumeradas de 1 a N;
sorteiam-se “n” elementos da população, sendo que todos os elementos têm probabilidade
conhecida e diferente de zero de serem selecionados;
amostragem com reposição ou sem reposição.
Exemplo: Foram produzidos 500 anéis de pistão em certo processo de produção. Deseja-se obter
uma amostra de 30 anéis de pistão deste processo.
Utilizando processo aleatório simples com reposição:
1) enumerar os anéis de pistão de 1 a 500;
2) todos os anéis terão a mesma probabilidade de compor a amostra, igual a 0,2%;
3) gerar 30 números aleatórios ou selecionar 30 números utilizando tabelas de números aleatórios;
4) os anéis que comporão a amostra serão aqueles correspondentes aos números aleatórios;
65
No excel:
5) a amostra de 30 anéis de pistão será composta pelos anéis com as numerações acima.
No excel:
3) a amostra de 30 anéis de pistão será composta pelos anéis com as numerações acima.
Exemplo:
66
variável critério “cargo” para estratificar essa população, e considerando amostra total de 250
operários, chega-se ao seguinte quadro:
QUADRO 6 – POPULAÇÃO TOTAL, PROPORÇÃO E TAMANHO DA AMOSTRA SEGUNDO
CARGO
CARGO POPULAÇÃO PROPORÇÃO AMOSTRA
Chefes de seção 500 0,10 25
Operários especializados 1.500 0,30 75
Operários não especializados 3.000 0,60 150
TOTAL 5.000 1,00 250
Ao retirar uma amostra aleatória de uma população, está-se considerando cada valor da
amostra como um valor de uma variável aleatória cuja distribuição de probabilidade é a mesma
da população, no instante da retirada desse elemento para a amostra.
Em consequência do fato de os valores da amostra serem aleatórios, decorre que qualquer
quantidade calculada em função dos elementos da amostra, também será uma variável aleatória.
Os parâmetros são valores teóricos correspondentes à população e as estatísticas são
funções dos valores amostrais.
As estatísticas, sendo variáveis aleatórias, terão alguma distribuição de probabilidade, com
uma média, variância, etc. A distribuição de probabilidade de uma estatística chama-se,
comumente, distribuição amostral ou distribuição por amostragem.
67
QUADRO 7 – AMOSTRAS POSSÍVEIS DE 2 ELEMENTOS RETIRADAS DESSA POPULAÇÃO
SEM REPOSIÇÃO
AMOS- AMOS- AMOS- AMOS- AMOS- AMOS-
AMOSTRAS TRA 1 TRA 2 TRA 3 TRA 4 TRA 5 TRA 6
X1 2 2 2 5 5 7
X2 5 7 10 7 10 10
Observe que a média da amostra depende de cada amostra extraída. Qualquer inferência
realizada sobre a média da população utilizando uma única amostra estará sujeita a alguma
incerteza, pois a média de cada amostra pode ser diferente.
E( X) = 6
A média das médias amostrais ou a média da distribuição amostral coincide com a média da
população. Tem-se, então, a primeira conclusão importante: a média das médias amostrais é a
própria média da população.
V( X) = 2,83
A variância das médias amostrais é igual à variância da população multiplicada pelo fator:
1 N−n
n N −1
2 N−n
V( X) = 2X = (Variância da distribuição amostral de médias)
n N−1
a) Com reposição
68
QUADRO 8 – AMOSTRAS POSSÍVEIS DE 2 ELEMENTOS RETIRADAS DESSA POPULAÇÃO
COM REPOSIÇÃO
AMOS- AMOS- AMOS- AMOS- AMOS- AMOS- AMOS- AMOS- AMOS-
TRAS TRA 1 TRA 2 TRA 3 TRA 4 TRA 5 TRA 6 TRA 7 TRA 8
X1 2 2 2 2 5 5 5 5
X2 2 5 7 10 2 5 7 10
Média 2,0 3,5 4,5 6,0 3,5 5,0 6,0 7,5
AMOS- AMOS- AMOS- AMOS- AMOS- AMOS- AMOS- AMOS- AMOS-
TRAS TRA 9 TRA 10 TRA 11 TRA 12 TRA 13 TRA 14 TRA 15 TRA 16
X1 7 7 7 7 10 10 10 10
X2
2 5 7 10 2 5 7 10
E( X) = 6
V( X) =
1k
( X i − E( X)) =
2 1
16 + 6,25 + 2,25 + ... + 6,25 + 16 = 68
k i=1 16 16
V( X) = 4,25
A variância das médias amostrais é igual à variância da população multiplicada pelo fator:
1
n
2
V( X) = 2X = (Variância da distribuição amostral de médias)
n
69
Resumindo:
2
V( X) = X2 = (Variância da distribuição amostral de médias)
n
b) Amostragem sem reposição:
E( X) = X = (Média da distribuição amostral de médias)
2 N−n
V( X) = X2 = (Variância da distribuição amostral de médias)
n N−1
N−n
onde o fator é denominado de fator de população finita. Evidentemente, tem-se que:
N −1
N−n
lim =1
N→ N −1
X− X−
Z= = n ~ N ( 0,1) .
2
n
70
A média e o desvio padrão da distribuição amostral de proporções são apresentados a
seguir, considerando-se amostras sem e com reposição.
a) Com reposição
pq
p̂ = (desvio padrão da distribuição amostral de proporções)
n
b) Sem reposição
pq N − n
p̂ = (desvio padrão da distribuição amostral de proporções)
n N −1
1 n
S2 = ( x i − X)
2
n − 1 i=1
S2 =
2 2 , com n−
2
1
(n − 1)
E ( S2 ) = 2
2 4
V ( S2 ) =
n −1
71
ESTIMAÇÃO DE PARÂMETROS
6.1 INTRODUÇÃO
Inferência estatística tem como objetivo fazer generalizações sobre uma população, com base
nos dados amostrais.
Pontual
Estimação
Inferência Por intervalo
Estatística
Teste de Hipóteses
Um estimador ̂ é não tendencioso ou não viesado quando a sua média (ou esperança ou
expectância) é o próprio valor do parâmetro populacional que está se pretendendo estimar, ou
seja: E( ˆ ) =
72
b) Consistência
Um estimador ̂ é consistente se (além de ser não viesado) sua variância tende para zero,
quando n tende para , isto é:
E( ˆ ) = e lim V( ˆ ) = 0
n→
c) Eficiência
Dados dois estimadores ̂1 e ̂ 2 de um mesmo parâmetro, é mais eficiente aquele que
apresenta menor variância, ou seja:
Se V ( ˆ 1 ) V ( ˆ 2 ) então ̂1 é mais eficiente que ̂ 2 .
Ainda, se ̂1 e ̂ 2 forem ambos não tendenciosos, a eficiência relativa será dado pelo
quociente das respectivas variâncias, ou seja:
V ( ˆ 1 )
.
V ( ˆ 2 )
d) Suficiência
Um estimador é suficiente quando permite obter um resumo das informações trazidas pela
amostra, ou seja, resume os dados sem perder nenhuma informação sobre o parâmetro .
Quando o parâmetro é estimado através de um único valor diz-se que a estimação é por
ponto ou pontual. Por exemplo: X é um estimador pontual da média populacional ; S 2 é um
estimador pontual da variância populacional 2 ; etc.
6.4.1 ESTIMADOR DA MÉDIA POPULACIONAL
73
6.4.3 ESTIMADOR DO DESVIO PADRÃO POPULACIONAL
Consiste em construir um intervalo em torno da estimativa por ponto, de tal forma que ele
possua probabilidade conhecida (nível de confiança (1 − ) ) de conter o verdadeiro valor do
parâmetro.
1− nível de confiança.
A escolha do nível de confiança depende do grau de precisão com que se deseja estimar
o parâmetro. É comum utilizar os níveis de 95% e 99%. Evidentemente, o aumento no nível de
confiança implica no aumento de sua amplitude.
P( X − Z 2 X + Z 2 ) = 1−
n n
onde:
X é a média da amostra;
é o nível de significância adotado;
Z 2 é o valor de Z da tabela da distribuição “t” para um determinado nível de significância e
graus de liberdade → ;
é o desvio padrão da população;
n é o tamanho da amostra.
74
Para grandes amostras ( n 30 ) , não existe a exigência de que a população seja normalmente
distribuída (justificada pelo Teorema Central do Limite), e sendo desconhecido, pode ser
substituído pelo desvio padrão amostral S .
1−
2 2
− Z 2 Z 2
Exemplos de aplicação:
1) O desvio padrão dos comprimentos de todas as peças produzidas por certa máquina é 2 mm.
Uma amostra de 50 peças produzidas por essa máquina apresenta média igual a 25 mm. Construir
o I.C. de 95% para o verdadeiro comprimento das peças produzidas por essa máquina.
Solução:
=2
n = 50
X = 25
1 − = 95% ; = 5% ; Z 2 = 1,96
75
Solução:
=2
n=9
X = 98
1 − = 95% ; = 5% ; Z 2 = 1,96
P X − Z 2 X + Z 2 = 1−
n n
2 2
P 98 − 1,96 98 + 1,96 = 95 %
9 9
S S
P( X − t 2 X + t 2 ) = 1−
n n
onde:
X é a média da amostra;
é o nível de significância adotado;
t 2 é o valor de t da tabela da distribuição “t” para um determinado nível de significância e
= n − 1 graus de liberdade;
S é o desvio padrão da amostra;
n é o tamanho da amostra.
normalmente distribuída;
Para grandes amostras ( n 30 ) , ele pode substituir o I. C. dado pela fórmula em que é
conhecido, pois, no caso de grandes amostras, a distribuição t de Student se aproxima de uma
distribuição normal padronizada.
76
FIGURA 6 – DISTRIBUIÇÃO t DE STUDENT
1−
2 2
−t 2 t 2
Exemplos de aplicação
1) Uma amostra de 20 cabos, produzidos por uma indústria, foram avaliados e medidas as tensões
de rupturas (em kgf). A média e o desvio padrão da amostra são iguais a 762 kgf e 14,4 kgf,
respectivamente. Deseja-se construir o intervalo de confiança de 95% para a tensão média de
ruptura de cabos produzidos pela indústria.
Solução:
n = 20
X = 762
S = 14,4
1 − = 95% ; = 5% ; = n − 1 = 19
t 2 = 2,09
S S
P X − t 2 X + t 2 = 1−
n n
14,4 14,4
P 762 − 2,09 762 + 2,09 = 1−
20 20
2) A resistência do concreto à compressão está sendo testada por um engenheiro civil. Ele testa
12 corpos de prova e obtém dados abaixo. Construir um intervalo de 95% para a resistência
média.
Dados: X = 2259,92 ; S = 35,57
77
Solução:
n = 12
1 − = 95%
= 5%
= n − 1 = 11
t 2 = 2,20
S S
P X − t 2 X + t 2 = 1−
n n
35,57 35,57
P 2259 ,92 − 2,20 2259 ,92 + 2,20 = 1−
12 12
P 2.237,33 2.282,51 = 95 %
12 22 12 22
P ( X1 − X 2 ) − Z 2 + (1 − 2 ) ( X1 − X 2 ) + Z 2 + = 1−
n1 n 2 n1 n 2
onde:
X 1 é a média da amostra 1;
X 2 é a média da amostra 2;
Exemplo de aplicação:
1) Os desvios padrões das durações das lâmpadas elétricas fabricadas pelas indústrias A e B
são, respectivamente, 50 horas e 80 horas. Foram ensaiadas 40 lâmpadas de cada marca e
as durações médias obtidas foram 1.200 horas e 1.100 horas, para A e B, respectivamente.
Construir o intervalo de confiança de 99% para a diferença entre os tempos médios de vida
das lâmpadas de marcas A e B, ou seja, A − B .
78
Solução:
A = 50
B = 80
n = 40
X A = 1200
XB = 1100
1 − = 99%
Z 2 = 2,58
2A B2 2A B2
( X A − XB ) − Z 2 + A − B ( X A − XB ) + Z 2 +
nA nB nA nB
50 2 80 2 50 2 80 2
(1200 − 1100 ) − 2,58 + A − B (1200 − 1100 ) + 2,58 +
40 40 40 40
1 1 1 1
P ( X1 − X 2 ) − t 2 S p2 ( + ) 1 − 2 ( X1 − X 2 ) + t 2 S p2 ( + ) = 1−
n1 n 2 n1 n 2
(n1 − 1) S12 + (n 2 − 1) S 22
sendo que: S p2 =
n1 + n 2 − 2
X 1 é a média da amostra 1;
X 2 é a média da amostra 2;
Exemplo de aplicação:
Uma amostra de 5 tubos da fábrica A, apresentou os seguintes resultados quanto aos diâmetros
(mm): X A = 45,40 ; S 2A = 1,30
79
E, uma amostra de 6 tubos da fábrica B, apresentou: X B = 44,17 ; S B2 = 1,37 .
Construir o I. C. de 95% para as diferenças entre os diâmetros médios A − B .
Solução:
nA = 5
nB = 6
1 − = 95 %
t 2 , com = n1 + n 2 − 2 graus de liberdade, logo = 9
t 2 = 2,26
1 1 1 1
(X A − XB ) − t 2 S p2 ( + ) A − B ( X A − XB ) + t 2 S p2 ( + )
n A nB n A nB
onde:
(n A − 1) S 2A + (n B − 1) S B2 (5 − 1)(1,30) + (6 − 1)(1,37)
S p2 = = = 1,34
n A + nB − 2 5+6−2
1 1 1 1
( 45,40 − 44,17) − 2,26 1,34 + A − B ( 45,40 − 44,17) + 2,26 1,34 +
5 6 5 6
S12 S 22 S12 S 22
P ( X1 − X 2 ) − t 2 + 1 − 2 ( X1 − X 2 ) + t 2 + = 1−
n1 n 2 n1 n 2
=
(w 1 + w 2 )2 S 12 S2
2 2
, onde w 1 = e w2 = 2 (método de Aspin-Welch)
w w n1 n2
1
+ 2
n1 − 1 n 2 − 1
onde:
X 1 é a média da amostra 1;
X 2 é a média da amostra 2;
80
é o nível de significância adotado;
t 2 é o valor de t da tabela da distribuição “t” para um determinado nível de significância e
graus de liberdade;
S12 é a variância da amostra 1;
S 22 é a variância da amostra 2;
n1 é o tamanho da amostra 1;
n 2 é o tamanho da amostra 2.
Exemplo de aplicação:
1) Dois operários mediram o tempo (em min) de certa operação industrial, obtendo:
Solução:
1 − = 95%
t 2 é o valor de t da tabela da distribuição “t” para um determinado nível de significância e
graus de liberdade.
(w 1 + w 2 )2 S12 S2
Onde: = , onde w 1 = e w2 = 2
w 12 w 22 n1 n2
+
n1 − 1 n 2 − 1
S12 7,77
w1 = = = 1,30
n1 6
S 22 16,30
w2 = = = 3,26
n2 5
(1,30 + 3,26) 2
= =7
1,30 2 3,26 2
+
6 −1 5 −1
S 12 S 22 S 12 S 22
( X1 − X 2 ) − t 2 + 1 − 2 ( X1 − X 2 ) + t 2 +
n1 n 2 n1 n 2
81
6.5.3 INTERVALO DE CONFIANÇA PARA A VARIÂNCIA POPULACIONAL
(n − 1) S 2 (n − 1) S 2
P 2 = 1−
2 12− 2
2
FIGURA 7 – DISTRIBUIÇÃO 2
f ( 2 )
1−
2
2
12− 2 2 2
Exemplo de aplicação:
Foram realizadas 12 determinações da densidade de certo metal ( g / cm3 ), obtendo-se o
seguinte resultado: S 2 = 0,02
Estimar a variância populacional da densidade através de um intervalo de confiança de
95%.
Solução:
12− 2 = 3,8157
2 2 = 21,9200
Logo:
(n − 1) S 2 (n − 1) S 2
2
2
2 12− 2
P 0,0100 2 0,0577 = 95 %
82
6.5.4 INTERVALO DE CONFIANÇA PARA O DESVIO PADRÃO POPULACIONAL
(n − 1) S 2 (n − 1) S 2
P = 1−
2 2 12− 2
Exemplo de aplicação:
Solução:
(n − 1) S 2 (n − 1) S 2
2 2 12− 2
P 0,1002 0,2401 = 95 %
p̂ q̂ p̂ q̂
P p̂ − Z 2 p p̂ + Z 2 = 1−
n n
x
onde p̂ = é a proporção amostral (onde x representa o número de casos favoráveis ao evento
n
estudado).
Exemplo de aplicação:
Em uma amostra de 200 peças produzidas por certa máquina, verificou-se que 10 eram
defeituosas. Estimar a verdadeira proporção de peças defeituosas produzidas por essa máquina,
utilizando I.C. de 90%.
83
Solução:
n = 200
10
p̂ = = 0,05
200
q̂ = 1 − p̂ = 0,95
Z 2 = 1,64
0,0247 p 0,0753
P 2,47 % p 7,53 % = 90 %
Z2 2 2N
n=
e 02 (N − 1) + Z2 2 2
Exemplo de aplicação:
Qual o tamanho mínimo da amostra para se estimar a média de uma população cujo desvio padrão
é igual a 10, com confiança de 99% e precisão igual a 4? Supor que a amostragem é obtida:
84
a) com reposição;
b) sem reposição de uma população com 1000 elementos;
Solução:
= 10
e0 = 4
= 10
e0 = 4
N = 1.000
1 − = 99% , logo = 1% e Z 2 = 2,58
Z2 2 2N
n=
e 02 (N − 1) + Z2 2 2
2,58 2 10 2 1000
n= = 39,9792 = 40
4 2 (1000 − 1) + 2,58 2 10 2
pq
e0 = Z 2 ,
n
pq
n = Z2 2
e02
Exemplo de aplicação:
Qual o tamanho de amostra suficiente para estimar a proporção de peças defeituosas fornecidas
por certa máquina, com precisão de 0,08 e 99% de confiança, sabendo que essa proporção não
ultrapassa a 0,10?
85
Solução:
p = 0,10
e0 = 0,08
pq
n = Z 2 2
e 02
Supondo que o tempo para a execução da operação industrial seja normalmente distribuído,
construir:
a) O I.C. de 95% para a média populacional;
b) O I.C. de 95% para a variância populacional;
c) O I.C. de 95% para o desvio padrão populacional;
2. Um fabricante produz anéis para pistões de um motor de um carro. Sabe-se que o diâmetro
do anel é distribuído normalmente com = 0,001 milímetro. Uma amostra aleatória de 15 anéis
tem um diâmetro médio de 74,036 milímetros. Construa o intervalo de confiança de 99% para
o diâmetro dos anéis de pistão.
n = 15 ; X = 8,23 ; S = 0,03
86
6. Em uma amostra aleatória de 85 mancais de eixos de manivelas de motores de automóveis,
10 têm um acabamento de superfície que é mais rugoso do que as especificações permitidas.
Consequentemente, uma estimativa pontual da proporção de mancais na população que
10
excede a especificação de rugosidade é 𝑝̂ = 85 =0,12. Construir o intervalo de confiança de 95%
para a proporção populacional.
9. Uma empresa vem tendo sérios problemas com sucata e retrabalho, de modo que um de seus
engenheiros de qualidade decide investigar um determinado processo. Uma amostra aleatória
de 150 itens é extraída num determinado dia, sendo encontrada uma porcentagem alta e
alarmante de 16% de itens desconformes (ou seja, defeituosos). O engenheiro decide criar
um intervalo de confiança de 95% para a proporção real de unidades defeituosas naquele
momento. Qual é o intervalo obtido?
10. Dois tipos de plásticos são adequados para uso por um fabricante de componentes
eletrônicos. A resistência à quebra desse plástico é importante. É sabido que 1 = 2 = 1,0 psi.
A partir de uma amostra aleatória de n1 = 10 e n 2 = 12 , obteve-se X1 = 162,5 e X2 = 155,0 psi.
A companhia não adotará o plástico 1, a menos que sua resistência média à quebra exceda
do plástico 2, por no mínimo, 10 psi. Calcule o intervalo de confiança de 95% para a diferença
de médias, supondo que ambas as populações sejam normalmente distribuídas.
11. Duas formulações diferentes de um combustível oxigenado de um motor devem ser testadas
com a finalidade de estudar sua octanagem na estrada. A variância da octanagem na estrada
no caso da formulação 1 é 12 = 1,5 e no caso da formulação 2 é 22 = 1,2 . Duas amostras
aleatórias de n1 = 15 e n2 = 20 são testadas, sendo que as octanagens médias observadas
são X1 = 89,6 e X 2 = 92,5 . Considere normalidade das distribuições. Calcular o intervalo de
confiança de 90% para a diferença na octanagem média ( 2 − 1 ) observada na estrada.
12. Diâmetro de bastões de aço, fabricadas em duas máquinas extrusoras diferentes, está sendo
investigado. Duas amostras aleatórias de tamanhos de n1 = 15 e n 2 = 17 são selecionadas e
as médias e variâncias das amostras são 𝑋̅1 = 8,73, 𝑠12 = 0,35, 𝑋̅2 = 8,68 e 𝑠22 = 0,40,
respectivamente. Suponha que 12 = 22 e que os dados sejam retirados de uma população
normal. Construa um intervalo de confiança de 98% para a diferença no diâmetro médio dos
bastões.
13. Duas companhias fabricam um material de borracha para uso em uma aplicação automotiva.
A peça será sujeita a um desgaste abrasivo no campo de aplicação. Assim, decide-se
comparar, através de um teste, o material produzido por cada companhia. Vinte e cinco
amostras de material de cada companhia são testadas em um teste de abrasão, sendo a
quantidade de desgaste observada depois de 1000 ciclos. Para a companhia 1, a média e o
desvio padrão do desgaste na amostra são X1 = 20 miligramas/1000 ciclos e S1 = 2
87
miligramas/1000 ciclos, enquanto para companhia 2 são X 2 = 15 miligramas/1000 ciclos e
S 2 = 8 miligramas/1000 ciclos. Construa um intervalo de confiança para 95% e 99% para a
diferença de média de desgastes, considerando que as populações são normalmente
distribuídas com variâncias diferentes.
14. Um experimento realizado para estudar várias características de pinos de ferro resultou em
38 observações sobre a resistência de corte (kip) de pinos de 3/8 polegada de diâmetro e 35
observações sobre a resistência de pinos de 1/2 polegada de diâmetro. Os resultados obtidos
foram:
PINOS n X S
Pino diâmetro 3/8 38 6,140 0,9
Pino diâmetro 1/2 35 4,250 1,3
15. Qual o tamanho mínimo de amostra para se estimar a média de uma população cujo desvio
padrão é igual a 12, com confiança de 95% e precisão igual a 3? Supor que a amostragem é
obtida sem reposição de uma população com 2000 elementos.
16. Qual o tamanho de amostra suficiente para estimarmos a proporção de peças defeituosas
fornecidas por certa máquina, com erro de 0,03 e 99% de confiança, sabendo que a proporção
não ultrapassa de 0,10
17. Determinar o número mínimo de elementos de uma amostra, se desejamos estimar a média
populacional com 95% de confiança e erro amostral de 1, sendo que de uma amostra piloto com
70 elementos obteve-se variância igual a 36.
18. Um fabricante de peças acredita que aproximadamente 5% de seus produtos são defeituosos
se ele deseja estimar a verdadeira porcentagem, com erro de 0,05, com 90% de confiança. Qual
deverá ser o tamanho da amostra a ser retirada?
88
TESTES DE HIPÓTESES
Os pontos -c e c são os pontos críticos, localizados nas tabelas das distribuições das estatísticas
do teste, considerando-se o nível de significância adotado e o número de graus de liberdade em
questão.
5) definir o tamanho da amostra, coletar os dados e calcular o valor da estatística correspondente;
6) rejeitar ou aceitar Ho, avaliando se o valor da estatística, obtida a partir dos dados amostrais,
situa-se na área de rejeição ou na região de aceitação.
89
= P (rejeitar H0 / H0 verdadeira )
Erro tipo II – Não rejeitar a hipótese nula quando ela for falsa, também denominado erro
beta ( ).
= P (aceitar H0 / H0 falsa )
X − 0
Z=
n
onde:
X é a média amostral;
0 é o valor a ser testado;
é o desvio padrão populacional;
n é o tamanho da amostra.
Exemplos de aplicação:
1) Uma peça ao ser fabricada, foi planejada de tal forma que uma de suas dimensões seja igual
a 10 cm. Conhece-se o desvio padrão do processo produtivo, que é igual a 0,8 cm e sabe-se que
a distribuição das dimensões é normal. Uma amostra de 40 peças forneceu uma dimensão média
90
igual a 10,09 cm. Há interesse em testar se a média populacional é maior que 10 cm, ao nível de
5% de significância.
Solução:
Dados: = 0,8 cm
n = 40
X = 10,09
X − 0 10,09 − 10
A estatística do teste é calculada por: Z = = = 0,71
0,8
n 40
Conclusão: O valor de Z calculado é 0,71 e o tabelado Z 0,05 = 1,64 . Portanto, aceita-se H0 , logo,
a média populacional é igual a 10 cm.
2) Uma população normalmente distribuída tem desvio padrão conhecido, sendo igual a 5 mm.
Uma amostra de 20 elementos, obtida dessa população, tem média igual a 46 mm. Pode-se
afirmar que a média dessa população é superior a 43mm, ao nível de significância de 1%?
Solução:
a) Dados:
= 5 mm
n = 20
X = 46
Para amostras pequenas ( n 30 ) , a população de onde a amostra foi retirada deve ser
normalmente distribuída. Se 2 é desconhecida, a estatística do teste é calculada por:
91
X − 0
t=
S
n
onde:
X é a média amostral;
0 é o valor a ser testado;
S é o desvio padrão amostral;
n é o tamanho da amostra.
As áreas de rejeição e aceitação de H0 devem ser definidos de acordo com o valor crítico
de t, que deve ser obtido em uma tabela da distribuição t de Student, para nível de significância
e n-1 graus de liberdade. Deve-se rejeitar H0 se o valor de t amostral situar-se na região de
rejeição ou aceitar H0 se situar-se na região de aceitação.
Exemplos de aplicação:
Solução:
Dados:
S = 0,9 cm
n = 20
X = 10,8
As hipóteses estatísticas são:
H0 : = 10
H1 : 10
A estatística do teste é calculada por:
X − 0 10,8 − 10
t= = = 3,98
S 0,9
n 20
Conclusão: O valor de t calculado é 3,98 e o tabelado t 0,01; 19 = 2,54 . Portanto, rejeita-se H0 , logo,
a média populacional é maior do que 10 cm.
2) Um fabricante afirma que a tensão média de ruptura dos cabos produzidos por sua companhia
não é inferior a 500 kgf. Uma amostra de 7 cabos foi ensaiada, obtendo-se os resultados (em Kgf):
X = 485,14 e S = 7,77 . Sabendo-se que a tensão de ruptura é normalmente distribuída, testar a
hipótese de que a média populacional é menor que 500 kgf, utilizando o nível de significância de
5%.
92
Solução:
X − 0
A estatística do teste é calculada por: t =
S
n
485,14 − 500
t= = -5,06
7,77
7
Conclusão: O valor de t calculado é -5,06 e o tabelado t ; 6 = −1,943 . Portanto, rejeita-se H0 ,
logo, a média populacional é menor que 500 kgf.
Utiliza-se o teste para a proporção populacional (p) quando se deseja testar a hipótese de
que p é supostamente igual a um determinado valor.
Os critérios a serem obedecidos é que np 5 e n(1 − p) 5 , exigindo assim que a amostra seja
grande. Para amostras suficientemente grandes (na prática, n 30 ), a estatística do teste é dada
por:
p̂ − p 0
Z=
p 0 (1 − p 0 )
n
onde:
p̂ é a proporção amostral;
p 0 é o valor a ser testado;
n é o tamanho da amostra.
93
de H0 . Deve-se rejeitar H0 se o valor de Z calculado situar-se na região de rejeição ou aceitar
H0 se situar-se na região de aceitação.
Exemplos de aplicação:
1) Um fabricante afirma que no máximo 3% das peças produzidas por sua indústria são
defeituosas. Um comerciante comprou 100 peças e verificou que 8 eram defeituosas. Testar a
hipótese de que a proporção de peças defeituosas é superior a 3%, utilizando nível de significância
de 5%.
Solução:
n = 100
8
p̂ = = 0,08
100
= 5%
As hipóteses estatísticas são:
H0 : p = 0,03
H 1 : p 0,03
Solução:
n = 200
192
p̂ = = 0,96
200
= 1%
94
H0 : p = 0,95
H1 : p 0,95
Para aplicar o teste para a variância é necessário que a população de onde foi extraída a
amostra seja normalmente distribuída.
(n − 1) S 2
2 =
02
As regiões de rejeição e aceitação de H0 serão definidas de acordo com o valor crítico
obtido em uma tabela de distribuição 2 , para nível de significância e n-1 graus de liberdade.
Deve-se rejeitar H0 se o valor de 2 calculado situar-se na região de rejeição ou aceitar H0 se
situar-se na região de aceitação.
Exemplos de aplicação:
1) As chapas de aço, produzidas por uma indústria, têm especificação tal que a variância de suas
espessuras (em mm) não deve ser superior a 0,0009 mm 2. Uma amostra de 30 chapas,
apresentaram espessura média de 3,157 mm e variância igual a 0,00098 mm 2. O que se pode
concluir a cerca da especificação da indústria ao nível de 5% de significância sendo que as
espessuras das chapas têm distribuição normal?
Solução:
n = 30
X = 3,157
95
S 2 = 0,00098
= 5%
As hipóteses estatísticas são:
H0 : 2 = 0,0009
H1 : 2 0,0009
(n − 1) S 2
2 =
02
(30 − 1) 0,00098
2 = = 31,58
0,0009
A.A.
.
A.R.
.
42,56
2) Usuários de uma rede de transmissão de energia elétrica têm reclamado da alta variação na
tensão (desvio padrão de 12 V). A empresa encarregada da transmissão de energia elétrica na
região instalou novos transformadores. Uma amostra de 30 observações forneceu um desvio
padrão de 8V e a distribuição de frequências dos valores da amostra sugere uma distribuição
normal. Há evidência de redução na variação da tensão? Usar = 5% .
( X1 − X 2 ) − d 0
Z=
12 22
+
n1 n2
onde:
X1 é a média da amostra 1;
X 2 é a média da amostra 2;
12 é a variância da população 1;
22 é a variância da população 2;
n1 é o tamanho da amostra 1;
n 2 é o tamanho da amostra 2.
Exemplos de aplicação:
1) Duas amostras de tubos de aço das marcas A e B foram analisadas e obtidas as resistências
médias, respectivamente de 40 kgf/mm 2 e 35 kgf/ mm2. Conhecendo-se os desvios padrão
populacionais das resistências, de 4 kgf/ mm 2 e 6 kgf/ mm2 , respectivamente, e tamanhos de
amostras iguais a 30, qual a conclusão a respeito das diferenças entre as médias, ao nível de
significância de 5%?
Solução:
1) Dados:
X 1 = 40 ; 1 = 4 ; n1 = 30
X 2 = 35 ; 2 = 5 ; n 2 = 30
= 0,05
As hipóteses estatísticas são:
H0 : 1 − 2 = 0
H1 : 1 − 2 0
Conclusão: O valor de Z calculado é igual a 3,80 e valor tabelado é 1,96, portanto, rejeita-se H0
. Logo, as resistências médias das marcas A e B são diferentes.
2) Uma amostra de 100 válvulas da Indústria A tem vida média X A = 1530 h , sendo A = 100 h .
Uma outra amostra de 70 válvulas da Indústria B, tem vida média XB = 1450 h , sendo B = 90 h .
Testar a hipótese de que as válvulas da indústria A em relação a B tem duração média superior a
100 h. Utilizar = 0,01.
Solução:
Dados:
X A = 1.530 ; A = 100 ; n A = 100
X B = 1.450 ; 2 = 90 ; n 2 = 70
= 0,01
As hipóteses estatísticas são:
H0 : A − B = 100
H1 : A − B 100
Z 0,01 = 2,33
Conclusão: Como o valor de Z calculado é igual a -1,36 e o valor tabelado é 2,33, aceita-se H0 .
Logo, a diferença entre as durações médias das válvulas da indústria A e B é igual a 100 h.
98
a) Quando as Variâncias Populacionais 12 e 22 são Desconhecidas e Supostamente Iguais
( X1 − X 2 ) − d 0 (n1 − 1) S12 + (n 2 − 1) S 22
t= , onde S p2 =
1 1 n1 + n 2 − 2
S p2 ( + )
n1 n 2
onde:
X1 é a média da amostra 1;
X 2 é a média da amostra 2;
S 21 é a variância da amostra 1;
S 22 é a variância da amostra 2;
n1 é o tamanho da amostra 1;
n 2 é o tamanho da amostra 2.
A determinação da região crítica será com base no valor de t tabelado com = n1 + n 2 − 2
graus de liberdade e nível de significância . Deve-se rejeitar H0 se o valor de t calculado situar-
se na região de rejeição ou aceitar H0 se situar-se na região de aceitação.
Exemplo de aplicação:
Dois tipos de soluções químicas foram ensaiados para se determinar os pH. Os resultados obtidos
foram:
X1 = 7,516 ; S 12 = 0,033 ; n1 = 5
X 2 = 7,505 ; S 22 = 0,011 ; n 2 = 6
Testar a hipótese de que não existe diferença entre os pH médios das duas populações, supondo
que os desvios padrões populacionais são iguais. Usar = 0,05 .
Solução:
X 2 = 7,505 ; S 22 = 0,011 ; n 2 = 6
= 0,05
99
As hipóteses estatísticas são:
H0 : 1 − 2 = 0
H1 : 1 − 2 0
(5 − 1) 0,033 + (6 − 1) 0,011
S p2 = = 0,021
5+6−2
( 7,516 − 7,505) − 0
t= = 0,13
1 1
0,021 +
5 6
Conclusão: O valor de t calculado é igual 0,13, menor que o valor tabelado, logo, aceita-se H0 .
Conclui-se, portanto, que os pH médios das duas populações são iguais.
Quando as variâncias das amostras não forem homogêneas, uma modificação do teste t,
denominada correção de Aspin-Welch deve ser aplicada.
100
A determinação da região crítica será com base no valor de t tabelado com
=
(w 1 + w 2 )2 , onde w = S12 e w = S 22 , graus de liberdade e nível de significância .
1 2
w 12 w 22 n1 n2
+
n1 − 1 n 2 − 1
Tem-se que:
X1 é a média da amostra 1;
X 2 é a média da amostra 2;
S 21 é a variância da amostra 1;
S 22 é a variância da amostra 2;
n1 é o tamanho da amostra 1;
n 2 é o tamanho da amostra 2.
Exemplo de aplicação:.
Uma mesma distância foi medida 5 vezes por dois instrumentos (em metros):
Testar a hipótese de que não existe diferença entre os resultados obtidos pelos dois instrumentos.
Utilizar o nível de significância de 5%.
Solução:
H0 : 1 − 2 = 0
H1 : 1 − 2 0
( X1 − X 2 ) − d 0
t=
S12 S 22
+
n1 n 2
101
A determinação da região crítica será com base no valor de t tabelado com
=
(w 1 + w 2 )2 , onde w = S12 e w = S 22 , graus de liberdade e nível de significância .
1 2
w 12 w 22 n1 n2
+
n1 − 1 n 2 − 1
(100,46 − 100,40) − 0
t= = 0,19
0,473 0,01
+
5 5
S 12 0,473
w1 = = = 0,0946
n1 5
S 22 0,01
w2 = = = 0,002
n2 5
=
(w 1 + w 2 )2 =
( 0,0946 + 0,002) 2
= 4,16 4
2 2
w w 0,09462 0,0022
1
+ 2
+
n1 − 1 n 2 − 1 4 4
Este teste deve ser utilizado quando os dados estão relacionados dois a dois de acordo
com algum critério.
O teste t de Student para grupos dependentes é aplicado para comparação das médias de
dois grupos emparelhados, que utiliza para o seu cálculo, a média das diferenças ( d ) entre cada
um dos pares formados pelas duas amostras.
Se n 30 (pares), a suposição explícita de normalidade da população é desnecessária
(Teorema Central do Limite).
As hipóteses a serem testadas:
H0 : d = d0
d d 0 ( teste unilateral à esquerda)
H1 : d d 0 ( teste unilateral à direita )
d d 0 ( teste bilateral )
102
d é a média das diferenças;
d0 é o valor que ser quer testar;
n é o tamanho da amostra.
Exemplo de aplicação: Uma amostra de 7 cabos de aço foi analisada antes e depois de sofrer
um tratamento para aumentar sua resistência (em kgf/mm2). Os resultados obtidos foram:
Antes: 50 54 51 50 55 53 52
Depois: 60 61 57 54 59 58 60
Testar a hipótese de que o tratamento é eficiente, no nível de significância de 5%. Tratar
os dados como emparelhados.
Solução:
d − d0 di 1 n 2 2
i =1
t= , em que: d = e S 2d = di − nd
Sd n n n − 1 i=1
7
Tem-se que di = 44 , logo d = 6,29 , S 2d = 4,84 e S d = 2,20 .
i =1
d − d0 6,29 − 0
t= = = 7,56
Sd n 2,20 7
Para aplicar o teste para a variância é necessário que a população de onde foi extraída a
amostra seja normalmente distribuída.
As hipóteses estatísticas são:
H0 : 12 = 22
103
S12
F=
S 22
onde:
S12 é a variância da amostra 1;
S22 é a variância da amostra 2;
n1 é o tamanho da amostra 1;
n 2 é o tamanho da amostra 2.
O valor crítico de F é obtido a partir da tabela da distribuição F, para o nível de significância
e 1 = n1 − 1 graus de liberdade no numerador e 2 = n 2 − 1 graus de liberdade no
denominador.
Exemplo de aplicação:
1) Foram testadas as durabilidades (em km) dos pneus das marcas A e B, obtendo-se para 5
pneus de cada marca os seguintes resultados:
Marca A: 30.000 32.000 28.000 26.000 31.000
Marca B: 25.000 30.000 20.000 21.000 23.000
Existe diferença significativa entre as variâncias das durabilidades dos dois pneus, ao nível
de 10% de significância?
Solução:
H0 : 12 = 22
H1 : 12 22
A estatística do teste é calculada por:
S12
F=
S 22
104
A.A.
.
A.R.
A.R.
0,16 6,39
1 1
F1− 2 = F(1− 2 ; 1; 2 ) = = = 0,16
F( 2 2 ;1 ) 6,39
2) Foram ensaiadas válvulas das marcas A e B, e verificou-se que os tempos de vida (em horas)
foram:
Testar a hipótese de igualdade para as variâncias do tempo de vida das válvulas de marcas A e
B, ao nível de significância de 10%.
Solução:
S 2A 770
F= 2
= = 0,04
S B
17 .225
105
A região de rejeição está representada no gráfico:
F 2 = F( 2 ; 1; 2 ) = F( 0,05 ; 4; 3 ) = 9,12
1 1
F1− 2 = F(1− 2 ; 1; 2 ) = = = 0,15
F( 2 ; 2; 1 ) 6,59
A.A.
.
A.R.
A.R.
0,16 6,39
0,11
0,15 6,59
9,12
1. Sabe-se que os diâmetros internos de rolamentos usados no trem de pouso de aviões têm
desvio padrão = 0,009 cm e normalmente distribuídos. Uma amostra aleatória de 15 rolamentos
acusa um diâmetro interno médio de 8,2535 cm. Testar a hipótese de que o diâmetro interno
médio do rolamento é maior que 8,25 cm. Usar = 0,05 .
2. Deseja-se testar a hipótese de que o diâmetro médio da haste de liga de alumínio, produzidas
em uma máquina de calibragem, é diferente de 0,5025 in. Uma amostra de 25 hastes apresentou
um diâmetro médio de 0,5046 in e desvio padrão de 0,01 in. Utilizar = 0,05 e supor distribuição
normal.
3. A força média de resistência de uma fibra sintética é uma característica de qualidade de
interesse do fabricante, que deseja testar a hipótese de que a força média é maior que 50 psi,
usando = 0,05 . O desvio padrão populacional da força de resistência é desconhecido. Uma
amostra de 16 exemplares de fibra é selecionada e são obtidos os seguintes resultados: X = 50,86
; S = 1,66 . Sabe-se que a distribuição da força de resistência é normal.
4. Uma fundição produz cabos de aço usados na indústria automotiva. Deseja-se testar a hipótese
de que a fração de itens não-conformes é menor que 10%. Em uma amostra aleatória de 250
cabos, detectou-se que 24 estavam fora das especificações. Usar = 0,05 .
106
6. Uma amostra aleatória de 500 pinos de hastes de conexão contém 65 unidades não-conformes.
Testar a hipótese de que a verdadeira fração de defeituosos nesse processo é maior que 0,08.
= 0,01
Usar .
7. Dois catalisadores estão sendo testados para determinar como afetam o rendimento médio de
um processo químico. Especificamente, o catalisador 1 está sendo usado atualmente, mas o
catalisador 2 é aceitável. Como o catalisador 2 é mais barato, ele poderia ser adotado, desde que
não alterasse o rendimento do processo. Um teste é realizado em uma fábrica piloto e os
resultados são apresentados abaixo. Existe alguma diferença entre os rendimentos médios? Usar
= 0,05 e supor que as populações são normais e as variâncias iguais.
Dados: X1 = 92,26 ; S1 = 1,39 ; n1 = 8 ; X 2 = 92,68 ; S 2 = 1,28 ; n 2 = 8
8. Considerar o exercício anterior supondo que as variâncias populacionais não são iguais.
9. Uma pesquisa apresenta os resultados de uma análise do peso do cálcio no cimento padrão e
no cimento misturado com chumbo. Níveis reduzidos de cálcio são uma indicação de que o
mecanismo de hidratação no cimento está bloqueado, o que permitirá a água atacar vários locais
da estrutura de cimento. Dez amostras do cimento padrão acusaram um peso percentual médio
de cálcio de X1 = 90,0 , com desvio padrão S1 = 5,0 e 15 amostras do cimento misturado com
chumbo apresentaram um peso médio de cálcio de X 2 = 87,0 , com desvio padrão de S 2 = 4,0 .
Testar a hipótese de que 1 − 2 é maior zero, utilizando = 0,01 e supondo que ambas as
populações são normalmente distribuídos e têm o mesmo desvio padrão.
10. Dois técnicos de controle de qualidade mediram o acabamento da superfície de uma parte de
metal, cujos dados estão apresentados abaixo. Suponha que as medidas sejam normalmente
distribuídas. Testar a hipótese de que as medidas médias do acabamento da superfície obtidas
pelos dois técnicos são iguais. Usar = 0,01 e supor variâncias iguais.
Dados: X1 = 1,39 ; S 1 = 0,11 ; n1 = 7 ; X 2 = 1,18 ; S 2 = 0,12 ; n 2 = 8
11. Uma nova unidade de purificação é instalada em um processo químico. Antes de sua instalação,
uma amostra aleatória forneceu os seguintes dados sobre a porcentagem de impureza:
X1 = 9,85
S12 = 81,73
n1 = 10
Após a instalação, uma amostra aleatória resultou em:
X 2 = 8,08
S 22 = 78,46
n2 = 8
É possível concluir que o novo aparelho de purificação reduziu a porcentagem média de
impureza? Usar = 0,05 e supor que as populações são normais e variâncias populacionais
diferentes.
12. Dois tipos diferentes de máquina são usados para medir a força de resistência de uma fibra
sintética. Deseja-se saber se as duas máquinas fornecem os mesmos valores médios da força
de resistência. Oito espécimes de fibra são aleatoriamente selecionados e uma medida da
força é feita sobre cada espécime usando cada uma das máquinas.
107
Testar a hipótese de que não há diferença entre as duas máquinas quanto à força média de
= 0,05
resistência, .
Observação: Os dados nesse experimento foram emparelhados para evitar que diferenças entre
os espécimes de fibra (que podem ser substanciais) afetem o teste sobre a diferença das
máquinas.
13. Um operário realizou uma mesma operação com dois equipamentos diferentes, e os tempos
gastos (em segundos foram):
Equipamento A: 10 11 10 12 15
Equipamento B: 8 10 15 12
Existe diferença significativa entre as variâncias para os tempos gastos pelos dois equipamentos,
ao nível de 10%? Supor as populações normalmente distribuídas.
14. Foram testadas válvulas de marca A e verificou-se que os tempos de vida (em horas) foram:
1500 1450 1480 1520 1510. Sabendo-se que os tempos de vida das válvulas são normalmente
distribuídos, testar a hipótese de que a variância do tempo de vida é menor do que 700, ao nível
de 5% de significância.
108
TESTES DE ADERÊNCIA
INTRODUÇÃO
Os testes de aderência servem para testar hipóteses mais gerais sobre a distribuição dos
dados. A idéia básica é que, dada uma amostra aleatória de tamanho n, observada de uma
variável aleatória X , deseja-se testar:
H0 : X tem distibuiçã o f 0
Ei = n pi
onde:
O i é o número de observações ou frequência absoluta observada da classe A i ;
n é o número total de observações;
Sendo verdadeira a hipótese nula, a estatística acima tem distribuição assintótica de Qui-
quadrado com k − p − 1 graus de liberdade ( 2; k −p−1), onde k representa o número de classes e
p o número de parâmetros da distribuição da população, estimados a partir da amostra.
109
Gráficamente:
A.A
A.R
c2
Exemplos de aplicação:
1) Supõe-se que o número de defeitos nas placas de circuito impresso segue a distribuição de
Poisson. Uma amostra de 60 placas impressas foi coletada e observou-se o número de defeitos,
apresentados a seguir.
FREQUÊNCIA
NÚMERO DE
DEFEITOS OBSERVADA
0 32
1 15
2 9
3 4
No. DE NO. DE
DEFEITOS ( x i ) MÁQUINAS
p (X = xi )
0 32 0,53
1 15 0,25
2 9 0,15
3 4 0,07
TOTAL 60 1,00
110
A função de probabilidade da distribuição de Poisson é dada por:
e − x
P ( X = x) = , onde é a média.
x!
FREQUÊNCIA FREQUÊNCIA
NÚMERO DE ESPERADA
DEFEITOS OBSERVADA
0 32 60 0,472 = 28
1 15 60 0,354 = 21
2 9 60 0,133 = 8
3 4 60 0,041 = 3
A estatística do teste é:
n (O − Ei )
2
(32 − 28 ) 2 (15 − 21) 2 (9 − 8) 2 ( 4 − 3) 2
2 = = + + + = 2,74
i
i =1 Ei 28 21 8 3
Conclusão:
Como calc
2
= 2,74 é menor que 02,05; 2 g.l. = 5,99 , aceita-se a hipótese de que a forma da
distribuição de defeitos é Poisson.
2) Foram inspecionados 100 lotes de 3 peças cada um, sendo que o número X de peças
defeituosas por lote segue distribuição abaixo. Testar a hipótese de que a distribuição é binomial,
utilizando = 0,01 .
Solução:
111
O número médio (média ou valor esperado) de válvulas defeituosas observadas é
calculada por:
4
E( X) = x i p i , logo
i=1
65 30 4 1
E( X) = 0 + 1 + 2 + 3 = 0,41
100 100 100 100
Foram agrupadas as duas últimas classes, pois a frequência esperada da última classe é
menor do que 1.
0 0,6361 100x0,6361=64 65
1 0,3106 100x0,3106=31 30
2 0,0533 100x0,0533=5 5
Conclusão:
Como calc
2
= 0,05 é menor que 02,01;1g.l. = 6,64 , aceita-se a hipótese de que a forma da
distribuição de válvulas defeituosas é Binomial.
112
8.2 TESTE DE LILLIEFORS
O teste de Lilliefors é utilizado para verificar a aderência dos dados a uma distribuição
normal, sem a especificação de seus parâmetros, ou seja, a média e o desvio padrão são
calculados a partir da amostra.
As hipóteses são:
H0 : a amostra provém de uma população que segue uma distribuição normal
H1 : a amostra não provém de uma população que segue uma distribuição normal
Exemplos:
1) Um fabricante de autopeças está para fechar um grande contrato com a montadora. O ponto-
chave é a garantia da qualidade de seus produtos, especialmente do diâmetro (em mm) dos eixos
produzidos, que ele supõe seguir uma distribuição normal. Para realizar o teste, a montadora
selecionou uma amostra aleatória de 15 eixos, para testar as especificações a 5% de significância.
Os valores são apresentados a seguir.
113
2. Construção da função de distribuição acumulada F( x ) , para cada valor de x i . Cada valor de
diâmetro x i pode ser transformado em escore padronizado Z i . Por exemplo:
93,45 − 98,90
x 1 = 93,45 Z1 = = -1,47
3,70
A probabilidade acumulada até cada escore Z é obtida da tabela de áreas sob a curva
normal. Para Z 1 , tem-se:
F( X) = P( X Z1 ) = 0,0708
Com base nos dados apresentados, e utilizando nível de significância de 5%, é possível
usar gráfico de controle de média de Shewhart para monitorar o processo?
114
Solução:
H0 : a amostra provém de uma população que segue uma distribuição normal
H1 : a amostra não provém de uma população que segue uma distribuição normal
FREQ.
OBS. xi RELATIVA
S (xi ) Zi F( x i ) F( x i ) − S( x i−1 ) F( x i ) − S( x i )
1 0,03 0,04 0,040 -0,80 0,212 0,212 0,172
2 0,05 0,04 0,080 -0,79 0,214 0,174 0,134
3 0,19 0,04 0,120 -0,73 0,232 0,152 0,112
4 0,28 0,04 0,160 -0,69 0,244 0,124 0,084
5 0,31 0,04 0,200 -0,68 0,248 0,088 0,048
6 0,57 0,04 0,240 -0,56 0,285 0,085 0,045
7 0,63 0,04 0,280 -0,54 0,294 0,054 0,014
8 0,66 0,04 0,320 -0,53 0,299 0,019 0,021
9 0,66 0,04 0,360 -0,53 0,299 0,021 0,061
10 0,71 0,04 0,400 -0,50 0,306 0,054 0,094
11 0,75 0,04 0,440 -0,49 0,312 0,088 0,128
12 0,76 0,04 0,480 -0,48 0,314 0,126 0,166
13 0,85 0,04 0,520 -0,44 0,328 0,152 0,192
14 0,85 0,04 0,560 -0,44 0,328 0,192 0,232
15 0,99 0,04 0,600 -0,38 0,350 0,210 0,250
16 1,23 0,04 0,640 -0,28 0,389 0,211 0,251
17 1,41 0,04 0,680 -0,20 0,419 0,221 0,261
18 1,68 0,04 0,720 -0,09 0,465 0,215 0,255
19 2,18 0,04 0,760 0,13 0,551 0,169 0,209
20 3,01 0,04 0,800 0,49 0,686 0,074 0,114
21 3,52 0,04 0,840 0,71 0,760 0,040 0,080
22 4,89 0,04 0,880 1,30 0,903 0,063 0,023
23 5,48 0,04 0,920 1,55 0,940 0,060 0,020
24 5,94 0,04 0,960 1,75 0,960 0,040 0,000
25 9,49 0,04 1,000 3,28 0,999 0,039 0,001
média 1,88
DP 2,32
TAXAS DE
fi
OCTANAGEM
83,5 |--- 85,9 3
85,9 |--- 88,4 9
88,4 |--- 90,9 21
90,9 |--- 93,4 15
93,4 |--- 95,9 5
95,9 |--- 98,4 1
98,4 |--- 100,9 2
TOTAL 56
115
Verificar se amostra da taxa de octanagem provém de uma distribuição normal, utilizando nível de
significância de 5%.
2. O tempo necessário para se realizar certa operação industrial foi cronometrado (em segundos),
sendo feita 50 determinações. A média e o desvio padrão amostral são 46,32 e 7,44. A
distribuição de frequências encontra-se a seguir:
TEMPO
fi
(segundos)
32 |--- 36 5
36 |--- 40 7
40 |--- 44 5
44 |--- 48 14
48 |--- 52 8
52 |--- 56 3
56 |--- 60 8
TOTAL 50
Verificar se a amostra do tempo necessário para realizar a operação provém de uma distribuição
normal, utilizando = 0,01.
116
ANÁLISE DA VARIÂNCIA
Introdução
contra a hipótese alternativa de que, pelo menos uma dessas médias seja diferente das demais,
ou seja:
H1 : pelo menos uma média i .
Sejam as k amostras extraídas das populações, cujas médias serão testadas. A partir
dessas amostras, é possível estimar a variância 2 de três maneiras, conforme apresentados a
seguir.
POPULAÇÃO 1 POPULAÇÃO 2 POPULAÇÃO k
1 2 K
2
2
2
1) Variância Total ( S 2t )
117
Essa variância é estimada através de:
k nj
( xi j − X )
2
j=1i=1
S 2t =
N −1
Onde:
j é o número de amostras, j = 1, 2,...,k ;
k nj
xi j
j=1i=1
X= é a média de todas as amostras.
N
O numerador é denominado de Soma de Quadrados Total (SQT), então tem-se:
k nj
SQT = ( x i j − X ) 2
j=1i=1
k nj
( Xj − X )
2
j=1i=1
S 2e =
k −1
Onde:
nj
xi j
i=1
Xj = é a média da j-ésima amostra (j=1,2,...,k)
nj
Esta variância ( S2e ) é também chamada de Quadrado Médio Entre Amostras (QME).
O numerador é denominado de Soma de Quadrados entre Amostras (SQE), então tem-
se:
k nj
SQE = ( X j − X ) 2
j=1i=1
118
Para uma amostra qualquer j, a estimativa da variância é dada por:
nj
( xi j − X j )
2
i=1
S 2j =
nj −1
Onde:
R.A.
1− R.R.
119
O teste será sempre unilateral. O valor crítico de F será obtido para nível de significância
e ( k − 1) e ( N − k ) graus de liberdade, no numerador e denominador, respectivamente.
d) Cálculo da estatística F
S 2e
F=
S r2
Total SQT N −1
f) Conclusão
Exemplos da aplicação:
Solução:
120
Logo, faz-se necessário calcular inicialmente a média do conjunto de todas as amostras
(X) .
SOMAS
POSTOS DE n MÉDIAS
INDICES DE PRODUÇÃO (%) ( x i j )
TRABALHO ( xi ) ( Xj)
i=1
A 90,8 100 81,1 271,90 90,63
B 85,5 83 73,7 242,20 80,73
C 65,9 77,1 68,5 211,50 70,50
TOTAL 725,60 80,62
k nj
xi j
j=1i=1
A média do conjunto de todas as amostras será:
k nj
xi j
j=1i=1 725,6
X= = = 80,62
N 9
Então, tem-se:
SQT = ( 90,8 − 80,62 ) 2 + (100 ,0 − 80,62 ) 2 + (81,1 − 80,62 ) 2 + + (77,1 − 80,62 ) 2 + (68,5 − 80,62 ) 2
SQT = 932,78
k nj
SQE = ( X j − X ) 2
j=1i=1
e) Quadro da ANOVA
121
O valor de F tabelado é: F0,05; 2; 6 = 5,14
2) Em uma indústria, quatro operários executam uma mesma operação. Com o objetivo de
identificar se existe diferença entre os tempos gastos para executar a operação mencionada,
foram realizadas as seguintes observações desses tempos (em segundos):
Operário 1: 8,1 8,3 8,0 8,1 8,5
Operário 2: 8,4 8,4 8,5 8,3
Operário 3: 8,8 8,7 8,9
Operário 4: 8,3 8,4 8,2 8,2 8,3 8,4
Verificar se a diferença é significativa ao nível de 1% de significância.
Solução:
H0 : 1 = 2 = 3 = 4 =
H1 : pelo menos uma média i
k nj
xi j
j=1i=1
A média do conjunto de todas as amostras será:
k nj
xi j
j=1i=1 150,8
X= = = 8,4
N 18
Então, tem-se:
122
SQT = 0,98
k nj
SQE = ( X j − X ) 2
j=1i=1
OBS: Neste caso, cada ( X j − X ) 2 é multiplicado pelo seu respectivo tamanho de amostra.
SQE = 5 (8,2 − 8,4) 2 + 4 (8,4 − 8,4) 2 + 3 (8,8 − 8,4) 2 + 6 (8,3 − 8,4) 2
SQE = 0,74
k nj
SQR = ( x i j − X j ) 2
j=1i=1
SQR = 0,24
e) Quadro da ANOVA
Conclusão: Como F F0,01; 3; 14 , rejeita-se a hipótese H0 de que os tempos médios gastos para
A análise da variância serve para verificar se existe diferença significativa entre as médias;
porém, se houver diferenças, não é possível saber, através dela, quais as médias diferem entre
si. A identificação de diferenças entre médias, tomando-as duas a duas, deve ser feita usando
testes de comparações múltiplas entre médias.
1 1
= QMR (k − 1) + Fk −1,N−k, .
i
n n m
Exercícios de aplicação:
1) Para o exemplo dos índices de produção segundo diferentes postos de trabalho, verificar quais
médias são diferentes, utilizando = 0,05 .
Solução:
POSTOS DE MÉDIAS
TRABALHO ( Xj)
A 90,63
B 80,73
C 70,50
1 1
= QMR (k − 1) + Fk −1,N−k,
i
n n m
onde:
k = 3 ( postos de trabalho)
N−k = 9−3 = 6
= 0,05
n = 3 (tamanho da amostra para cada grupo)
324,90
QMR = = 54,15 ( do exemplo de aplicação no. 1)
6
F2, 6 ; 0,05 = 5,14
1 1
0,05 = 54,15 2 + 5,14 = 19,26
3 3
Portanto, tem-se:
124
POSTOS DE DIFERENÇA
DIFERENÇA DE MÉDIAS
TRABALHO SIGNIFICATIVA
AeB 90,63 − 80,73 = 9,90 19,26 Não
AeC 90,63 − 70,50 = 20,13 19,26 Sim
BeC 80,73 − 70,50 = 10,23 19,26 Não
Conclui-se, portanto, que os índices médios de produção dos postos de trabalho A e C são
diferentes, para nível de 5% de significância.
2) Para o exemplo de quatro operários que executam uma mesma operação em uma indústria,
aplicar o método de Scheffé, utilizando = 0,01.
Solução:
1 1
X i − X m = = QMR (k − 1) + Fk −1, N − k,
ni nm
k=4 (operadores)
N = 18
N − k = 18 − 4 = 14
= 0,01
n2 = 4
Substituindo os valores na expressão do teste de Scheffé:
1 1
= 0,0171 3 + 5,56 = 0,36
5 4
125
As médias dos operários 1 e 2 são: X1 = 8,2 e X 2 = 8,4 , portanto a diferença é
X1 − X 2 = 0,2 . Tem-se que X1 − X 2 = 0,2 = 0,36 , logo não há diferença entre as duas médias.
n1 = 5
n2 = 3
1 1
= 0,0171 3 + 5,56 = 0,39
5 3
n1 = 5
n2 = 6
1 1
= 0,0171 3 + 5,56 = 0,32
5 6
n1 = 4
n2 = 3
1 1
= 0,0171 3 + 5,56 = 0,41
4 3
n1 = 4
n2 = 6
1 1
= 0,0171 3 + 5,56 = 0,34
4 6
n1 = 3
n2 = 6
1 1
= 0,0171 3 + 5,56 = 0,38
3 6
Assim, tem-se:
126
OPERADORES Xi − Xm CONCLUSÃO
O tempo médio gasto para a execução do operador número 3 difere do tempo médio do
operador 1 e 4, ao nível de 1% de significância.
Pergunta-se: com relação ao rendimento, existe diferença significativa entre as máquinas ao nível
de 1% de significância? Aplicar o teste de Scheffé e concluir qual a máquina a ser adquirida.
2. Foram testados três tipos de lâmpadas elétricas e os tempos de vida (em horas) obtidos foram:
lâmpada A: 1.245 1.354 1.367 1.289
lâmpada B: 1.235 1.300 1.230 1.189
lâmpada C: 1.345 1.450 1.320
Existe diferença significativa entre os tempos médios de vida dessas três marcas de lâmpadas,
ao nível de significância de 1%? Se necessário, aplicar o teste de Scheffé.
5) A resistência de contato de um relé foi estudada para três materiais diferentes (todos eram
ligas, tendo prata como base). Os dados encontram-se a seguir.
128
ANÁLISE DE CORRELAÇÃO E REGRESSÃO SIMPLES
10.1 INTRODUÇÃO
100
80
60
40
20
0
2 7 12 17 22
A visualização do diagrama de dispersão possibilita ter uma boa ideia de como as duas
variáveis se correlacionam.
Diferentes formas de correlação podem existir entre as variáveis. O caso mais simples e
mais conhecido é a correlação linear simples, envolvendo duas variáveis, X e Y.
129
Este coeficiente mostra o grau de relacionamento entre as variáveis, fornecendo um número,
indicando como as variáveis variam conjuntamente. Não há a necessidade de definir as relações
de causa e efeito, ou seja, qual é a variável dependente e a independente.
Quando para maiores valores de X, existe uma tendência de obter maiores valores de Y,
diz-se que existe correlação linear positiva, conforme o gráfico 5, apresentado anteriormente.
Entretanto, pode ocorrer o inverso, ou seja, para maiores valores de X, existir uma tendência de
obter menores valores de Y, diz-se neste caso, que existe correlação linear negativa, conforme
o gráfico 6. Obviamente, existem muitos casos em que as variáveis não são correlacionadas
linearmente, isto é, a correlação linear é nula, como apresentado no gráfico 7.
GRÁFICO 6 – DIAGRAMA DE DISPERSÃO ENTRE AS VARIÁ- GRÁFICO 7 – DIAGRAMA DE DISPERSÃO ENTRE AS VARIÁ-
VEIS X E Y VEIS X E Y DE DISPERSÃO
DIAGRAMA
DIAGRAMA DE DISPERSÃO
Y Y
120 70
100 60
50
80
40
60
30
40
20
20
10
0
0
2 7 12 17 22
2 7 12 17
X
X
(X i − X)(Yi − Y )
n
r= i =1
(X i − X) (Yi − Y )
n 2 n 2
i =1 i =1
Exemplo de aplicação:
70
60
50
40
30
20
10
0
2 4 6 8 10 12 14
Quantidade de metal
A visualização do diagrama de dispersão possibilita ter uma boa idéia de como as duas
variáveis se relacionam, ou seja, qual a tendência de variação conjunta que apresentam. O gráfico
sugere a existência de uma relação linear entre as duas variáveis. Assim, calcular-se-á o
coeficiente de correlação linear de Pearson.
OBS. xi yi ( xi − X ) ( yi − Y ) ( x i − X )( y i − Y ) ( x i − X )2 ( y i − Y )2
1 6 10 -2,45 -25 61,25 6,00 625
2 4 10 -4,45 -25 111,25 19,80 625
3 6 20 -2,45 -15 36,75 6,00 225
4 8 20 -0,45 -15 6,75 0,20 225
5 7,5 30 -0,95 -5 4,75 0,90 25
6 8,5 40 0,05 5 0,25 0,00 25
7 9,5 45 1,05 10 10,50 1,10 100
8 11 50 2,55 15 38,25 6,50 225
9 12 60 3,55 25 88,75 12,60 625
10 12 65 3,55 30 106,50 12,60 900
84,5 350 465,00 65,73 3.600
MÉDIA 8,45 35
131
Tem-se que:
(X i − X)(Yi − Y )
n
r =
ˆ X,Y = i =1
(X i − X) (Yi − Y )
n 2 n 2
i =1 i =1
r =
ˆ X,Y = 465
= 0,9560
65,73 3.600
r n−2
t= ~ t n−2 .
1− r 2
Exemplo de aplicação:
Seja o exemplo do processo de recobrimento de uma determinada peça com metal. Tem-se que
o coeficiente de correlação estimado é r = 0,9560 . Testar a hipótese de que a correlação
populacional é diferente de zero, utilizando nível de significância de 5%.
As hipóteses são:
H0 : = 0 (Correlação populacional é igual a zero)
H1 : 0 (Correlação populacional é diferente de zero)
A estatística t é:
r n−2 0,9560 10 − 2
t= = = 9,22
1− r 2
1 − 0,95602
132
10.4 ANÁLISE DE REGRESSÃO LINEAR SIMPLES
Análise de regressão linear simples é uma técnica de modelagem utilizada para analisar a
relação entre uma variável dependente (Y) e uma variável independente X .
O objetivo dessa técnica é identificar uma função que descreve, o mais próximo possível,
a relação entre essas variáveis e assim poder predizer o valor que a variável dependente (Y) irá
assumir para um determinado valor da variável independente X.
O modelo de regressão poderá ser expresso como:
Y = + X +
Y
34
32
30
28
26
24
22
20
20 22 24 26 28 X
30
Verifica-se no gráfico que nem todos os pontos tocam a reta, e essa diferença é o erro (),
mas supõe-se que em média esses erros tendem a se anular, ou seja:
E ( i ) = 0
Ao estabelecer o modelo de regressão linear simples, deve-se pressupor que:
1) os erros ( i ) têm distribuição normal;
2) os erros ( i ) são independentes;
3) i é uma variável aleatória com média igual a zero, isto é, E ( i ) = 0 ;
4) A variância de i é igual a 2 para todos os valores de X.
Uma vez escolhido o modelo de regressão, deve-se estimar os seus parâmetros, neste
caso, os coeficientes da equação da reta, e . Isso pode ser feito a partir da aplicação do
Método dos Mínimos Quadrados. Neste método, a soma dos erros quadráticos (isto é, a soma
dos quadrados da distância vertical entre as observações e a reta ajustada) é mínima.
133
Os parâmetros e são estimados através dos dados amostrais e a reta estimada será
da forma:
Ŷ = a + bX
Seja e i a distância da reta ajustada aos pontos amostrais, o método dos mínimos
quadrados minimiza a soma de ei2 , ou seja:
n n n
e i2 = ( y i − ŷ i ) 2 = ( y i − a − bx i ) 2
i=1 i=1 i=1
A solução analítica do sistema de equações fornece os valores de " a" e " b" , como
apresentados a seguir.
a = Y − bX
n
( x i − X) y i
i=1
b=
n
( x i − X) 2
i=1
Exemplos de aplicação:
1) Seja o processo de recobrimento de uma determinada peça com metal. O recobrimento é feito
com metal fundido.
X= quantidade utilizada de metal fundido (em gramas);
Y = porcentagem de recobrimento obtida (%).
134
Ajustar um modelo de regressão linear simples aos dados:
Solução:
X = 8,45
Y = 35
n
( x i − X )2 = 65,725
i=1
n
( xi − X ) yi = 465,00
i=1
n
( x i − X) y i
i=1 465,00
Logo, b = n
= = 7,0749
65,725
( x i − X) 2
i=1
OBS. xi yi ŷ i
1 6 10 17,7
2 4 10 3,5
3 6 20 17,7
4 8 20 31,8
5 7,5 30 28,3
6 8,5 40 35,4
7 9,5 45 42,4
8 11 50 53,0
9 12 60 60,1
10 12 65 60,1
135
O gráfico a seguir, apresenta o diagrama de dispersão e a função linear ajustada.
60
50
40
30
20
10
0
0 5 10 15
Quantidade de metal fundido
10.4.2.1TESTE t
Lembrando que o modelo é Y = + X + , deve-se testar as hipóteses:
H0 : = 0
H1 : 0
b−
t := , que segue distribuição t com n-2 graus de liberdade.
S2
S XX
Tem-se que:
S YY − bS XY
S2 = , que é a estimativa de 2
n−2
n
Onde: S XX = ( x i − X) 2
i=1
n
S YY = ( y i − Y ) 2
i=1
n n
n
xi yi
S XY = x i y i − i=1 i
i=1 n
136
10.4.2.2 ANÁLISE DA VARIÂNCIA
Ŷ = a + bX
yi
( y i − Y) ( y i − ŷ i )
Y
( Y − ŷ i )
137
FONTE DE SOMA DOS
G.L. QUADRADO MÉDIO F
VARIAÇÃO QUADRADOS
S YY − b S XY
Residual SQR = S YY − b S XY n−2 QMR = QME
n−2 F=
QMR
Total SQT = S YY n −1
Exemplo de aplicação:
Solução:
Para obter as somas dos quadrados faz-se necessário os seguintes cálculos:
OBS. xi yi xi yi ( xi − X ) ( yi − Y ) ( x i − X )2 ( y i − Y )2 ( xi − X ) ( yi − Y )
1 6 10 60,0 -2,45 -25 6,0 625 61,25
2 4 10 40,0 -4,45 -25 19,8 625 111,25
3 6 20 120,0 -2,45 -15 6,0 225 36,75
4 8 20 160,0 -0,45 -15 0,2 225 6,75
5 7,5 30 225,0 -0,95 -5 0,9 25 4,75
6 8,5 40 340,0 0,05 5 0,0 25 0,25
7 9,5 45 427,5 1,05 10 1,1 100 10,5
8 11 50 550,0 2,55 15 6,5 225 38,25
9 12 60 720,0 3,55 25 12,6 625 88,75
10 12 65 780,0 3,55 30 12,6 900 106,5
Total 84,5 350 3.422,5 65,70 3.600 465,00
a) Teste “t”
H0 : = 0
H1 : 0
Tem-se que:
138
n
S XX = ( x i − X) 2 = 65,70
i=1
n
S YY = ( y i − Y ) 2 = 3.600
i=1
n n
xi yi
n 84,5 350
S XY = x i y i − i=1 i
= 3.422,5 − = 465
i=1 n 10
b− 7,075 − 0
t= = = 9,21 , que segue distribuição t com n-2 graus de liberdade.
S2 38,7656
S XX 65,70
b) ANOVA
n
SQT = S YY = ( y i − Y ) 2 = 3.600
i=1
SQE = b SXY ,
n
sendo que: S XY = ( x i − X )( y i − Y ) = 465
i =1
b = 7,0749 (já calculado)
SQR = S YY − b S XY
Tem-se que F0,05;1, 8 = 5,32 , logo, conclui-se que a regressão de Y sobre X é significativa,
139
10.4.3 COEFICIENTE DE DETERMINAÇÃO OU EXPLICAÇÃO
2
Um outro indicador utilizado constantemente é o coeficiente de determinação, R , que
indica quantos por cento a variação explicada pela regressão representa da variação total. Este
varia entre 0 e 1. Quanto mais próximo de 1, maior é a explicação pelo modelo da variação total.
A expressão de R 2 é dada por:
SQE
R2 =
SQT
SQE 3.289,829
R2 = = = 0,9138
SQT 3.600,000
2) Foi realizada uma experiência relacionando os alongamentos de uma mola (cm) com as
cargas aplicadas (kg). Os resultados obtidos foram:
Carga (kg) 3 4 5 6 7 8 9 10
Alongamento (cm) 4,0 4,8 5,6 6,7 7,9 9,0 9,8 11,0
OBS. xi yi ( xi − X ) ( x i − X )2 ( xi − X ) yi
1 3 4,0 -3,5 12,25 -14,00
2 4 4,8 -2,5 6,25 -12,00
3 5 5,6 -1,5 2,25 -8,40
4 6 6,7 -0,5 0,25 -3,35
5 7 7,9 0,5 0,25 3,95
6 8 9,0 1,5 2,25 13,50
7 9 9,8 2,5 6,25 24,50
8 10 11,0 3,5 12,25 38,50
Total 52 58,8 0 42,00 42,70
Média 6,5 7,35
140
X = 6,5
Y = 7,35
n
( xi − X )2 = 52
i=1
n
( xi − X ) yi = 42,70
i=1
n
( xi − X ) yi 42,70
i=1
Logo, b = n
= = 1,01667
42
( xi − X ) 2
i=1
Tem-se que:
OBS. xi yi ŷ i
1 3 4,0 3,8
2 4 4,8 4,8
3 5 5,6 5,8
4 6 6,7 6,8
5 7 7,9 7,9
6 8 9,0 8,9
7 9 9,8 9,9
8 10 11,0 10,9
10
0
0 2 4 6 8 10 12
Carga
141
OBS. xi yi ( xi − X ) ( yi − Y ) ( x i − X )2 ( y i − Y )2 ( x i − X ) (y i − Y)
1 3 4,0 -3,5 -3,35 12,25 11,2225 11,725
2 4 4,8 -2,5 -2,55 6,25 6,5025 6,375
3 5 5,6 -1,5 -1,75 2,25 3,0625 2,625
4 6 6,7 -0,5 -0,65 0,25 0,4225 0,325
5 7 7,9 0,5 0,55 0,25 0,3025 0,275
6 8 9,0 1,5 1,65 2,25 2,7225 2,475
7 9 9,8 2,5 2,45 6,25 6,0025 6,125
8 10 11,0 3,5 3,65 12,25 13,3225 12,775
Total 52 58,8 42,00 43,56 42,70
Média 6,5 7,35
n
SQT = S YY = ( y i − Y ) 2 = 43,56
i=1
SQE = b S XY ,
n
sendo que S XY = ( x i − X )( y i − Y ) = 42,70
i =1
b = 1,01667 (já calculado)
SQR = S YY − b S XY
Tem-se que F0,05; 1, 6 = 5,99 , logo, conclui-se que a regressão de Y sobre X é significativa,
c) Coeficiente de determinação
SQE
R2 =
SQT
142
SQE 43,4117
R2 = = = 0,9966
SQT 43,5600
Graficamente, tem-se:
FUNÇÃO POTÊNCIA
Y
85
80
75
70
65
60 0 1
55
50
45
40
140 240 340 440 540
ˆ
Ŷ = ˆ X
ˆ
Para ajustar uma curva geométrica Ŷ = ˆ X , a um conjunto de pontos ( xi , yi ) , pode-se
fazer através da seguinte transformação, considerando Y 0 e X 0 :
Ẑ = Â + ̂T
onde:
Ẑ = ln Ŷ
 = ln ˆ
T = ln X
Os parâmetros A e são estimados através dos dados amostrais e a reta estimada será
da forma:
143
Ẑ = Â + ̂ T
 = Z − ̂ T
n
(t i − T) z i
ˆ = i=1
n
(t i − T)2
i=1
Para obter a estimativa do modelo na sua forma original, faz-se a transformação inversa
dos coeficientes  e B̂ . Tem-se então que:
 = ln ˆ , logo,
ˆ = e Â
E a função potência estimada será:
ˆ
Ŷ = ˆ X
SQE = ̂ STZ
n
onde: STZ = ( ti − T )( zi − Z )
i=1
Total SQT = S ZZ n −1
144
Se Fcalculado F;1, n − 2 (tabelado) , rejeita-se H0 e conclui-se que a regressão de Y sobre X
é significativa.
O coeficiente de determinação, R 2 , que indica quantos por cento a variação explicada pela
regressão representa da variação total. Este varia entre 0 e 1. Quanto mais próximo de 1, maior
é a explicação pelo modelo da variação total. A expressão de R 2 é dada por:
SQE
R2 =
SQT
CARROS X Y
1 215 13,2
2 201 13,7
3 196 14,1
4 226 12,9
5 226 12,3
6 348 11,1
7 226 13,1
8 348 11,2
Solução:
a) Diagrama de dispersão
145
Fazendo as transformações de variáveis necessárias, tem-se:
n
( ti − T ) zi
ˆ = i=n1 =
- 0,1362
= -0,3674
0,3709
( ti − T )2
i=1
O modelo ajustado é:
Ẑ = Â + ˆ T = 4,5550 − 0,3674 T
146
b) Utilizando a ANOVA para testar a significância da regressão:
SQE = ̂ S TZ
n
onde: S TZ = ( t i − T )( z i − Z ) = -0,1362
i=1
SOMA DOS
FONTE DE VARIAÇÃO G.L. QUADRADO MÉDIO F
QUADRADOS
Devido à regressão 0,0500 1 0,0500 70,38
Residuo 0,0043 6 0,0007
Total 0,0543 7
Tem-se que F0,05 ;1; 6 = 5,99 . Como F = 70,38 F0,05 ;1; 6 = 5,99 , conclui-se que a regressão de
Y sobre X é significativa, ao nível de 5% de significância.
SQE 0,0500
R2 = = = 0,9214
SQT 0,0543
Graficamente, tem-se:
147
FUNÇÃO EXPONENCIAL
Y
200
180
160
140
120
100
80
60
40
20
0
0 5 10 15
1
X
O modelo estimado é:
ˆ ˆ X
Ŷ =
Ẑ = ln Ŷ
 = ln ˆ
B̂ = ln ˆ
Assim, reduz-se ao problema de ajuste de uma reta aos pontos ( x i , z i ) , onde z i = ln y i .
Os parâmetros A e B são estimados através dos dados amostrais e a reta estimada será da
forma:
Ẑ = Â + B̂ X
i =1
Para obter a estimativa do modelo na sua forma original, faz-se a transformação inversa
dos coeficientes  e B̂ . Tem-se então que:
 = ln ˆ , logo,
ˆ = e Â
B̂ = ln ˆ , logo, ˆ = e B̂
148
10.6.2 TESTES DE HIPÓTESES NA REGRESSÃO
O coeficiente de determinação, R 2 , que indica quantos por cento a variação explicada pela
regressão representa da variação total. Este varia entre 0 e 1. Quanto mais próximo de 1, maior
é a explicação pelo modelo da variação total. A expressão de R 2 é dada por:
SQE
R2 =
SQT
Exemplo:
1) Seja o processo de recobrimento de uma determinada peça com metal. O recobrimento é feito
com metal fundido.
Solução:
OBS. xi yi z i = ln( y i ) ( xi − X ) ( x i − X )2 ( xi − X ) zi
1 6,0 10 2,3026 -2,45 6,00 -5,6413
2 4,0 10 2,3026 -4,45 19,80 -10,2465
3 6,0 20 2,9957 -2,45 6,00 -7,3395
4 8,0 20 2,9957 -0,45 0,20 -1,3481
5 7,5 30 3,4012 -0,95 0,90 -3,2311
6 8,5 40 3,6889 0,05 0,00 0,1844
7 9,5 45 3,8067 1,05 1,10 3,9970
8 11,0 50 3,9120 2,55 6,50 9,9757
9 12,0 60 4,0943 3,55 12,60 14,5349
10 12,0 65 4,1744 3,55 12,60 14,8191
SOMA 84,5 350 65,73 15,7045
MÉDIA 8,45 35 3,3674
i =1
150
a.3) O modelo ajustado na forma exponencial é:
ˆ ˆ X = 3,8524 1,2699X
Ŷ =
OBS. xi yi ŷ i
1 6,0 10 16,16
2 4,0 10 10,02
3 6,0 20 16,16
4 8,0 20 26,05
5 7,5 30 23,12
6 8,5 40 29,36
7 9,5 45 37,29
8 11,0 50 53,36
9 12,0 60 67,76
10 12,0 65 67,76
70
60
50
40
30
20
10
0
2 4 6 8 10 12 14
151
Calculando-se a soma dos quadrados tem-se:
n
SQT = ( z i − Z ) 2 = 4,3177
i =1
SQE = B̂S XZ
n
onde: S XZ = ( x i − X )( z i − Z ) = 15,7045
i=1
Quadro da ANOVA
FONTE DE SOMA DE GRAUS DE QUADRADO
VARIAÇÃO QUADRADOS LIBERDADE MÉDIO F
Explicada 3,7525 1 3,7525
53,11
Residual 0,5652 8 0,0706
Total 4,3177 9
Tem-se que F0,05;1; 8 = 5,32 . Como F = 53,11 F0,05 ;1; 8 = 5,32 , conclui-se que a regressão de
Y sobre X é significativa, ao nível de 5% de significância.
SQE 3,7525
R2 = = = 0,8691
SQT 4,3177
Peso 12 13 14 14 16 18 19 22 24 26
Rendimento 16 14 14 13 11 12 09 09 08 06
Pede-se:
152
e) Qual das três funções ajustadas é a melhor? Comente?
2) Um estudo foi desenvolvido para verificar o quanto o comprimento de um cabo da porta serial
de microcomputadores influencia na qualidade da transmissão de dados, medida através do
número de falhas em 100.000 lotes de dados transmitidos (taxa de falha). Os resultados foram:
Comp. do 8 8 9 9 10 10 11 11 12
Cabo (m)
Taxa de 2,2 2,1 3,0 2,9 4,1 4,5 6,2 5,9 9,8
Falha
Comp. do 12 13 13 14 14 15
Cabo (m)
Taxa de 8,7 12,5 13,1 19,3 17,4 28,2
Falha
Pede-se:
a) calcular o coeficiente linear de Pearson e testar a significância ao nível de 5%.
b) ajustar a função linear e testar a existência de regressão, adotando = 0,05 . Qual é o
coeficiente de explicação da função linear?
c) ajustar a função potencial e testar a existência de regressão, adotando = 0,05 . Qual é o
coeficiente de explicação da função potencial?
d) ajustar a função exponencial e testar a existência de regressão, adotando = 0,05 . Qual é o
coeficiente de explicação da função exponencial?
e) Qual das três funções ajustadas é a melhor? Comente.
153
ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA
11 INTRODUÇÃO
O modelo estatístico de uma regressão linear múltipla, sendo Y a variável dependente e,
as k ( k 1) variáveis independentes X1 , X 2 , X k , será dado por:
Y = 0 + 1X1 + 2 X2 + + k Xk +
Na forma matricial:
Y = X +
Ŷ = b0 + b1X1 + b 2 X2 + + bk Xk
As estimativas b 0 , b1 , b 2 ,, b k dos coeficientes β0, β1, β2, ...,βk , podem ser calculadas pelo
método dos mínimos quadrados, partindo de hipóteses análogas àquelas adotadas para
regressão linear simples.
Adotando-se a forma matricial, as estimativas dos coeficientes, são obtidas através de:
b = ( XX) −1 X Y
b 0 Y1 1 X 11 X 12 ... X 1 k
b Y2 1 X 21 X 22 ... X 2 k
Onde: b = 1 ; Y= ; X=
b k Yn 1 X n 1 Xn 2 ... X n k
Y = 0 + 1 X 1 + 2 X 2 +
b = ( XX) −1 X Y
154
Y1 1 X11 X12
b 0
Onde: b = b1 ;
Y 1 X 21 X 22
Y = 2 ; X =
b 2
Yn 1 X n1 X n2
FONTE DE
SOMA DOS QUADRADOS G.L. QUADRADO MÉDIO F
VARIAÇÃO
SQE
Explicada SQE = b1S YX1 + b 2S YX2 2 QME =
2
SQR QME
Residual SQR = S YY − b1S YX1 − b 2S YX2 n−3 QMR = F=
n−2 QMR
Total SQT = S YY n −1
2
n
yi
= yi −
n
2 i=1
onde: S YY , sendo a variância de Y.
i=1 n
n n
y i x 1i
S YX1 = ( y i x 1i ) −
n i=1 i=1
, que é a covariância entre Y e X 1
i=1 n
n n
y i x 2i
S YX 2 = ( y i x 2 i ) −
n i=1 i=1
, que é a covariância entre Y e X 2
i=1 n
Exemplos:
1) Um estudo foi realizado sobre o desgaste de um mancal, Y, e sua relação com X1=viscosidade
do óleo e X2=carga. Os seguintes dados foram obtidos:
155
yi x 1i x 2i
Solução:
243
1 1,6 851
230
1 15,5 816
172 1 22,0 1058
91 1 43,0 1021
58 1 33,0 1357
Y= X=
125 1 40,0 1115
190 1 35,0 918
256 1 13,0 834
1 11,0 845
256 1 8,9 820
240
1 1 1 1 1 1 1 1 1 1
X = 1,6 15,5 22,0 43,0 33,0 40,0 35,0 13,0 11,0 8,9
851 816 1058 1021 1357 1115 918 834 845 820
- 0,0883 0,7187 − 0,3378 − 0,2057 − 1,5122 0,1394 1,0123 0,5086 0,3594 0,4056
( XX)−1X = − 0,0167 0,0036 − 0,0060 0,0102 − 0,0141 0,0127 0,0209 − 0,0010 − 0,0043 − 0,0051
0,0006 − 0,0007 0,0006 0,0001 0,0020 − 0,0003 − 0,0014 − 0,0004 − 0,0002 − 0,0002
508,6320
−1
b = ( XX) X Y = - 1,2114
- 0,3011
156
O modelo estimado é: Ŷ = 508,6320 − 1,2114X1 − 0,3011X 2
OBS. yi x 1i x 2i y i x1i y i x 2i y i2
1 243 1,6 851 388,8 206.793 59.049
2 230 15,5 816 3.565,0 187.680 52.900
3 172 22,0 1058 3.784,0 181.976 29.584
4 91 43,0 1201 3.913,0 109.291 8.281
5 58 33,0 1357 1.914,0 78.706 3.364
6 125 40,0 1115 5.000,0 139.375 15.625
7 190 35,0 918 6.650,0 174.420 36.100
8 256 13,0 834 3.328,0 213.504 65.536
9 256 11,0 845 2.816,0 216.320 65.536
10 240 8,9 820 2.136,0 196.800 57.600
SOMA 1861 223,0 9.815 33.494,8 1.704.865 393.575
MÉDIA 186,1 22,3 981,5
2
n
y i
n
i=1 1.8612
S YY = yi −
2
= 393.575 - = 47.242,9
i=1 n 10
SQT = S YY = 47.242,9
n n
y i x 1i
n
i=1 i=1 1.861 223
S YX1 = ( y i x 1i ) − = 33.494,8 - = -8.005,5
i=1 n 10
n n
y i x 2 i
n
i=1 i=1 1.861 9.815
S YX2 = (y i x 2i ) − = 1.704.865 - = -121.706,5
i=1 n 5
FONTE DE QUADRADO
SOMA DOS QUADRADOS G.L. F
VARIAÇÃO MÉDIO
Explicada SQE = 46.343,6899 2 QME = 2.3171,84
157
Conclusão: Como F calculado é igual a 180,38 e é maior que F0,05 ; 2,7 = 4,74 , conclui-se
que a regressão é significativa, ao nível de 5% de significância.
yi x 1i x 2i
145 151 70
210 221 91
193 215 92
229 247 122
195 243 79
Solução:
145 1 151 70
210 1 221 91 1 1 1 1 1
Y = 193 ; X = 1 215 92 ;
X = 151 221 215 247 243
229 1 247 122 70 91 92 122 79
195 1 243 79
22,4821
−1
b = ( XX) X Y = 0,4957
0,7175
158
O modelo estimado é: Ŷ = 22,4821+ 0,4957X1 + 0,7175X 2
yi x 1i x 2i y i x1i y i x 2i y i2
OBS.
1 145 151 70 21.895 10.150 21.025
2 210 221 91 46.410 19.110 44.100
3 193 215 92 41.495 17.756 37.249
4 229 247 122 56.563 27.938 52.441
5 195 243 79 47.385 15.405 38.025
SOMA 972 1077 454 213.748 90.359 192.840
MÉDIA 194,4 215,4 90,8
SQT = S YY = 3.883,2
n n
y i x 1i
n
i=1 i=1 972 1077
S YX1 = ( y i x 1i ) − = 213.748 - = 4.379,2
i=1 n 5
n n
y i x 2 i
n
i=1 i=1 972 454
S YX2 = (y i x 2i ) − = 90.359 - = 2.101,4
i=1 n 5
FONTE DE QUADRADO
SOMA DOS QUADRADOS G.L. F
VARIAÇÃO MÉDIO
Explicada SQE = 3.678,5239 2 QME = 1839,262
Conclusão: Como F calculado é igual a 17,97 e é maior que F0,10 ; 2,2 = 9,00 , conclui-se que a
regressão é significativa, ao nível de 10% de significância.
X2 6 7 6 7 6 8 8 7 8
2) Um estudo realizado para investigar a relação entre a variável resposta relativa a quedas de
pressão em uma coluna de bolhas de uma chapa térmica e os previsores X1 = velocidade do fluído
superficial e X 2 = viscosidade do líquido, gerou os dados a seguir.
160
CONTROLE ESTATÍSTICO DO PROCESSO
12 INTRODUÇÃO
Se um produto deve atender as exigências do cliente, em geral, deve ser produzido por um
processo que seja estável ou replicável. Ou melhor, o processo deve ser capaz de operar com
pequena variabilidade em torno das dimensões-alvo ou nominais, das características da qualidade
do produto. O controle estatístico do processo (CEP) é um conjunto de ferramentas poderoso, útil
para obter estabilidade do processo e melhoria da capacidade através da redução da variabilidade.
O CEP pode ser aplicado a qualquer processo.
Então, a linha central, o limite superior de controle e o limite inferior de controle se tornam:
LSC = w + L w
LC = w
LIC = w − L w
onde L é a distância dos limites de controle à linha central, expressa em unidades de desvio padrão.
Usualmente utiliza-se três-sigma, sendo assim L=3. Os limites três sigmas são comumente
utilizados nos Estados Unidos.
A teoria geral dos gráficos de controle foi proposta, inicialmente pelo Dr. Walter A. Shewhart.
Os gráficos de controle desenvolvidos segundo esses princípios são chamados gráficos de
controle de Shewhart.
161
12.2 GRÁFICO DE CONTROLE PARA VARIÁVEIS
Neste caso, controla-se normalmente, tanto o valor médio como a sua variabilidade, através
de gráficos separados.
Estes parâmetros devem ser estimados com base em pelo menos 20 a 25 amostras, sendo
cada uma de tamanho 4 ou 5.
Seja X1, X 2 ,..., Xn elementos de uma amostra aleatória de um processo que está sob
investigação. Então, tem-se:
n
Xi
i=1 X1 + X 2 + ... + X n
X= =
n n
E, sejam X1, X 2 ,..., X m as médias de cada uma das m amostras. Então, o melhor estimador
de , a média do processo, é a média geral, isto é:
m
Xi
j=1 X1 + X 2 + ... + X m
X= = ,
m m
m
Ri
j=1 R + R 2 + ... + R m
R= = 1
m m
Com base na normalidade, calcula-se os limites de controle três sigmas para o gráfico de
̅.
controle de X
162
LC = ̿X linha central
̿ + A2 R
LSC = X ̅ limite superior de controle
LIC = ̿X - A2 R
̅ limite inferior de controle
Onde:
X̿ é a média das m amostras
̅ é a amplitude média das m amostras
R
A2 é constante tabelado em função do tamanho da amostra n.
̅
LC=R linha central
̅
LSC=D4 R limite superior de controle
̅
LIC=D3 R limite inferior de controle
Onde:
̅ é a amplitude média das m amostras
R
D3 e D 4 são constantes tabelados em função do tamanho da amostra n.
Exemplo 1:
A tabela que se segue lista a quantidade de energia elétrica (em kWh) de certa residência.
Gráfico de controle de ̅
X
LC = ̿X = 2687,5333
̿ + A2 R
LSC = X ̅ = 2687,5333+1,023×1232,20=3948,0739
LIC = ̿X - A2 R
̅ = 2687,5333 -1,023×1232,20=1426,9927
Gráfico de controle de R
LC = ̅
R =1232,20
̅ = 2,575×1232,20 = 3172,915
LSC=D4 R
̅ = 0×1232,20=0
LIC=D3 R
164
Exemplo 2:
A tabela a seguir fornece dados sobre medidas de diâmetros de rolamentos de esferas usados nas
rodas de equipamento pesado de construção. Doze amostras, cada uma de tamanho quatro, são
extraídas diretamente da linha de produção. As amostras são provenientes de todos os três turnos,
e nenhuma amostra contém dados de mais de um turno. Use esses dados para construir gráficos
X e R, e para verificar se o processo está estável. Suponha que as medidas dos diâmetros sejam
normalmente distribuídas.
Solução:
X1 + X 2 + ... + X n
X=
n
R=Xmáximo -Xmínimo
OBSERVAÇÕES ̅j
AMOSTRA X Rj
1 2 3 4
1 15,155 15,195 15,145 15,125 15,155 0,070
2 15,095 15,162 15,168 15,163 15,147 0,073
3 15,142 15,150 15,168 15,152 15,153 0,026
4 15,132 15,168 15,154 15,146 15,150 0,036
5 15,172 15,188 15,178 15,194 15,183 0,022
6 15,174 15,166 15,186 15,194 15,180 0,028
7 15,166 15,178 15,192 15,184 15,180 0,026
8 15,172 15,187 15,193 15,180 15,183 0,021
9 15,182 15,198 15,185 15,195 15,190 0,016
10 15,170 15,150 15,192 15,180 15,173 0,042
11 15,186 15,194 15,175 15,185 15,185 0,019
12 15,178 15,192 15,168 15,182 15,180 0,024
SOMA 182,0590 0,4030
MÉDIA 15,1716 0,0336
165
∑m
j=1 Xj 182,0590
X= = = 15,171583
m 12
m
R j
j=1 0,4030
R= = = 0,033583
m 12
Gráfico de controle de X
LC = ̿X = 15,171583
̿ + A2 R
LSC = X ̅ = 15,171583 + 0,729×0,033583 = 15,196065
LIC = ̿X - A2 R
̅ = 15,171583 - 0,729×0,033583 = 15,147101
Gráfico de controle de R
LC = ̅
R =0,0336
̅ =2,282×0,0336=0,0767
LSC=D4 R
̅ = 0×0,0336=0
LIC=D3 R
166
Eficiência de R em relação a S
p(1 − p)
LIC = p − 3
n
LC = p
p (1 − p)
LSC = p + 3
n
167
Exemplo 1:
Usa-se um gráfico de controle para a fração de não conformes de uma parte plástica fabricada em
um processo de moldagem por injeção. Dez subgrupos fornecem os seguintes dados:
Estabeleça um gráfico de controle para a fração de não conformes em amostra de n=100.
No. DE NÃO
AMOSTRA
CONFORMES
1 10
2 15
3 31
4 18
5 24
6 12
7 23
8 15
9 8
10 8
Solução:
p = 0,164
LC = p = 0,164
p(1 − p) 0,164 (1 − 0,164 )
LIC = p − 3 = 0,164 − 3
n 100
LIC = 0,0529
p(1 − p) 0,164 (1 − 0,164 )
LSC = p + 3 = 0,164 + 3
n 100
LSC = 0,2751
168
Exemplo 2:
Um processo que produz cárter para mancais é controlado por um gráfico de controle para a fração
de não conformes, usando tamanho de amostra n=100 e uma linha central p = 0,02 .
a) Ache os limites três-sigma para esse gráfico;
b) Analise as dez novas amostras (n=100) mostrada para controle estatístico. Que conclusões
podem ser tiradas sobre o processo?
No. DE NÃO
AMOSTRA
CONFORMES
1 5
2 2
3 3
4 8
5 4
6 1
7 2
8 6
9 3
10 4
Solução:
a) p = 0,02
LC = 0,02
p̅ ×(1 - p̅ ) 0,02×0,98
LIC=p̅ - 3√ =0,02 - 3√ =0,02-3×0,014= - 0,022
n 100
p̅ ×(1 - p̅ ) 0,02×0,98
LSC=p̅ + 3√ =0,02+ 3√ =0,02+3×0,014= 0,062
n 100
169
b)
No. DE NÃO p̂i No. DE NÃO p̂i
AMOSTRA AMOSTRA
CONFORMES CONFORMES
1 5 0,05 7 2 0,02
2 2 0,02 8 6 0,06
3 3 0,03 9 3 0,03
4 8 0,08 10 4 0,04
5 4 0,04 SOMA 0,38
6 1 0,01
p= 0,038
AMOSTRA x1 x2 x3 AMOSTRA x1 x2 x3
1 0,0629 0,0636 0,0640 14 0,0645 0,0640 0,0631
2 0,0630 0,0631 0,0622 15 0,0619 0,0644 0,0632
3 0,0628 0,0631 0,0633 16 0,0631 0,0627 0,0630
4 0,0634 0,0630 0,0631 17 0,0616 0,0623 0,0631
5 0,0619 0,0628 0,0630 18 0,0630 0,0630 0,0626
6 0,0613 0,0629 0,0634 19 0,0636 0,0631 0,0629
7 0,0630 0,0639 0,0625 20 0,0640 0,0635 0,0629
8 0,0628 0,0627 0,0622 21 0,0628 0,0625 0,0616
9 0,0623 0,0626 0,0633 22 0,0615 0,0625 0,0619
10 0,0631 0,0631 0,0633 23 0,0630 0,0632 0,0630
11 0,0635 0,0630 0,0638 24 0,0635 0,0629 0,0635
12 0,0623 0,0630 0,0630 25 0,0623 0,0629 0,0630
13 0,0635 0,0631 0,0630
Construir os gráficos de controle X e R para esse processo. O processo está sob controle?
2. A tabela apresenta, 20 subgrupos de cinco medidas, de uma dimensão crítica de uma peça
produzida por um processo de usinagem.
AMOS- AMOS-
TRA x1 x2 x3 x4 x5 TRA x1 x2 x3 x4 x5
1 138,1 110,8 138,7 137,4 125,4 11 139,6 127,9 151,1 143,7 110,5
2 149,3 142,1 105,0 134,0 92,3 12 125,3 160,2 130,4 152,4 165,1
3 115,9 235,6 124,2 155,0 117,4 13 145,7 101,8 149,5 113,3 151,8
4 118,5 116,5 130,2 122,6 100,2 14 138,6 139,0 131,9 140,2 141,1
5 108,2 123,8 117,1 142,4 150,9 15 110,1 114,6 165,1 113,8 139,6
6 102,8 112,0 135,0 135,0 145,8 16 145,2 101,0 154,6 120,2 117,3
7 120,4 84,3 112,8 118,5 119,3 17 125,9 135,3 121,5 147,9 105,0
8 132,7 151,1 124,0 123,9 105,1 18 129,7 97,3 130,5 109,0 150,5
9 136,4 126,2 154,7 127,1 173,2 19 123,4 150,0 161,6 148,4 154,2
10 135,0 115,4 149,1 138,3 130,4 20 144,8 138,3 119,6 151,8 142,7
Construir gráficos de controle X e R para esse processo. O processo está sob controle?
170
3. Os dados apresentados a seguir são a média e a amplitude de 24 amostras de tamanho 5
tomadas de um processo de produção de eixos. Calcular os limites de controle para o gráfico da
média e para o gráfico da amplitude.
4. A tabela abaixo apresenta as medidas dos diâmetros internos (mm) de anéis de pistão de
motores de automóveis.
AMOSTRA X1 X2 X3 X4 X5
1 74,030 74,002 74,019 73,992 74,008
2 73,995 73,992 74,001 74,011 74,004
3 73,988 74,024 74,021 74,005 74,002
4 74,002 73,996 73,993 74,015 74,009
5 73,992 74,007 74,015 73,989 74,014
6 74,009 73,994 73,997 73,985 73,993
7 73,995 74,006 73,994 74,000 74,005
8 73,985 74,003 73,993 74,015 73,988
9 74,008 73,995 74,009 74,005 74,004
10 73,998 74,000 73,990 74,007 73,995
11 73,994 73,998 73,994 73,995 73,990
12 74,004 74,000 74,007 74,000 73,996
13 73,983 74,002 73,998 73,997 74,012
14 74,006 73,967 73,994 74,000 73,984
15 74,012 74,014 73,998 73,999 74,007
16 74,000 73,984 74,005 73,998 73,996
17 73,994 74,012 73,986 74,005 74,007
18 74,006 74,010 74,018 74,003 74,000
19 73,984 74,002 74,003 74,005 73,997
20 74,000 74,010 74,013 74,020 74,003
21 73,982 74,001 74,015 74,005 73,996
22 74,004 73,999 73,990 74,006 74,009
23 74,010 73,989 73,990 74,009 74,014
24 74,015 74,008 73,993 74,000 74,010
25 73,982 73,984 73,995 74,017 74,013
Construir os gráficos de controle de X e de R.
5. Usa-se um gráfico de controle para a fração não conforme de uma parte plástica fabricada em
um processo de moldagem por injeção. Dez amostras fornecem os seguintes dados:
(Continua)
TAMANHO NÚMERO DE
AMOSTRA DA NÃO
AMOSTRA CONFORMES
1 100 10
2 100 15
3 100 31
4 100 18
5 100 24
6 100 12
171
(Conclusão)
TAMANHO NÚMERO DE
AMOSTRA DA NÃO
AMOSTRA CONFORMES
7 100 23
8 100 15
9 100 8
10 100 8
6. Os dados que seguem apresentam os resultados da inspeção de todas as unidades de
computadores produzidos durante os últimos 10 dias. O processo parece estar sob controle?
UNIDADES UNIDADES
DIA INSPECIONADAS NÃO
( ni ) CONFORMES
1 80 4
2 110 7
3 90 5
4 75 8
5 130 6
6 120 6
7 70 4
8 125 5
9 105 8
10 95 7
Obs: Calcular os limites de controle para cada n i .
8. Um altímetro é considerado defeituoso se não pode ser calibrado ou corrigido para fornecer
leituras precisas (dentro de 20 fit, ou aproximadamente 6,10 metros de altitude real). Uma empresa
produz altímetros em lotes de 100, e cada altímetro é testado e se determina se é aceitável ou
defeituoso. A seguir, estão listados os números de altímetros defeituosos em lotes sucessivos de
100. Construa um gráfico de controle para a proporção p de altímetros defeituosos e determine se
o processo está sob controle estatístico.
LOTES 1 2 3 4 5 6 7 8 9 10 11 12
ALTÍMETROS
DEFEITUOSOS
2 0 1 3 1 2 2 4 3 5 3 7
172
BIBLIOGRAFIA
173
TABELAS
174
TABELA A1.2 – ÁREAS SOB A CURVA NORMAL
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
175
TABELA A2 - DISTRIBUIÇÃO ‘ t ’ DE STUDENT
TESTE UNILATERAL
P 0,550 0,600 0,650 0,700 0,750 0,800 0,850 0,900 0,950 0,975 0,990 0,995
1 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,657
2 0,142 0,289 0,445 0,617 0,817 1,061 1,386 1,886 2,920 4,303 6,965 9,925
3 0,137 0,277 0,424 0,584 0,765 0,979 1,250 1,638 2,353 3,182 4,541 5,841
4 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604
5 0,132 0,267 0,408 0,559 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032
6 0,131 0,265 0,404 0,553 0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707
7 0,130 0,263 0,402 0,549 0,711 0,896 1,119 1,415 1,895 2,365 2,998 3,500
8 0,130 0,262 0,400 0,546 0,706 0,889 1,108 1,397 1,860 2,306 2,897 3,355
9 0,129 0,261 0,398 0,544 0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250
10 0,129 0,260 0,397 0,542 0,700 0,879 1,093 1,372 1,813 2,228 2,764 3,169
11 0,129 0,260 0,396 0,540 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106
12 0,128 0,259 0,395 0,539 0,696 0,873 1,083 1,356 1,782 2,179 2,681 3,055
13 0,128 0,259 0,394 0,538 0,694 0,870 1,080 1,350 1,771 2,160 2,650 3,012
14 0,128 0,258 0,393 0,537 0,692 0,868 1,076 1,345 1,761 2,145 2,625 2,977
15 0,128 0,258 0,393 0,536 0,691 0,866 1,074 1,341 1,753 2,131 2,603 2,947
16 0,128 0,258 0,392 0,535 0,690 0,865 1,071 1,337 1,746 2,120 2,584 2,921
17 0,128 0,257 0,392 0,534 0,689 0,863 1,069 1,333 1,740 2,110 2,567 2,898
18 0,127 0,257 0,392 0,534 0,688 0,862 1,067 1,330 1,734 2,101 2,552 2,878
19 0,127 0,257 0,391 0,533 0,688 0,861 1,066 1,328 1,729 2,093 2,540 2,861
20 0,127 0,257 0,391 0,533 0,687 0,860 1,064 1,325 1,725 2,086 2,528 2,845
21 0,127 0,257 0,391 0,533 0,686 0,859 1,063 1,323 1,721 2,080 2,518 2,831
22 0,127 0,256 0,390 0,532 0,686 0,858 1,061 1,321 1,717 2,074 2,508 2,819
23 0,127 0,256 0,390 0,532 0,685 0,858 1,060 1,320 1,714 2,069 2,500 2,807
24 0,127 0,256 0,390 0,531 0,685 0,857 1,059 1,318 1,711 2,064 2,492 2,797
25 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,316 1,708 2,060 2,485 2,787
26 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779
27 0,127 0,256 0,389 0,531 0,684 0,855 1,057 1,314 1,703 2,052 2,473 2,771
28 0,127 0,256 0,389 0,530 0,683 0,855 1,056 1,313 1,701 2,048 2,467 2,763
29 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756
30 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,310 1,697 2,042 2,457 2,750
40 0,127 0,255 0,388 0,529 0,681 0,851 1,050 1,303 1,684 2,021 2,423 2,705
50 0,126 0,255 0,388 0,528 0,679 0,849 1,047 1,299 1,676 2,009 2,403 2,678
60 0,126 0,255 0,387 0,527 0,679 0,848 1,046 1,296 1,671 2,000 2,390 2,660
70 0,126 0,254 0,387 0,527 0,678 0,847 1,044 1,294 1,667 1,994 2,381 2,648
80 0,126 0,254 0,387 0,527 0,678 0,846 1,043 1,292 1,664 1,990 2,374 2,639
90 0,126 0,254 0,387 0,526 0,677 0,846 1,042 1,291 1,662 1,987 2,369 2,632
100 0,126 0,254 0,386 0,526 0,677 0,845 1,042 1,290 1,660 1,984 2,364 2,626
200 0,126 0,254 0,386 0,525 0,676 0,843 1,039 1,286 1,653 1,972 2,345 2,601
300 0,126 0,254 0,386 0,525 0,675 0,843 1,038 1,284 1,650 1,968 2,339 2,592
400 0,126 0,254 0,386 0,525 0,675 0,843 1,038 1,284 1,649 1,966 2,336 2,588
0,126 0,253 0,385 0,524 0,675 0,842 1,036 1,282 1,645 1,960 2,326 2,576
P 0,100 0,200 0,300 0,400 0,500 0,600 0,700 0,800 0,900 0,950 0,980 0,990
TESTE BILATERAL
176
TABELA A3 - DISTRIBUIÇÃO DE 2
P 0,005 0,010 0,025 0,050 0,100 0,250 0,750 0,900 0,950 0,975 0,990 0,995
1 0,000 0,000 0,001 0,004 0,016 0,102 1,323 2,706 3,842 5,024 6,635 7,879
2 0,010 0,020 0,051 0,103 0,211 0,575 2,773 4,605 5,992 7,378 9,210 10,597
3 0,072 0,115 0,216 0,352 0,584 1,213 4,108 6,251 7,815 9,348 11,345 12,838
4 0,207 0,297 0,484 0,711 1,064 1,923 5,385 7,779 9,488 11,143 13,277 14,860
5 0,412 0,554 0,831 1,146 1,610 2,675 6,626 9,236 11,071 12,833 15,086 16,750
6 0,676 0,872 1,237 1,635 2,204 3,455 7,841 10,645 12,592 14,449 16,812 18,548
7 0,989 1,239 1,690 2,167 2,833 4,255 9,037 12,017 14,067 16,013 18,475 20,278
8 1,344 1,647 2,180 2,733 3,490 5,071 10,219 13,362 15,507 17,535 20,090 21,955
9 1,735 2,088 2,700 3,325 4,168 5,899 11,389 14,684 16,919 19,023 21,666 23,589
10 2,156 2,558 3,247 3,940 4,865 6,737 12,549 15,987 18,307 20,483 23,209 25,188
11 2,603 3,054 3,816 4,575 5,578 7,584 13,701 17,275 19,675 21,920 24,725 26,757
12 3,074 3,571 4,404 5,226 6,304 8,438 14,845 18,549 21,026 23,337 26,217 28,300
13 3,565 4,107 5,009 5,892 7,042 9,299 15,984 19,812 22,362 24,736 27,688 29,820
14 4,075 4,660 5,629 6,571 7,790 10,165 17,117 21,064 23,685 26,119 29,141 31,319
15 4,601 5,229 6,262 7,261 8,547 11,037 18,245 22,307 24,996 27,488 30,578 32,801
16 5,142 5,812 6,908 7,962 9,312 11,912 19,369 23,542 26,296 28,845 32,000 34,267
17 5,697 6,408 7,564 8,672 10,085 12,792 20,489 24,769 27,587 30,191 33,409 35,719
18 6,265 7,015 8,231 9,391 10,865 13,675 21,605 25,989 28,869 31,526 34,805 37,157
19 6,844 7,633 8,907 10,117 11,651 14,562 22,718 27,204 30,144 32,852 36,191 38,582
20 7,434 8,260 9,591 10,851 12,443 15,452 23,828 28,412 31,410 34,170 37,566 39,997
21 8,034 8,897 10,283 11,591 13,240 16,344 24,935 29,615 32,671 35,479 38,932 41,401
22 8,643 9,543 10,982 12,338 14,042 17,240 26,039 30,813 33,924 36,781 40,289 42,796
23 9,260 10,196 11,689 13,091 14,848 18,137 27,141 32,007 35,173 38,076 41,638 44,181
24 9,886 10,856 12,401 13,848 15,659 19,037 28,241 33,196 36,415 39,364 42,980 45,559
25 10,520 11,524 13,120 14,611 16,473 19,939 29,339 34,382 37,653 40,647 44,314 46,928
26 11,160 12,198 13,844 15,379 17,292 20,843 30,435 35,563 38,885 41,923 45,642 48,290
27 11,808 12,879 14,573 16,151 18,114 21,749 31,528 36,741 40,113 43,195 46,963 49,645
28 12,461 13,565 15,308 16,928 18,939 22,657 32,621 37,916 41,337 44,461 48,278 50,993
29 13,121 14,257 16,047 17,708 19,768 23,567 33,711 39,088 42,557 45,722 49,588 52,336
30 13,787 14,954 16,791 18,493 20,599 24,478 34,800 40,256 43,773 46,979 50,892 53,672
35 17,192 18,509 20,569 22,465 24,797 29,054 40,223 46,059 49,802 53,203 57,342 60,275
40 20,707 22,164 24,433 26,509 29,051 33,660 45,616 51,805 55,759 59,342 63,691 66,766
45 24,311 25,901 28,366 30,612 33,350 38,291 50,985 57,505 61,656 65,410 69,957 73,166
50 27,991 29,707 32,357 34,764 37,689 42,942 56,334 63,167 67,505 71,420 76,154 79,490
55 31,735 33,571 36,398 38,958 42,060 47,611 61,665 68,796 73,312 77,381 82,292 85,749
60 35,535 37,485 40,482 43,188 46,459 52,294 66,982 74,397 79,082 83,298 88,379 91,952
65 39,383 41,444 44,603 47,450 50,883 56,990 72,285 79,973 84,821 89,177 94,422 98,105
70 43,275 45,442 48,758 51,739 55,329 61,698 77,577 85,527 90,531 95,023 100,425 104,215
75 47,206 49,475 52,942 56,054 59,795 66,417 82,858 91,062 96,217 100,839 106,393 110,286
80 51,172 53,540 57,153 60,392 64,278 71,145 88,130 96,578 101,880 106,629 112,329 116,321
85 55,170 57,634 61,389 64,749 68,777 75,881 93,394 102,079 107,522 112,393 118,236 122,325
90 59,196 61,754 65,647 69,126 73,291 80,625 98,650 107,565 113,145 118,136 124,116 128,299
95 63,250 65,898 69,925 73,520 77,818 85,376 103,899 113,038 118,752 123,858 129,973 134,247
100 67,328 70,065 74,222 77,930 82,358 90,133 109,141 118,498 124,342 129,561 135,807 140,170
110 75,550 78,458 82,867 86,792 91,471 99,666 119,608 129,385 135,480 140,917 147,414 151,949
177
TABELA A4 - DISTRIBUIÇÃO ‘F’ DE SNEDECOR
Nível de significância de 1%
1 1 2 3 4 5 6 7 8 12 24
2
1 4.052,18 4.999,50 5.403,35 5.624,58 5.763,65 5.858,99 5.928,36 5.981,07 6.106,32 6.234,63 6.365,83
2 98,50 99,00 99,17 99,25 99,30 99,33 99,36 99,37 99,42 99,46 99,50
3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,05 26,60 26,13
4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,37 13,93 13,46
5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 9,89 9,47 9,02
6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,72 7,31 6,88
7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,47 6,07 5,65
8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,67 5,28 4,86
9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,11 4,73 4,31
10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,71 4,33 3,91
11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,40 4,02 3,60
12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,16 3,78 3,36
13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 3,96 3,59 3,17
14 8,86 6,51 5,56 5,04 4,70 4,46 4,28 4,14 3,80 3,43 3,00
15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,67 3,29 2,87
16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,55 3,18 2,75
17 8,40 6,11 5,19 4,67 4,34 4,10 3,93 3,79 3,46 3,08 2,65
18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,37 3,00 2,57
19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,30 2,92 2,49
20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,23 2,86 2,42
21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,17 2,80 2,36
22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,12 2,75 2,31
23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,07 2,70 2,26
24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,03 2,66 2,21
25 7,77 5,57 4,68 4,18 3,86 3,63 3,46 3,32 2,99 2,62 2,17
26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 2,96 2,58 2,13
27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 2,93 2,55 2,10
28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 2,90 2,52 2,06
29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 2,87 2,49 2,03
30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 2,84 2,47 2,01
40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,66 2,29 1,80
60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,50 2,12 1,60
120 6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,34 1,95 1,38
6,63 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,18 1,79 1,01
178
TABELA A5 - DISTRIBUIÇÃO ‘F’ DE SNEDECOR
Nível de significância de 5%
179
TABELA A6 - DISTRIBUIÇÃO ‘F’ DE SNEDECOR
180
TABELA A7 - VALORES CRÍTICOS ( dc ) PARA TESTE DE LILLIERFORS
n = 5% = 1%
4 0,381 0,417
5 0,337 0,405
6 0,319 0,364
7 0,300 0,348
8 0,285 0,331
9 0,271 0,311
10 0,258 0,294
11 0,249 0,284
12 0,242 0,275
13 0,234 0,268
14 0,227 0,261
15 0,220 0,257
16 0,213 0,250
17 0,206 0,245
18 0,200 0,239
19 0,179 0,235
20 0,190 0,231
25 0,173 0,200
30 0,161 0,187
0,886 1,031
n 30 dc = dc =
n n
181
SOLUÇÕES DAS LISTAS DE EXERCÍCIOS
2. a) k = n = 30 = 5,48 6
A t = X máx − X min = 81,3 − 29,8 = 51,5
h=9
3. a) k = n = 40 = 6,32 7
A t = X máx − X min = 59 − 31 = 28
h=4
4. X = 74,004 ; Me = 74,0035 ; Mo = 74,005 ; DM = 0,0030 ; S = 0,0047 ; CV = 0,0063%
2. P( x = 2 b) = 0,4945 ou 49,45%
3. a) P( b e b ) = 0,5526 ou 55,26%
b) P( d e d ) = 0,0526 ou 5,26%
c) P(1 peça boa e 1 peça defeituosa ) = P(b e d) + P( d e b) = 0,3948 ou 39,48%
5. P( x = 1) = 0,4320 ou 43,20%
6. a) P( X 3) = 0,6976 ou 69,76%
b) P( X 2) = 1 − 0,0428 = 0,9572
8. R = 0,8664 ou 86,64%
182
9. R = 0,9975 ou
10. P ( A 1 | Q) = 0,5882 ou 58,82%
11. a) P( A / qualidadea ceitável ) = 0,3821 38,21 %
b) P(qualidade aceitável | C) = 0,9167 ou 91,67%
c) P(B | qualidade m arg inal ) = 0,2500 ou 25,00%
12. P(B) = 0,0235 = 2,35 %
1. E( X) = 12,5
V( X) = 1,85
2. a) E( X) = 5,4
b) V( X) = 2,44
c) = 2,44 = 1,562
3. a) P( X 5) = 0,37
b) média=4 funcionarão mais de 3 meses
20 − 4 = 16 lâmpadas deverão ser substituídas
4. a) P( X = 5) = 0,2373 ou 23,73%
b) = 3,75
4. P( X = 0) = 0,6690 ou 66,90%
6. a) P( X = 3) = 0,1404 = 14,04%
b) P( X 3) = 0,1247 = 12,47 %
7. a) P( X 2) = 0,1117 = 11,17 %
b) P( X 49 ) = 4,51 x10 −48
8. a) P( x 9) = 0,4068 = 40,68 %
b) P( x 2) = 0,0001 = 0,01%
9. a) P( x 2)0,1247 = 12,47%
b) P( x = 8) = 0,0653 = 6,53%
c) P(5 x 8) = 0,4914 = 49,14%
1. P( X 1) = 0,6065
2. P( X 0,9) = 0,5934
3. P( X 2) = 0,3679
4. a) E( X) = 6.000
V(X) = 2.518.500
b) P(5000 X 7000 ) = 2,043 %
5. a) E( X) = 3,3234
b) P( X 10 ) = 8,11 %
6. P( X 35 ) = 0,9938
7. P(2 X 2,05 ) = 0,3944
183
8. P( X 772 ) = 0,9902
9. a) P( 40 X 70 ) = 0,6568
b) x = 40,80
10. x 5,03
11. a) P( X 1,97 ) ou P( X 2,03 ) = 0,0027
b) Perfeitas = 1 − 0,0027 = 0,9973
12. n=816
13. P(24,85 X 25,15 ) = 0,9192
1. a) P16,60 19,94 = 95 %
b) P 3,0269 2 19,0949 = 95 %
c) P 1,7399 4,3677 = 95 %
2. (74,0353 74,0367 )
5. a) (8,213 8,247 )
b) ( 0,0005 2 0,0022 )
c) ( 0,02 0,05 )
6. (0,05 p 0,19 )
7. (0,06 p 0,08 )
8. (0,02 p 0,06 )
9. (0,10 p 0,22 )
10. 6,66 1 − 2 8,34
11. 2,24 2 − 1 3,56
12. − 0,48 1 − 2 0,58
13. a) 1,62 1 − 2 8,38
b) 0,43 1 − 2 9,57
15. n = 60
16. n = 664
17. n = 139
18. n = 52
1. Z calc = 1,52
184
2. t calc = 1,05
3. t calc = 2,07
4. Z calc = −0,21
5. Z calc = −0,06
6. Z calc = 4,13
7. t calc = −0,63
8. t calc = −0,63
9. t calc = 1,66
14. calc
2
= 4,40
1) d = 0,2034
2) d = 0,1440
3. F = 0,09
4. F = 5,69 ; Teste de Scheffé: O método 3 difere dos métodos 1 e 2.
5. F = 45,75 ; Teste de Scheffé: O tipo de liga 3 difere dos tipos 1 e 2.
185
3. a) Ŷ = 36,60 + 3,8286 X ; Fcalc = 76,08 ; R 2 = 95,01%
b) Ŷ = 39,1557 X 0,2146 ; Fcalc = 37,55 ; R 2 = 90,37 %
c) Ŷ = 37,758 1,0807 X ; Fcalc = 65,40 ; R 2 = 94,24 %
186