Bioestatística
Distribuição Normal
Departamento de Matemática
FEIS - UNESP
Distribuição Normal
A distribuição normal é uma das mais importantes distribuições contínuas pois
representa boa aproximação para muitos fenômenos da natureza e é utilizada
em muitas técnicas estatísticas, como:
• Calcular aproximadamente as probabilidades para outras distribuições,
como por exemplo, para a distribuição Binomial.
• A aplicação dessa distribuição no teorema do limite central;
• Alguns testes de hipótese que exigem a normalidade dos dados;
• análise de variância;
• Análise de regressão;
2
Área total = 1
Distribuição Normal
Propriedades:
• A representação gráfica recebe o nome de curva normal e possui forma de
sino com simetria em torno da média, , que se localiza no centro da
distribuição;
= med = mod
• A variável aleatória contínua X pode assumir todo e qualquer valor real;
• A área total sob a curva normal é igual a 1;
• A curva normal aproxima-se mais do eixo x à medida em que se afasta da
média, mas nunca toca o eixo;
3
Distribuição Normal
Propriedades:
• A média e o desvio padrão determinam o aspecto da curva normal;
Localização do eixo escreve quanto os dados se
de simetria espalham em torno da média
• Nos primeiros desvios a direita e esquerda da média encontra-se os pontos
de inflexão da curva normal;
4
Tipos de Curva Normal
Observe que as duas curvas são centrados na mesma posição que é a média,
pois , mas a curva com o maior desvio padrão é menor e se espalha
mais e, a com menor desvio padrão, será a mais baixa e mais larga.
5
Tipos de Curva Normal
Observe que as duas curvas são idênticas na forma, pois possuem o mesmo
desvio padrão, mas possuem médias diferentes e, portanto são centradas em
diferentes posições.
6
Tipos de Curva Normal
Observe que as duas curvas possuem médias diferentes e, portanto são
centradas em diferentes posições e também possuem desvios padrões
diferentes.
7
Distribuição Normal
Uma variável aleatória contínua X tem distribuição normal com média μ e
variância , X N(μ, ), se sua função de densidade é dada por:
X .
8
Distribuição Normal
Portanto a probabilidade de que um valor esteja compreendido entre x1 e x2 é
dada por:
9
Distribuição Normal
Características:
• E(X) = e VAR(X) = ;
• Como a área total sob a
curva é igual a 1 e a
distribuição é simétrica a
partir da média que se
encontra no ponto central
da curva cada metade da
curva tem 0,5 da área
total.
10
Distribuição Normal
Distribuição dos Dados:
11
Distribuição Normal Padrão
Gauss um critério de padronização, ou seja, no qual uma distribuição normal
com média e desvio padrão , N(μ, ), torna-se uma distribuição normal,
com média, µ = 0, e desvio padrão, σ = 1, N(0,1), denominada distribuição
normal padrão.
Se Z é uma variável aleatória normal com média zero, µ = 0, e variância um,
= 1, então Z é denominado escore padrão e é dado por:
12
Distribuição Normal Padrão
Então como , temos:
Logo , ou seja a média da distribuição z é zero.
A variância de uma distribuição de probabilidade é dada por:
13
Distribuição Normal Padrão
Como temos o , nos resta encontrar :
Então
14
Distribuição Normal Padrão
15
Distribuição Normal Padrão
Para encontrar a probabilidade de que um valor esteja compreendido entre x1 e
x2 na distribuição normal, basta utilizar o conceito de escore padrão e
transformação as variáveis aleatória x na distribuição normal em variáveis
aleatórias z na distribuição normal padrão, ou seja:
Como
tem-se uma distribuição normal padrão µ = 0 e σ = 1. Logo
16
Distribuição Normal
Com:
17
Tabela da Distribuição Normal Padrão
A tabela de distribuição normal
padrão fornece os valores de área
acumulada referentes a curva normal
padrão. A áreas são encontradas para
um valor entre o valor de escore z
igual a zero e um valor de escore zc.
A tabela fornece dados de área
acumulada para os valores de Z
positivo. Pela simetria da curva tem-
se que os valores de área acumulada
para os valores de Z negativos são os
mesmos.
18
Tabela da Distribuição Normal Padrão
Exemplo:
Encontrar P(0 < Z < 1,13).
Este valor é encontrada através da
interseção da linha que contem o
número 1,1 e a coluna com o número 3.
P(0 < Z < 1,13) = 0,3708 = 37,08%
19
Tabela da Distribuição Normal Padrão
Exemplo:
Encontrar P(Z > 1,84).
Queremos a área que se encontra a direita
de zc, então devemos fazer:
P( Z > 1,84) = 0,5 - P(0 < Z < 1,84) =
= 0,5 – 0,4671 = 0,0329 = 3,29%
20
Tabela da Distribuição Normal Padrão
Exemplo:
Encontrar P(-1,97 < Z < 0,86).
P(-1,97 < Z < 0,86) =
= P(-1,97 < Z < 0) + P(0 < Z < 0,86) =
= P(0 < Z < 1,97) + P(0 < Z < 0,86) =
= 0,4756 + 0,3051 = 0,7807 = 78,07%
21
Tabela da Distribuição Normal Padrão
Exemplo:
Encontrar P(0,8 < Z < 1,23).
P(0,8 < Z < 1,23) =
= P(0 < Z < 1,23) - P(0 < Z < 0,8) =
= 0,3907 - 0,2881 = 0,1026 = 10,26%
22
Tabela da Distribuição Normal Padrão
Exemplo:
Encontrar P(Z < 0,92).
P( Z < 0,92) =
= 0,5 + P(0 < Z < 0,92) =
= 0,5 + 0,3212 = 0,8212 = 82,12%
23
Tabela da Distribuição Normal Padrão
Exemplo:
Encontrar P(Z > k) = 0,3015
Encontrar z dado que o valor de área acumulada
é 0,3015. Temos que verificar o valor de área
acumulada entre (0, k) então temos que fazer:
0,5 – 0,3015 = 0,1985
Procurar este valor dentro da tabela. K = 0,52
24
Tabela da Distribuição Normal Padrão
Regra:
Procurar dentro da tabela o valor de área acumulada.
• Encontrando o valor verifique qual é o valor do escore padrão z que
representa o valor de área acumulada.
• Se não encontrar o valor pegar o valor do escore padrão z com valor de
área acumulada mais próxima da área esperada;
• Se existir mais de um escore padrão com a mesma distância do valor de
área esperada determinar a média entre os escores padrão que possuem a
mesma distância.
25
Tabela da Distribuição Normal Padrão
Exemplo:
Encontrar P(k < Z < -0,18)= 0,4197
Encontrar o valor de área
acumulada entre (-0,18, 0) e somar
com 0,4197 para encontrar o valor
total de área para determinar k.
= 0,4197 + 0,0714 = 0,4911
Na tabela temos
k = - 2,37
26
Tabela da Distribuição Normal Padrão
Exemplo:
Dado que X tem um distribuição normal com μ = 300 e σ = 50, encontre a
probabilidade que X assume valores maior que 362.
27
Tabela da Distribuição Normal Padrão
Exemplo: μ = 300 , σ = 50
P(x > 362) = ?
P(x > 362) = P(z > 1,24)
P(x > 362) = P(z > 1,24) = 0,5 - 0,3925 = 0,1075
28
Tabela da Distribuição Normal Padrão
Exemplo:
O tempo gasto no exame vestibular de uma universidade tem distribuição
normal com média 120 minutos e desvio padrão 15 minutos.
a) Sorteando-se um aluno ao acaso, qual é probabilidade dele terminar o
exame antes de 100 minutos?
μ = 120 , σ = 15 P(x < 100) = ?
P(x < 100) = P(z < -1,33) = 0,5 - 0,4082 = 0,0918
29
Tabela da Distribuição Normal Padrão
Exemplo:
b) Qual deve ser o tempo de prova de modo que permita o 95% dos
vestibulandos terminem no prazo estipulado?
P(x < k) = 0,95
30
Tabela da Distribuição Normal Padrão
Primeiro devemos verificar o valor de
área entre (0, k). Então 0,95 - 0,5 = 0,45
Procurar 0,45 de área acumulada.
Observe que existem dois valores
próximos, z1 = 1,64 e z2 = 1,65. Então
devemos determinar a média
z = (1,64 + 1,65)/2 = 1,645
31
Tabela da Distribuição Normal Padrão
Temos que:
então
= 144,675
O tempo de prova deverá ser de 144,675 minutos.
32
Aproximação da Binomial pela Normal
Podemos utilizar a distribuição normal que é uma distribuição contínua para
aproximar a distribuição binomial que é uma distribuição discreta.
• A ideia é utilizar a distribuição normal para aproximar a distribuição binomial
quando n (número de repetições do experimento), for grande e p (ou q)
(probabilidade de sucesso) for pequena ou estar próxima de 0,5.
• Para observar esta relação entre n e p na distribuição binomial tomemos
uma análise para duas situações:
1. p = 0,5 e q = 0,5;
2. p = 0,2 e q = 0,8;
variando o número de repetições do experimento.
33
Aproximação da Binomial pela Normal
n=1 p = 0,5, q = 0,5
0,6
0,5
x p(x) 0,4
0,3
0 0,5 0,2
0,1
1 0,5 0
0 0,2 0,4 0,6 0,8 1 1,2
p = 0,2, q = 0,8
1
0,8
0,6
x p(x) 0,4
0 0,8 0,2
0
1 0,2 0 0,2 0,4 0,6 0,8 1 1,2
34
Aproximação da Binomial pela Normal
n = 10 p = 0,5, q = 0,5
x p(x)
0 0,00097656
0,3
1 0,00976563 0,25
2 0,04394531 0,2
3 0,1171875 0,15
4 0,20507813 0,1
5 0,24609375 0,05
6 0,20507813 0
7 0,1171875 0 2 4 6 8 10 12
8 0,04394531
9 0,00976563
10 0,00097656
35
Aproximação da Binomial pela Normal
n = 10 p = 0,2, q = 0,8
x p(x)
0 0,10737418
0,35
1 0,26843546
0,3
2 0,30198989 0,25
3 0,20132659 0,2
4 0,08808038 0,15
5 0,02642412 0,1
6 0,00550502 0,05
0
7 0,00078643 0 2 4 6 8 10 12
8 7,3728E-05
9 4,096E-06
10 1,024E-07
36
Aproximação da Binomial pela Normal
Profa. Mara Lúcia Martins Lopes 37
Aproximação da Binomial pela Normal
Observe que quando p = 0,5 e q = 0,5 para n = 10 já podemos ver a
normalidade da distribuição, mas para p = 0,2 e q = 0,8 temos que a
distribuição tem o comportamento assimétrico à direita (positivo). O mesmo irá
acontecer se p = 0,8 e q = 0,2 porém a assimetria será à esquerda (negativa).
Mas ao passo que n aumento, ou seja, para n = 50 pode-se observar que a
distribuição que antes era assimétrica (p = 0,2 e q = 0,8) se tornou simétrica.
Portanto, quando o número de repetições do experimento é grande a
distribuição do conjunto de dados torna-se simétrica. Se observarmos
podemos notar que a simetria acontece quando é satisfeita a seguinte
condição
np ≥ 5 e n(1 − p) ≥ 5
38
Aproximação da Binomial pela Normal
Então, uma boa aproximação da distribuição binomial pela distribuição normal
ocorre somente quando
np ≥ 5 e n(1 − p) ≥ 5
No qual a distribuição normal terá as seguintes características:
sendo que p é a probabilidade de sucesso, q é a probabilidade de fracasso e n
é a quantidade de repetições do experimento na distribuição binomial.
39
Aproximação da Binomial pela Normal
A distribuição binomial pode ser representada pelo histograma de
probabilidade e os valores de probabilidade são calculados através das áreas
do retângulos representados no histograma.
40
Correção pela Continuidade
Observe que para determinar a probabilidade na distribuição binomial
no ponto x = c, ele corresponde a área no histograma da distribuição
binomial. Se aproximarmos a distribuição binomial pela distribuição
normal é necessário que a mesma área seja representada na curva
normal.
Desta forma, temos que identificar os valores que a variável aleatória
x = c deverá assumir para ter a representação da área na distribuição
normal.
Este processo é denominado CORREÇÃO PELA CONTINUIDADE que
consiste mover 0,5 unidade para a esquerda e direita do ponto médio
para incluir todos os possíveis valores x no intervalo
41
Correção pela Continuidade
42
Aproximação da Binomial pela Normal
Exemplo: Estudo do Sindicato de Bancários indica que cerca de 30% dos
funcionários de banco têm problemas de estresse, provenientes das condições
de trabalho. Numa amostra de 200 bancários, qual seria a probabilidade de
pelo menos 50 com essa doença?
A variável aleatória x: quantidade de funcionários com estresse (discreta)
p = 0,30, q = 0,70 e n = 200 (distribuição binomial)
P( x ≥ 50) = ?
Vamos verificar se a distribuição binomial pode ser aproximada pela curva
normal com variável aleatória y, então
np = 200*0,30 = 60 > 5 e nq = 200*0,70 = 140 > 5 (aproximação curva normal)
43
Aproximação da Binomial pela Normal
= np = 200*0,30 = 60
=
P( x ≥ 50) = ? P( x ≥ 50) = P(y ≥ 49,5)
50 60 y
50 60 x
44
Aproximação da Binomial pela Normal
Observe que a área na curva normal se inicia antes da variável assumir o valor
de 50. Logo temos que efetuar a correção de 0,5 para o valor de 50 para limitar
a área da curva normal. Logo temos 50 – 0,5 = 49,5.
P( x ≥ 50) = P(y ≥ 49,5) = P(z ≥ -1,62) = 0,5 + 0,4474 = 0,9474
45
Aproximação da Binomial pela Normal
Exemplo: Suponhamos que 5% dos tijolos crus despachados por um
fabricante apresentem ligeiros defeitos. Use a aproximação normal da
distribuição binomial, caso seja possível, para aproximar a probabilidade de
que dentre 150 tijolos crus despachados pelo fabricante, no máximo nove
apresentem ligeiros defeitos.
A variável aleatória x: quantidade de tijolos crus com defeito (discreta)
p = 0,05, q = 0,95 e n = 150 (distribuição binomial)
P( x ≤ 9) = ?
Vamos verificar se a distribuição binomial pode ser aproximada pela curva
normal com variável aleatória y, então
np=150*0,05 = 7,5 > 5 e nq=50*0,95 = 142,5 > 5 (aproximação curva normal)
46
Aproximação da Binomial pela Normal
= np = 150*0,05 = 7,5
=
P( x ≤ 9) = ? P( x ≤ 9) = P(y ≤ 9,5)
7,5 9,0 y
7,5 9,0 x
47
Aproximação da Binomial pela Normal
Observe que a área na curva normal se inicia depois da variável assumir o
valor de 9. Logo temos que efetuar a correção de 0,5 para o valor de 950 para
limitar a área da curva normal. Logo temos 9 + 0,5 = 9,5.
P( x ≤ 9) = P(y ≤ 9,5) = P(z ≤ 0,75) = 0,5 + 0,2734 = 0,7734
48