MANUAL DE
HKOJKKHJHHHJ
ESTATÍSTICA
DESCRITIVA
ITSN
ADRIANO KALENGA CAVINDRALA
ESTEVÃO LUCÍLIO SACAVEIA
MANUAL DE ESTATÍSTICA DESCRITIVA
Este manual é dirigido aos estudantes da área de Saúde.
O estilo em forma de diálogo com os leitores é uma
tentativa de motivá-los e também de vencer a resistência
que muitos deles trazem para o estudo e a discussão de
conceitos estatísticos. O manual é uma óptima referência
para um primeiro curso de Estatística, pela riqueza de
detalhes com que os tópicos básicos de Estatística
Descritiva são tratados, pelo estilo atraente e agradável
e pela cuidadosa apresentação e discussão dos conceitos,
introduzidos através de exemplos e aplicações oriundos,
na maioria, da Epidemiologia. Pesquisadores da área de
saúde também podem se beneficiar dos conteúdos
abordados. Trata-se, assim, de um manual que deverá
contribuir para a difusão do ensino da Estatística e que
ajudará na formação dos futuros pesquisadores na área
de Saúde.
ITSN
2021
ÍNDICE
UNIDADE I: DEFINIÇÕES E CONCEITOS SOBRE ESTATÍSTICA ......................................................... 1
1. DEFINIÇÕES E CONCEITOS SOBRE ESTATÍSTICA ......................................................................... 2
1.2. Resenha histórica da Estatística ............................................................................................................. 2
1.3. Definições Fundamentais .......................................................................................................................... 5
1.3.1. Variável ......................................................................................................................................................... 5
1.4. Arredondamento e Percentagem ..................................................................................................... 7
1.5. Exercícios de Aplicação ...................................................................................................................... 10
UNIDADE II: DISTRIBUIÇÃO DE FREQUÊNCIAS .................................................................................... 11
2. DISTRIBUIÇÃO DE FREQUÊNCIAS ..................................................................................................... 12
2.1. Organização e apresentação dos dados ............................................................................................ 12
2.3. Conceitos sobre distribuição de frequências ............................................................................ 13
2.3.1 Distribuição de frequência pontual – sem perda de informação ......................................... 14
2.3.2. Distribuição de frequências em classes ......................................................................................... 16
2.4. Gráficos ..................................................................................................................................................... 19
2.4.1. Gráficos Para Variáveis Qualitativas........................................................................................ 20
2.4.1.1. Gráfico de barras ......................................................................................................................... 20
2.4.1.2. Gráfico de colunas ...................................................................................................................... 20
2.4.1.3. Gráfico circular ............................................................................................................................ 21
2.4.1.4. Gráfico de linhas .......................................................................................................................... 21
2.4.2. Gráficos Para Variáveis Quantitativas Discretas ................................................................ 22
2.4.2.1. Gráfico de bastões ou traços .................................................................................................. 22
2.4.2.2. Gráfico escalonado (em forma de escada)........................................................................ 22
2.4.3. Gráfico para Variáveis Quantitativas Contínuas ................................................................. 23
2.4.3.1. Histograma .................................................................................................................................... 23
2.4.3.2. Polígono de frequência ............................................................................................................. 23
2.4.3.3. Gráfico da frequência acumulada ou Ogiva...................................................................... 24
2.5. Exercícios de Aplicação ...................................................................................................................... 25
UNIDADE III: PARÂMETROS ESTATÍSTICOS........................................................................................... 27
3. Parâmetros Estatísticos .......................................................................................................................... 28
3.1. Medidas de tendência central................................................................................................................ 28
3.1.1. Média............................................................................................................................................................ 28
3.1.2. Mediana ...................................................................................................................................................... 30
3.1.3. Moda............................................................................................................................................................. 34
3.1.4. Exercícios de Aplicação ........................................................................................................................ 37
3.2. Medidas de Dispersão............................................................................................................................... 38
3.2.1. Amplitude total ........................................................................................................................................ 38
3.2.2. Desvio médio absoluto (DMA) .......................................................................................................... 39
3.2.3. Variância ( Desvio padrão ( ................................................................................................ 39
3.2.4. Variância ( e Desvio padrão ( ) amostral .............................................................................. 41
3.2.5. Medidas de Dispersão para dados agrupados ............................................................................ 43
3.2.6. Medidas de Dispersão para dados agrupados em Classes ..................................................... 45
3.2.7. Exercícios de Aplicação ........................................................................................................................ 48
3.3. Medidas de Posição (Ordenamento) ............................................................................................ 49
3.3.1. Quartis ......................................................................................................................................................... 50
3.3.2. Decis ............................................................................................................................................................. 51
3.3.3. Percentis ..................................................................................................................................................... 52
3.3.4. Medidas de posição para dados agrupados em classe ............................................................ 54
3.3.5. Exercícios de Aplicação ........................................................................................................................ 56
3.4. Simetria e curtose ................................................................................................................................ 57
3.4.1. Simetria ............................................................................................................................................... 57
3.4.2. Curtose ................................................................................................................................................. 59
3.4.3. Exercícios de aplicação ................................................................................................................. 61
UNIDADE IV: PROBABILIDADE..................................................................................................................... 61
4. PROBABILIDADE ....................................................................................................................................... 63
4.1. História da probabilidade ....................................................................................................................... 63
SACAVEIA, E. L. (2020) Página IV
4.2. Definição de probabilidade .................................................................................................................... 64
4.3. Terminologia e conceitos .................................................................................................................. 65
4.4. Uniões e intersecções ......................................................................................................................... 66
4.5. Eventos excludentes e exaustivos ................................................................................................. 66
4.5.1. Eventos mutuamente exclusivos ou excludentes ............................................................... 66
4.5.2. Eventos colectivamente exaustivos ......................................................................................... 67
4.6. Princípios básicos de probabilidade............................................................................................. 69
4.7. Representando probabilidades em diagrama de venn ......................................................... 70
4.8. Principais teoremas............................................................................................................................. 71
4.8.1. Teorema da soma ............................................................................................................................ 71
4.8.2. Teorema do produto ...................................................................................................................... 73
4.9. Exercícios de Aplicação ...................................................................................................................... 75
SACAVEIA, E. L. (2020) Página V
UNIDADE I: DEFINIÇÕES E CONCEITOS SOBRE ESTATÍSTICA
Esta unidade apresenta os conceitos básicos associados à Estatística, seus
objectivos, utilidades e funções. Posteriormente trás as principais subdivisões da
Estatística, como a Estatística descritiva, a probabilidade e a estatística inferencial.
Pretende-se que ao culminar desta unidade o aluno deverá absorver o seguinte:
Descrever a resenha histórica da Estatística;
Diferenciar as principais subdivisões da Estatística;
Definir a Estatística Sanitária e sua importância;
Descrever os seguintes conceitos: população, amostra, Variáveis;
Resolver problemas relacionados com arredondamento e percentagem;
Resolver exercícios relacionados com o tema em causa.
1. DEFINIÇÕES E CONCEITOS SOBRE ESTATÍSTICA
1.2. Resenha histórica da Estatística
A Estatística pode ser formalmente conceituada como a ciência que tem por
objectivo a colecção, a análise e a interpretação de dados qualitativos ou numéricos
a respeito de fenómenos colectivos ou de massa. Também é proposito da
estatística a indução de leis a que fenómenos cabalmente obedecem, além da
representação numérica e comparativa, em tabelas ou gráficos, dos resultados da
análise desses fenómenos.
Acredita-se que o termo estatística tenha sido primeiramente empregado para
designar o conjunto de dados referentes a assuntos do Estado, geralmente com a
finalidade de control fiscal ou de segurança nacional. Por esse motivo, o uso da
palavra, segundo estudiosos, teria a sua origem na expressão latina “Status” que
significa Estado, podendo assumir diferentes significações, dependendo de como é
utilizado. Objecto de longas polémicas, o termo “Estatística” até hoje é
controvertido. Existem dúvidas se ele deriva de facto, de Estado, entidade política
ou de estado, modo de ser (Bruni, 2008).
Os dados do Estados referiam-se, particularmente, à população, às transações
comerciais internas ou com outros Estados, ao contro da mortalidade em geral ou
provocada por uma epidemia, endemia ou doença particular e aos problemas de
taxação e de proporcionalidade de tarifas e impostos. Além de estudar as maneiras
mais eficientes de organizar as informações obtidas, tratava também do problema
mais importante: de interpretação de dados e da possibilidade de realizar
previsões.
Segundo Bruni (2008), a palavra estatística teria sido cunhada, possivelmente por
Gottfried Achenwall, académico Alemão, por volta da metade do séc. XVIII, sendo
que seu verbete em Inglês, “Statistics”, apareceu na Enciclopédia Britânica pela
primeira vez em 1797. Porém, a origem das aplicações das técnicas da Estatística é
bem mais antiga, sendo possível fornecer alguns exemplos:
SACAVEIA, E. L. (2020) Página 2
a. Indícios encontrados sugerem a existeència de censos muito antigos,
realizados por volta de 3000 a.c, na Babilónia, China e Egipto. A Bíblia
ilustra esta constatação histórica. O livro quarto (Números) do velho
testamento começa com uma instrução a Moisés: Fazer um levatamento dos
homens de Israel que estiverem aptos para guerrear;
b. Outro facto estatístico bíblico relevante ocorreu na época do imperador
romano César Augusto: Um edito solicitou a realização de censo em todo o
império. Segundo a Bíblia, por essa razão Maria e José viajaram ao Egipto;
c. Em 1085, Guilherme, o conquistador, ordenou a realização de um
levantamento estatístico da Inglatrra, que dveria incluir informações sobre
terras, proprietários, uso da terra, animais e empregados. Este
levantamento serviria de base para o cálculo de impostos. O estudo originou
um volume, conhecido como Domesday book (em português pode ser
traduzido como o dia do juízo final);
d. No séc. XVII, a Estatística ganhou destaque na Inglaterra a partir das tábuas
de mortalidade, a aritmética política, de John Graunt, que consistiu na
análise extensa de nascimentos e mortes.
De forma mais recente, a Estatística sofreu importantes contribuições através do
avanço da tecnologia dos computadores, permitindo aplicações cada vez mais
sofisticadas. Segundo Morais (2010), actualmente é possível destinguir duas
concepções para a palavra Estatística:
a. No plural: Indica qualquer colecção consistente de dados numéricos,
reunidos com a finalidade de fornecer informações acerca de um objetivo.
Ex: as estatísticas demográficas referem-se a dados numéricos sobre
nascimentos, falecimentos, matrimónios; as estatísticas económicas
consistem em dados numéricos sobre emprego, produção, preço, vendas;
b. No singular: Indica actividade humana especializada ou um corpo de
ténicas, ou, ainda, uma metodologia desenvolvida para colecta, a
classificação, a apresentação, a análise e a interpretação de dados
quantitativos e a utilização desses dados para tomada de decisões.
SACAVEIA, E. L. (2020) Página 3
Actualmente, pode-se definir Estatística como a ciência que se preocupa com a
organização, descrição, análise, e interpretação de dados. Ou seja, por meio da
análise de dados brutos, a Estatística preucupa-se com a extração de informações
que permitem o processo posterior de tomada de decisões (Guedes et al., 2015).
De acordo com Bruni (2008), em linhas gerais, a Estatística poderia ser dividida em
três grandes grupos:
a) Estatística Descritiva: muitas das vezes apresentada como Estatística,
simplesmente. Sua principal função consiste em resumir dados e
informações investigadas, expondo-os da maneira mais prática e simples
possível;
b) Estatística das Probabilidades: seu uso surgiu com o intuito de planear
jogadas ou estratégias em jogos de azar. A probabilidade estuda o risco e o
acaso em eventos futuros e determina se é provável ou não o seu
acontecimento;
c) Estatística Inferencial ou Indutiva: representa o estudo dos dados de
amostras com o objectivo de entender o comportamento do universo. Em
algumas ocasiões, representa o complemento da estaística descritiva, visto
que ela parte da interpretação de uma amostra para acaracterização de
todo um grupo.
Porém, a Estatística Sanitária é o conjunto de métodos e técnicas estatísticas que
permitem medir as alterações do estado de saúde das pessoas, servindo-se
também de instrumentos, normas e actividades que produzem informações
periódicas que auxiliam no processo decisório no ramo da saúde.
Todavia, a Estatística Sanitária tem uma capital importância na identificação e
definição de problemas relacionados com a variabilidade da Biologia Humana, no
trabalho de laboratório, na variedade de dados clínicos, na investigação biomédica,
na saúde colectiva, na medicina preventiva, na gestão e na planificação dos
serviços de saúde (Pagano & Gauvreau, 2004).
SACAVEIA, E. L. (2020) Página 4
1.3. Definições Fundamentais
Segundo Neto (2008), a estatística trabalha com dados, os quais podem ser obtidos
por meio de uma população ou de uma amostra, definida como:
o População: conjunto de elementos que tem pelo menos uma característica
em comum. Esta característica deve delimitar correctamente quais são os
elementos da população que podem ser animados ou inanimados.
o Amostra: subconjunto de elementos de uma população. Este subconjunto
deve ter dimensão menor que o da população e seus elementos devem ser
representativos da população.
A selecção dos elementos que irão compor a amostra pode ser feita de várias
maneiras e irá depender do conhecimento que se tem da população e da
quantidade de recursos disponíveis. Em se tratando de conjuntos-subconjuntos,
estes podem ser: Finitos: possuem um número limitado de elementos. Infinitos:
possuem um número ilimitado de elementos.
Segundo Barbetta et al. (2004), elementos significam cada uma das unidades
observadas no estudo. Após a determinação dos elementos pergunta-se: o que
fazer com estes? Pode-se medi-los, observá-los, contá-los surgindo um conjunto de
respostas que receberá a denominação de variável.
1.3.1. Variável
Como o termo sugere, variável reporta-se a características ou atributos que podem
tomar diferentes valores ou categorias, o que se opõe ao conceito de “constante”
(Magalhães & Lima, 2000).
Segundo Guedes et al. (2015), as variáveis, se apenas considerarmos a natureza
dos valores que podem assumir, podem ser: variáveis qualitativas e variáveis
quantitativas. Os valores possíveis de uma variável qualitativa são: qualidades ou
símbolos. A relação entre esses valores só tem sentido em termos de igualdade e
de desigualdade. As variáveis qualitativas (descrevem tipos ou classes) podem ser:
dicotómicas (apenas duas categorias) ou politómicas (três ou mais categorias).
SACAVEIA, E. L. (2020) Página 5
Os valores de uma variável quantitativa são representados através de números. As
variáveis quantitativas podem ser discretas ou contínuas. Uma variável diz-se
discreta quando os seus valores podem ser relacionados por uma correspondência
biunívoca com um subconjunto de números inteiros. Uma variável diz-se contínua
quando os seus valores podem ser relacionados por uma correspondência
biunívoca com intervalos de números reais (Guedes et al., 2015). Assim, as
variáveis discretas assumem valores inteiros e as variáveis contínuas assumem
valores reais.
Ilustração 1: Características das variáveis
Ex: Sexo, estado civil, grupo
Nominais sanguíneo, cor dos olhos…
QUALITATIVAS
Ordinais Ex: Nível salarial e escolar,
estágio de uma doença…
VARIÁVEIS
Ex:Tamanho duma família,
Discretas nº de consultas/mês…
QUANTITATIVAS
Contínuas Ex: pressão sanguínea, peso,
altura…
Fonte: Autor.
Segundo Milone (2004), Variável qualitativa é uma variável que assume como
possíveis valores, atributos ou qualidades. Também são denominadas variáveis
categóricas. Variável quantitativa é uma variável que assume como possíveis
valores, números. Cada uma dessas variáveis podem ser sub-classificadas em:
o Variável qualitativa nominal: é uma variável que assume como possíveis
valores, atributos ou qualidades e estes não apresentam uma ordem natural
de ocorrência.
Exemplo 01: Emprego, estado civil, tipo sanguíneo, sexo, cor dos olhos, matrículas
de automóveis, código de barra.
o Variável qualitativa ordinal: é uma variável que assume como possíveis
valores atributos ou qualidades e estes apresentam uma ordem natural de
ocorrência.
SACAVEIA, E. L. (2020) Página 6
Exemplo 02: Nível salarial, nível de escolaridade, estágio de uma doença.
o Variável quantitativa discreta: é uma variável que assume como possíveis
valores números, em geral inteiros, formando um conjunto finito ou
enumerável.
Exemplo 03: Tamanho de uma família, número de consultas no mês, número de
batimentos cardíacos por minutos, número de alunos de uma escola.
o Variável quantitativa contínua: é uma variável que assume como
possíveis valores números, em intervalos da recta real e, em geral,
resultantes de mensurações. Está relacionado com grandezas como volume,
área, peso, massa, altura em centímetros.
Exemplo 04: Pressão sanguínea, peso, altura, taxa de colesterol.
1.4. Arredondamento e Percentagem
Entende-se por arredondamento de dados a técnica utilizada para suprimir
unidades inferiores, isto é, arredondar um número significa reduzir a quantidade
de algarismos após a vírgula (Reis, 1998).
Às vezes, queremos trabalhar com números com uma casa decimal, mas o que
fazer quando o resultado encontrado for um número com muito mais casas depois
da vírgula? Para Reis (1998), a rigor, na Estatística, precisamos seguir um critério
rígido de arredondamento a fim de não comprometermos os resultados. Caso haja
necessidade de alteração, nossa atenção deve recair sobre o primeiro algarismo a
ser abandonado. Teremos três caminhos possíveis:
o Seguimos o primeiro caminho (I) quando o primeiro algarismo a ser
abandonado for 0, 1, 2, 3 ou 4. Nesse caso, o algarismo a permanecer ficará
sem alteração. Por exemplo, 4,84 passa a 4,8;
o Seguimos o segundo caminho (II) quando o primeiro algarismo a ser
abandonado for 6, 7, 8 ou 9. Nesse caso, o último algarismo a permanecer
será aumentado de um. Por exemplo, 4,87 passa a 4,9;
SACAVEIA, E. L. (2020) Página 7
o Quando o primeiro algarismo a ser abandonado for 5, seguimos o (III)
caminho. Nesse caso, temos que prestar muita atenção, pois, o caminho se
divide em dois percursos:
a) Quando o número a ser abandonado for 5 e ele for o último ou seguido de
zeros, aumentaremos uma unidade apenas quando o último algarismo a
permanecer for ímpar. Por exemplo: 5,85 passa a 5,8;
b) Quando o número a ser abandonado for 5 seguido de algum número
diferente de zero, aumenta-se uma unidade ao algarismo a permanecer. Por
exemplo, 8,55000000002 passa a 8,6.
Casos de arredondamento não são difíceis, mas requerem muita prática até
compreendermos bem os processos, não há outra alternativa (Reis, 1998).
Segundo Soares et al. (1991), etimologicamente a palavra percentagem se originou
do latim “per centum”, que significa literalmente ”por cento” ou “por cada centena”.
Percentagem é uma área da matemática que indica uma taxa ou proporção
calculada em relação ao número 100 (por cem), e é representada pelo símbolo %.
Consiste numa razão em que seu denominador é sempre 100. Ela é usada para
comparar grandezas, calcular valores de lucro, descontos ou prejuízos e até mesmo
taxas de juros.
Por exemplo se num grupo de estudantes do ITSN existem 55 mulheres e 45
homens, podemos dizer que a percentagem de mulheres é de 55%, enquanto a de
homens é 45%.
Na prática, calculamos as percentagens em diversas situações. Suponha que meu
salário seja de 400kz e eu receberei um aumento de 12%.
a. Qual será o meu aumento?
b. Quanto passarei a receber?
Podemos resolver esta situação através da utilização da regra de 3 simples. Para
determinar o valor de 12% de 400, é preciso ter em mente que 100% é sempre
igual ao total das unidades, que neste caso é 400kz.
SACAVEIA, E. L. (2020) Página 8
O valor de unidades referentes a 12% é desconhecido, sendo este número “X” a
resposta obtida com a regra de três:
Então sobre 12% é igual a 400 sobre 100%, logo:
O salário terá um acréscimo de 48kz, assim passará a ganhar 448kz
(400+48=448kz).
Um produto de 32,00kzs está com desconto de 7%. Por quanto ele está sendo
vendido?
R: 29,76kzs, comprove?
SACAVEIA, E. L. (2020) Página 9
1.5. Exercícios de Aplicação
1) O termo estatístico foi empregado pela primeira vez para designar o quê? E
qual era a finalidade?
2) Em que século e por quem tivera sido cunha a palavra estatística?
3) Sobre a origem das aplicações das técnicas estatísticas, descreva dois factos que
mostram a veracidade da sua antiguidade?
4) Estabeleça o conceito de Estatística como ciência?
5) Em quantas partes está dividida a Estatística e fale sucintamente da Descritiva?
6) Estabeleça o conceito e importância da Estatística Sanitária?
7) Define população, amostra, arredondamento, percentagem, variáveis e sua
característica?
8) Enquadra as variáveis nas suas áreas específicas.
Variáveis Quantitativas Qualitativas
Discreta Contínua Nominal Ordinal
Cor da pele
Idade
Grau de desnutrição
Peso do recém-nascido
Nº de leitos no hospital
Classe de renda: A;B;C
Sexo
9) Arredonde cada um dos dados abaixo, deixando-os com apenas uma casa
decimal.
(a) 2,38; (b) 24,65; (c) 6,829; (d) 5,550; (e) 89,99.
SACAVEIA, E. L. (2020) Página 10
UNIDADE II: DISTRIBUIÇÃO DE FREQUÊNCIAS
Dependendo do volume de dados, torna-se difícil ou impraticável tirar conclusões
a respeito do comportamento das variáveis e, em particular, de variáveis
quantitativas. Pode-se, no entanto, colocar os dados brutos de cada uma das
variáveis quantitativas em uma ordem crescente ou decrescente, denominado rol.
Pretende-se que ao final desta unidade o estudante devera ter adquerido
conhecimentos que lhe possibilite:
Definir tabela e apresentar sua importância;
Estabelecer conceitos sobre distribuição de frequências;
Diferenciar dados não agrupados dos dados agrupados;
Resolver problemas relacionados com a distribuição de frequências.
2. DISTRIBUIÇÃO DE FREQUÊNCIAS
2.1. Organização e apresentação dos dados
A utilidade dos dados estatísticos depende, muitas vezes, da forma como são
organizados e apresentados. A estatística descritiva, cujo objectivo básico é o de
sintetizar uma série de valores de mesma natureza, permitindo dessa forma que se
tenha uma visão global da variação desses valores, organiza e descreve os dados de
três maneiras: por meio de tabelas, de gráficos e de medidas descritivas.
A tabela é um quadro que resume um conjunto de observações, enquanto os
gráficos são formas de apresentação dos dados, cujo objectivo é o de produzir uma
impressão mais rápida e viva do fenómeno em estudo (Neto, 2008).
Para Reis (1998), os quadros e os gráficos devem apresentar sempre três partes: o
cabeçalho, o corpo e o rodapé. No cabeçalho deve ser dada informação sobre os
dados, no corpo representam-se os dados e no rodapé deve ser indicada a fonte
dos dados e observações pertinentes.
Dos vários tipos de gráficos destacamos: gráfico de linhas, gráfico de barras,
gráfico de sectores e pictogramas, os quais podem ser facilmente construídos a
partir de diversos programas informáticos ou estatísticos, dos quais destacamos a
folha de cálculo Excel e o SPSS, respectivamente.
Milone (2004), afirma que “sumários e apresentações de dados bem constituídos
são essenciais ao bom julgamento estatístico, porque permitem focar as
características importantes dos dados ou ter discernimento acerca do tipo de
modelo que deveria ser usado na solução do problema em questão”.
Embora um certo volume de informação seja perdido quando os dados são
resumidos, um grande volume pode também ser ganho. “Uma tabela talvez seja o
meio mais simples de se resumir um conjunto de observações” (Pagano &
Gauvreau, 2004). Deve ser usada quando é importante a apresentação dos valores
e sua leitura depende de quem a lê.
Todas as variáveis podem ser resumidas através de uma tabela, mas a construção é
diferenciada dependendo do tipo de variável. Denomina-se Tabela Simples à tabela
SACAVEIA, E. L. (2020) Página 12
que resume os dados de uma única variável qualitativa e Distribuição de
Frequências ao resumo de uma única variável quantitativa (Pagano & Gauvreau,
2004).
2.3. Conceitos sobre distribuição de frequências
Como já mencionado no início deste capítulo, dependendo do volume de dados,
torna se difícil ou impraticável tirar conclusões a respeito do comportamento das
variáveis e, em particular, de variáveis quantitativas. Pode-se, no entanto, colocar
os dados brutos de cada uma das variáveis quantitativas em uma ordem crescente
ou decrescente, denominado rol.
Para Morais (2010), dados brutos são aqueles que não foram numericamente
organizados e rol é um arranjo de dados numéricos brutos em ordem: crescente ou
decrescente. Em um rol, a diferença entre o maior e o menor número chama-se
amplitude total.
A visualização de algum padrão ou comportamento continua sendo de difícil
observação ou até mesmo cansativa, mas torna-se rápido identificar maiores e
menores valores ou concentrações de valores no caso de variáveis quantitativas.
Estes números (menor e maior valor observado) servem de ponto de partida para
a construção de tabelas para estas variáveis. Vale destacar que para as variáveis
qualitativas, pode-se também construir um rol em ordem temporal ou alfabética
(Morais, 2010).
A diferença entre o menor e maior valor observado da variável , é denominada
por amplitude total ( – ), que definirá a construção de uma
distribuição de frequência pontual ou em classes. O ideal é que uma distribuição de
frequência resuma os dados em um número de linhas que varie de 5 a 10.
o Frequência Simples Absoluta ( ): É o número de vezes que o
elemento aparece na amostra, ou o número de elementos pertencentes a
uma classe;
SACAVEIA, E. L. (2020) Página 13
o Frequência Absoluta Acumulada ): É a soma da frequência
absoluta da classe com a frequência absoluta das classes anteriores;
o Frequência Simples Relativa ( ): É o valor da frequência absoluta
dividido pelo número total de observações: ∑
;
o Frequência Relativa Acumulada ( ): É a soma da frequência relativa da
classe com a frequência relativa das classes anteriores.
Utilizamos a distribuição de Frequências quando estamos interessados em agrupar
o conjunto de dados.
2.3.1 Distribuição de frequência pontual – sem perda de informação
A construção de uma distribuição de frequência pontual é equivalente à construção
de uma tabela simples, onde se listam os diferentes valores observados da variável,
com suas frequências absolutas, denotadas por , onde o índice corresponde ao
número de linhas da tabela, como é mostrado na Tabela abaixo.
Tabela 1: Nº de irmãos dos estudantes do curso de Estatística da 12ª do ITSN.
Nº de irmãos Contagem Frequência ( )
0 | 1
1 |||||| 6
2 |||||||||||| 12
3 || 2
6 | 1
Somatório (∑ Ou Total ----------------------------- 22
Fonte: Autor.
Observa-se que esta variável foi resumida em 5 linhas. Assim, , e,
portanto, tem-se 5 valores para as frequências absolutas. A frequência absoluta da
segunda linha, , por exemplo, indica que seis alunos têm um irmão,
enquanto apenas um afirmou ter seis irmãos. A soma de todas as frequências
absolutas deve ser igual ao número total de observações da variável, neste caso,
22. A segunda coluna desta tabela é uma coluna opcional em distribuições de
frequências.
SACAVEIA, E. L. (2020) Página 14
Como colunas complementares em uma distribuição de frequências e
considerando , a ordem da linha na tabela, tem-se:
o A frequência relativa, denotada por , e já definida anteriormente como:
∑
ou
Onde é o tamanho da amostra, devendo ser substituída por N se os dados forem
populacionais. A soma das frequências relativas de todas as categorias é igual a 1;
o A frequência relativa em percentual, denotada por , é definida como:
Representando o percentual de observações que pertencem àquela categoria. A
soma das frequências deve, agora, ser igual a 100%.
o A frequência absoluta acumulada, denotada por . Estas frequências são
obtidas somando-se a frequência absoluta do valor considerado, às frequências
absolutas anteriores a este mesmo valor;
o A frequência acumulada relativa, denotada por . Estas frequências são
obtidas somando-se a frequência relativa do valor considerado, às frequências
relativas anteriores a este mesmo valor.
Uma tabela contendo todas estas frequências é dita uma distribuição de
frequências completa. Desta forma, a Tabela 2 pode ser apresentada como:
Tabela 2: Nº de irmãos dos estudantes do curso de Estatística da 12ª do ITSN.
Nº de irmãos (x)
0 1 0,045 4,55 1 0,045
1 6 0,273 27,27 7 0,318
2 12 0,545 54,55 19 0,864
3 2 0,091 9,09 21 0,955
6 1 0,045 4,55 22 1,000
Total 22 1 100,00 ………. ………
Fonte: Autor
SACAVEIA, E. L. (2020) Página 15
Segundo Milone (2004), em se tratando das frequências relativas em percentuais,
arredondamentos se fazem necessários e devem ser feitos de maneira
convencional. Neste tipo de aproximação opta-se sempre pelo menor erro.
Por exemplo, se for necessário aproximar o número 0,483 para a ordem do
centésimo, erra-se menos subtraindo 0,003 que adicionando 0,007 ao valor 0,483,
portanto a aproximação correta é 0,48. Se a aproximação for do número 0,4853
para a ordem do centésimo, então o erro menor será para a adição de 0,0047 e não
para a subtracção de 0,0053, e a aproximação adequada é 0,49.
Já no caso do número 0,485, o tamanho do erro de aproximação é o mesmo que se
obtém quando feita para mais ou para menos (0,005), e neste caso, cabe ao
pesquisador decidir qual aproximação é mais conveniente. A soma de todas as
frequências relativas percentuais deve ser igual a 100.
Entretanto, quando são feitas aproximações, tal facto pode não ocorrer. Para o caso
em que for menor que 100, soma-se uma unidade ao dígito de interesse das
maiores frequências relativas até que a soma seja 100. Se for maior que 100, deve-
se subtrair uma unidade das maiores frequências relativas. Agora, se ocorrem
empates ou se as maiores frequências forem números inteiros, é conveniente
trabalhar com as outras frequências. O importante é que a distribuição dos dados
não seja alterada.
2.3.2. Distribuição de frequências em classes
“A distribuição de frequências em classes é apropriada para apresentar dados
quantitativos contínuos ou discretos com um número elevado de possíveis valores”
(Barbetta, 1998). É necessário dividir os dados em intervalos ou faixas de valores
que são denominadas classes. Uma classe é uma linha da distribuição de
frequências.
O menor valor da classe é denominado limite inferior (Li) e o maior valor da classe
é denominado limite superior (Ls). O intervalo ou classe pode ser representado das
seguintes maneiras:
SACAVEIA, E. L. (2020) Página 16
a) Li |----Ls, onde o limite inferior da classe é incluído na contagem da frequência
absoluta mas o superior não;
b) Li ----| Ls, onde o limite superior da classe é incluído na contagem mas o inferior
não;
c) Li|----|Li, onde tanto o limite inferior quanto o superior é incluído na contagem;
d) Li ---- Ls, onde os limites não fazem parte da contagem.
Pode-se escolher qualquer uma destas opções sendo o importante tornar claro no
texto ou na tabela qual está sendo usada. “Se houver muitos intervalos, o resumo
não constituirá grande melhoria com relação aos dados brutos. Se houver muito
poucos, um grande volume de informação se perderá. Embora não seja necessário,
os intervalos são frequentemente construídos de modo que todos tenham larguras
iguais, o que facilita as comparações entre as classes” (Pagano, 2004).
Os principais estágios na construção de uma distribuição de frequência para dados
agrupados em classes são:
a. Encontrar a amplitude total do conjunto de valores observados;
o
b. Escolher o número de classes;
o Raiz Quadrada: √
o Log (Sturges):
Deve-se lembrar que sendo k o número de classes, o resultado obtido por cada um
dos critérios deve ser o número inteiro mais próximo ao obtido.
c. Determinar a amplitude do intervalo de classe;
o
Assim todas as classes terão a mesma amplitude, o que permitirá a construção de
gráficos e cálculo de medidas descritivas. No caso de uma distribuição de
frequência contínua, ou em classes, uma outra coluna pode ser acrescentada à
tabela. É a coluna dos pontos médios, denotada por e definida como a média dos
limites da classe:
SACAVEIA, E. L. (2020) Página 17
Obs: Vamos trabalhar com intervalos fechados à esquerda e abertos à direita; isso
significa que valores iguais ou superiores ao limite inferior são considerados nessa
classe e valores iguais e/ou superiores ao limite superior são considerados na
classe abaixo.
Exemplo: Estatura de 40 alunos do ITSN em cm. (Dados ordenados em ordem
crescente, por colunas)
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
1.R: AT = 173 – 150 = 23
2.R:Pela fórmula de Sturges: K= 1+3,3log40 = 6,28 → K=6
Adotando K = n , temos k = 40 =6,3 → K=6
3.R: h = 23/ 6 = 3,83 → h = 4
4.R:Limite Inferior (Li) e Limite Superior (Ls)
Tabela 3: Estatura de 40 alunos do ITSN-2021 em Cm.
Ponto Médio
Classes (Xc) fi fr fr% Fi Fr
150|--154 152 4 0,1 10 4 0,1
154|--158 156 9 0,225 22,5 13 0,325
158|--162 160 11 0,275 27,5 24 0,6
162|--166 164 8 0,2 20 32 0,8
166|--170 168 5 0,125 12,5 37 0,925
170|--174 172 3 0,075 7,5 40 1
TOTAL ………. 40 1 100 ………….. …………….
Fonte: Autor.
SACAVEIA, E. L. (2020) Página 18
Nota-se que cada um dos valores observados deve pertencer a uma e somente uma
classe. É usual que o limite inferior da primeira classe seja igual ao menor valor
observado e que o maior valor pertença à última classe. Quando o limite superior
da última classe coincidir com o maior valor observado é mais apropriado fechar
este intervalo, contando o elemento nesta classe, do que abrir uma nova classe
contendo apenas uma frequência absoluta. Por outro lado, se o maior valor
observado for inferior ao limite superior da classe, não há problemas, pois fixamos
todas as classes com a mesma amplitude. Nada impede que se construa uma tabela
com amplitude de classes desiguais. Isto dependerá do objectivo do pesquisador. O
que se recomenda é o cuidado na interpretação da tabela (Guedes, 2015).
2.4. Gráficos
Segundo Morais (2010), gráfico é um recurso visual da Estatística utilizado para
representar um fenómeno. Sua utilização em larga escala nos meios de
comunicação social, técnica e científica, devem-se tanto à sua capacidade de
reflectir padrões gerais e particulares do conjunto de dados em observação, como
à facilidade de interpretação e a eficiência com que resume informações dos
mesmos.
Embora os gráficos forneçam menor grau de detalhes que as tabelas, estes
apresentam um ganho na compreensão global dos dados, permitindo que se
aperceba imediatamente da sua forma geral sem deixar de evidenciar alguns
aspectos particulares que sejam de interesse do pesquisador. Uma representação
gráfica coloca em evidência as tendências, as ocorrências ocasionais, os valores
mínimos e máximos e também as ordens de grandezas dos fenómenos que estão
sendo observados (Morais, 2010).
Todo gráfico, em sua versão final deve primar pela simplicidade, clareza e
veracidade nas informações. Para atingir tal objectivo, a construção de um gráfico
exige muito trabalho e cuidados (Morais, 2010).
SACAVEIA, E. L. (2020) Página 19
2.4.1. Gráficos Para Variáveis Qualitativas
2.4.1.1. Gráfico de barras
É um gráfico formado por rectângulos horizontais de larguras iguais, onde cada um
deles representa a intensidade de uma modalidade ou atributo. O objectivo deste
gráfico é de comparar grandezas e é recomendável para variáveis cujas categorias
tenham designações extensas (Bruni, 2008).
Gráfico 1: Relação entre trabalho e curso dos alunos do ITSN-2021.
Completamente relacionado
Parcialmente relacionado
Não relacionado
Não trabalho
0 2 4 6 8 10 12 14
Fonte: Autor.
2.4.1.2. Gráfico de colunas
É o gráfico mais utilizado para representar variáveis qualitativas. Difere do gráfico
de barras por serem seus rectângulos dispostos verticalmente ao eixo das abcissas
sendo mais indicado quando as designações das categorias são breves. O número
de colunas ou barras do gráfico não deve ser superior a 12 (doze) (Bruni, 2008).
Gráfico 2: Nº de irmãos dos alunos da turma de Estatística Sanitária.
12
10
8
6 fi
4
2
0
0 1 2 3 6
Fonte: Autor.
SACAVEIA, E. L. (2020) Página 20
2.4.1.3. Gráfico circular
Tipo de gráfico onde a variável em estudo é projectada num círculo, de raio
arbitrário, dividido em sectores com áreas proporcionais às frequências das suas
categorias. São indicados quando se deseja comparar cada valor da série com o
total. Recomenda-se seu uso para o caso em que o número de categorias não é
grande e não obedecem a alguma ordem específica (Guedes et al., 2015).
Gráfico 3: Relação trabalho e curso dos alunos do ITSN-2021.
12%
38% Não trabalho
21%
Não relacionado
29%
Parcialmente relacionado
Completamente relacionado
Fonte: Autor.
2.4.1.4. Gráfico de linhas
Sua aplicação é mais indicada para representações de séries temporais sendo por
tal razão, conhecidos também como gráficos de séries cronológicas. Este tipo de
gráfico permite representar séries longas, o que auxilia detectar suas flutuações
tanto quanto analisar tendências. Também podem ser representadas várias séries
em um mesmo gráfico (Guedes et al., 2015).
Gráfico 4: Média de produção anual (em toneladas) da empresa ALC, Lda-2021.
50
40
30
20
10
0
Fonte: Autor.
SACAVEIA, E. L. (2020) Página 21
2.4.2. Gráficos Para Variáveis Quantitativas Discretas
2.4.2.1. Gráfico de bastões ou traços
Este gráfico é formado por segmentos de rectas perpendiculares ao eixo horizontal
(eixo da variável), cujo comprimento corresponde à frequência absoluta ou
relativa de cada elemento da distribuição. Suas coordenadas não podem ser unidas
porque a leitura do gráfico deve tornar claro que não há continuidade entre os
valores individuais assumidos pela variável em estudo (Guedes et al., 2015).
Gráfico 5: Nº de irmãos dos alunos do Curso de Estatística Sanitária-2021.
15
10
5
Exercícios:
0
0 1 2 3 6
Fonte: Autor.
2.4.2.2. Gráfico escalonado (em forma de escada)
Para Bruni (2008), este tipo de gráfico é usado para representar as frequências
acumuladas discretas. Nela destacam-se as frequências absolutas acumuladas ( )
e frequências relativas acumuladas ( .
Gráfico 6: Nº de irmãos dos alunos do Curso de Estatística Sanitária-2021.
25 21 22
19
20
15
10 7 Fi
5 1
0
0 1 2 3 6
Fonte: Autor.
SACAVEIA, E. L. (2020) Página 22
2.4.3. Gráfico para Variáveis Quantitativas Contínuas
2.4.3.1. Histograma
É um gráfico de colunas justapostas que representa uma distribuição de frequência
para dados contínuos ou uma variável discreta quando esta apresentar muitos
valores distintos. Nas abcissas temos as classes, nas ordenadas às frequências
absolutas ou relativas das mesmas. Quando os dados são distribuídos em classes
de mesma amplitude, todas as colunas apresentam bases iguais com alturas
variando em função das suas frequências absolutas ou relativas (Guedes et al.,
2015).
Gráfico 7: Estatura de 40 alunos do ITSN-2021 em Cm.
12
10
8
6
4
2
0
154 158 162 166 170 174
Fonte: Autor.
2.4.3.2. Polígono de frequência
Segundo Morais (2010), é um gráfico de linha cuja construção é feita unindo-se os
pontos de coordenadas de abcissas correspondentes aos pontos médios de cada
classe e as ordenadas, às frequências absolutas ou relativas dessas mesmas classes.
Gráfico 8: Estatura de 40 alunos do ITSN-2021 em Cm.
12
10
8
6
4
2
0
154 158 162 166 170 174
Fonte: Autor.
SACAVEIA, E. L. (2020) Página 23
2.4.3.3. Gráfico da frequência acumulada ou Ogiva
É um gráfico que permite descrever dados quantitativos por meio da frequência
acumulada. A ogiva é um gráfico de linha que une os pontos cujas abcissas são os
limites superiores das classes, e, ordenadas suas respectivas frequências
acumuladas. Observa-se que, o ponto inicial desse gráfico é o limite inferior do
primeiro intervalo, com frequência acumulada zero, pois não existe qualquer valor
inferior a ele (Guedes et al., 2015).
Gráfico 9: Frequências relativas acumuladas da estatura dos alunos do ITSN-2021,
em Cm.
0,8
0,6
0,4
0,2
0
150 154 158 162 166 170
Fonte: Autor.
SACAVEIA, E. L. (2020) Página 24
2.5. Exercícios de Aplicação
1. Defina Tabela e apresente a sua importância?
2. Diferencie rol de dados brutos?
3. Diferencie dados agrupados dos não agrupados?
4. De que depende a utilidade dos dados estatísticos?
5. Qual é o objectivo básico da estatística descritiva?
6. Quantos e quais elementos devem contar nas tabelas e gráficos?
7. Estabeleça o conceito de frequência absoluta, absoluta acumulada, relativa e
relativa acumulada?
8. Porquê razão utiliza-se a distribuição de frequência?
9. Em que momento torna-se apropriado a utilização da distribuição de
frequência de dados agrupados em classe?
10. Quais os principais estágios na construção de uma distribuição de frequência
de dados agrupados em classe?
11. Diferencie gráficos das tabelas?
12. O que deve primar todo gráfico na sua versão final?
13. Cite os tipos de gráficos que aprendeste? Em que categoria se encontra cada um
deles?
14. Os dados a baixo referem-se as notas de 24 Alunos do Curso de Estatística
Sanitária do IPSN-2020, na Disciplina de Estatística Inferencial.
7 9 4 9
4 8 9 7
8 12 7 12
10 4 12 4
7 10 4 12
9 4 8 9
a) Transforme em rol?
b) Calcula as todas as frequências apreendidas?
c) Elabore um diagrama de coluna, de linha e escalonado?
SACAVEIA, E. L. (2020) Página 25
15. Os estudantes do curso de estatística do ITSN-2020, realizaram um
levantamento junto ao Centro de Saúde do Forte Santa Rita. O referido
levantamento está relacionado com o diagnóstico dos partos de acordo com os
níveis de risco, descritos na tabela abaixo.
Diagnóstico (x) (fi)
Parto sem complicação 18
Carcinoma do colo do útero 8
Apendicite aguda 10
Parto prematuro 5
Aborto séptico 4
Parto c/ ruptura precoce de 6
membrana
Total ……………………………
a) Calcule todas as frequências que aprendeste e represente graficamente o
diagrama de barras e o de sectores (circular)?
16. Os dados a seguir estão relacionados com o peso de alguns estudantes do ITSN-
2019.
33 35 35 39 41 41 42 45 47 48
50 52 53 54 55 55 57 59 60 60
61 64 65 65 65 66 66 66 67 68
69 71 73 73 74 74 76 77 77 78
80 81 84 85 85 88 89 91 94 97
a) Calcula as todas as frequências apreendidas?
b) Represente graficamente a frequência absoluta e a frequência relativa
acumulada?
SACAVEIA, E. L. (2020) Página 26
UNIDADE III: PARÂMETROS ESTATÍSTICOS
Este tema apresenta de forma didáctica e clara os principais conceitos associados
aos parâmetros estatísticos, importantes na modelagem de situações que
envolvem eventos relacionados com as medidas de resumo. Para tornar a leitura
mais agradável e facilitar a aprendizagem do conteúdo transmitido são propostos
diversos exercícios. Pretende-se que no final desta unidade o aluno adquira os
seguintes conhecimentos:
Diferenciar parâmetros dos estimadores;
Estabelecer as relações entre a Média, Mediana e Moda;
Estabelecer as relações entre o Desvio Médio Absoluto, Variância, Desvio
Padrão;
Estabelecer as relações entre Quartil, Decil, Percentil;
Estabelecer as relações entre Simetria e Assimetria e Curtose;
Resolver exercícios relacionados com as medidas de resumo.
3. Parâmetros Estatísticos
Uma outra maneira de se resumir os dados de uma variável quantitativa, além de
tabelas e gráficos, é apresentá-los na forma de valores numéricos, denominadas
medidas descritivas. Estas medidas, se calculadas a partir de dados populacionais,
são denominadas parâmetros e se calculadas a partir de dados amostrais são
denominadas estimadores ou estatísticas. As medidas descritivas auxiliam a
análise do comportamento dos dados (Guedes et al., 2015). Tais dados são
provenientes de uma população ou de uma amostra, o que exige uma notação
específica para cada caso, conforme mostra o quadro seguinte:
Tabela 4: Notação de algumas estatísticas.
Medidas Parâmetros Estimadores
Número de elementos
Média ̅
Variância
Desvio Padrão
Fonte: Autor.
Classificam-se as medidas descritivas como: medidas posição (tendência central e
separatrizes), medidas de dispersão, medidas de assimetria e de curtose.
3.1. Medidas de tendência central
Segundo Neto (2008), nas medidas de tendência central, a média é a mais
importante das medidas estatísticas. A média é um valor típico de um conjunto de
dados que tende a se localizar em um ponto central. Por essa razão, medidas com
essa tendência são também denominadas medidas de tendência central. Vários
tipos de médias podem ser definidos, sendo as mais comuns a média aritmética, a
média aritmética ponderada, a mediana e a moda.
3.1.1. Média
Para se calcular a média aritmética, ou simplesmente média, de um conjunto
depende do tipo de dados. Para dados não agrupados é muito simples. Observe o
exemplo:
SACAVEIA, E. L. (2020) Página 28
As notas de um estudante em seis provas foram 8,4; 9,1; 7,2; 6,8; 8,7 e 7,8.
Determinar a média aritmética das notas.
Solução:
Observe que, na prática, o que realizamos foi somar todas as notas (48) e dividir
pela quantidade total de notas (6). Já que os números servem para “resumir” as
informações, vamos agora diminuir a quantidade de dados por meio de fórmulas.
Dessa maneira, a fórmula para a média aritmética fica assim representada:
∑
̅
Sendo ̅ a média aritmética, valores da variável, ∑ soma total dos valores da
variável, número total de valores. Vamos realizar outro exercício para dados não
agrupados utilizando, desta vez, a fórmula da média aritmética ponderada.
∑
̅
∑
Considere as notas na disciplina de FAI do professor Kakson, representadas na
tabela abaixo:
Notas dos alunos ( ) Número de alunos ( )
2 3 6
5 1 5
8 2 16
10 3 30
12 1 12
TOTAL 10 69
Fonte: Autor.
Para o cálculo da média, nos serviremos da fórmula da média aritmética
ponderada:
∑
̅ ∑
=
SACAVEIA, E. L. (2020) Página 29
R: A nota média dos alunos na disciplina de FAI foi de aproximadamente sete (7)
valores.
Por fim, vamos calcular a média aritmética para dados agrupados com intervalos
de classes. Quando os dados são apresentados em uma distribuição de frequência,
todos os valores incluídos num certo intervalo de classe são considerados
coincidentes com o ponto médio do intervalo. Para o cálculo da média aritmética
ponderada, utilizamos a Fórmula seguinte:
∑
̅
∑
Onde é o ponto médio da classe. Dessa forma, o raciocínio é o mesmo para a
média aritmética ponderada sem intervalos de classe.
Tabela 5: Alturas em cm dos alunos do curso de Estatística Sanitária do IPSN-2020
Alturas em cm (x)
[145-150[ 2 147,5 295
[150-155[ 4 152,5 610
[155-160[ 5 157,5 787,5
[160-165[ 7 162,5 1137,5
[165-170[ 3 167,5 502,5
[170-175[ 2 172,5 345
Total 23 ………… 3677,5
Fonte: Autor.
∑
̅ ∑
=
R: A altura média dos alunos do Curso de Estatística Sanitária do ITSN-2021 é de
aproximadamente um (1) metro e sessenta (60) centímetros.
3.1.2. Mediana
A mediana (Md) é o valor que ocupa a posição central da série de observações de
uma variável, em rol, dividindo o conjunto em duas partes iguais, ou seja, a
SACAVEIA, E. L. (2020) Página 30
quantidade de valores inferiores à mediana é igual à quantidade de valores
superiores a mesma (Bruni, 2008).
A mediana escreve-se abreviadamente pela seguinte expressão ( ̃ Num
simples rol, mediana calcula-se de duas maneiras:
a) Quando os dados forem de número ímpar, basta encontrar o ponto central,
isto é, encontrar o valor que antes dele e depois dele, tenha o mesmo
número de elementos;
Ex: 2, 4, 8, 10, 12
b) Quando os dados forem de número par, não haverá um ponto central. Nesse
caso, calcula-se o ponto médio dos dois valores centrais, com a ajuda da
média aritmética.
Ex: 1, 5, 7, 9, 10, 15
NOTA: Não se esqueça que, para fazer isso, é preciso que os elementos estejam em
um rol, isto é, apresentem-se em uma ordem crescente ou decrescente.
No caso de dados agrupados sem intervalos de classe, podemos utilizar um recurso
que nos auxilia a calcular a mediana, trata-se da coluna de frequências absolutas
acumuladas (Fi).
Tabela 6: Seja x, o número de faltas dos alunos de uma turma do IPSN-2021.
Nº de faltas (x) Nº alunos ( )
0 4 4
1 9 13
2 7 20
3 4 24
4 1 25
TOTAL 25 ……….. …………
Fonte: Autor.
SACAVEIA, E. L. (2020) Página 31
Onde = = =13
R: Na turma de estatística do ITSN houve 50% dos alunos com uma (1) falta.
Tabela 7: Seja x, o número de faltas dos alunos de uma turma do IPSN-2021.
X
0 3 3
1 8 11
2 7 18
3 7 25
4 5 30
Total 30 ………….. ………….
Fonte: Autor.
Sabe-se que: e
Logo
R: Na turma de estatística do ITSN houve 50% dos alunos com duas (2) faltas.
SACAVEIA, E. L. (2020) Página 32
Para os dados agrupados em classe o cálculo da mediana obedece os seguintes
passos:
a) Localizar a classe da mediana:
b) Obedecer a seguinte fórmula:
Tabela 8: Altura dos alunos de uma turma do IPSN-2021.
Alturas em cm (x)
[145-150[ 2 2
[150-155[ 4 6
[155-160[ 5 11
[160-165[ 7 18
[165-170[ 3 21
[170-175[ 2 23
Total 23 ………………
Fonte: Autor.
Resolução:
a)Localizar a mediana:
18
Pertence a 4ª classe:
R: há 50 dos alunos com alturas inferiores ou iguais a 160,36 cm.
SACAVEIA, E. L. (2020) Página 33
3.1.3. Moda
Em um conjunto de números, chamamos de moda o valor que ocorre com maior
frequência, isto é, o valor mais comum. É assim que podemos dizer que “o salário
modal dos empregados de uma indústria é o salário mais comum, isto é, o salário
recebido pelo maior número de empregados dessa indústria” (Magalhães & Lima,
2000).
Exemplo:
a) O conjunto 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 18; tem moda 9, é chamado de
unimodal;
b) O conjunto 3, 5, 8, 10, 12, 15, 16; não tem moda, é chamado de amodal;
c) O conjunto 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9 tem duas modas, 4 e 7. Nesse caso é
chamado bimodal;
d)O conjunto 2, 3, 4, 4, 4, 5, 5, 5, 7, 7, 7, 9 tem três modas, 4, 5 e 7. Nesse caso é
chamado multimodal.
Para dados agrupados sem intervalos de classe, é possível determinar
imediatamente a moda, como nos exemplos abaixo:
Tabela 9: Seja x, o número de faltas dos alunos de uma turma do IPSN-2021.
X
2 1
4 3
6 8
8 4
10 5
Total 21
=6
SACAVEIA, E. L. (2020) Página 34
Tabela 10: Seja x, o número de faltas dos alunos de uma turma do IPSN-2021.
X
2 10
3 7
4 8
5 10
6 9
Total 44
=2 e 5
Por último faremos o tratamento da moda (Mo) para os dados agrupados em
classe. O seu cálculo obedece os seguintes passos:
a) Localizar a classe modal, que é classe com maior frequência absoluta
b) Calcular a moda:
onde:
( )-
Tabela 11: Altura dos alunos de uma turma do IPSN.
Alturas em cm (x)
[145-150[ 2
[150-155[ 4
[155-160[ 5
[160-165[ 7
[165-170[ 3
[170-175[ 2
Total 23
Fonte: Autor.
SACAVEIA, E. L. (2020) Página 35
a)Localizar a classe modal (Mo).
A classe modal é aquela que apresenta maior frequência absoluta e localiza-se na
4ª classe [160 165[;
b)Calcular a moda:
=160
=161,67 cm
SACAVEIA, E. L. (2020) Página 36
3.1.4. Exercícios de Aplicação
1. Qual é a outra forma de medir os dados além de tabelas e gráficos?
2. Diferencie Parâmetros dos Estimadores?
3. Qual das medidas é mais importante nas medidas de tendência central?
4. Estabeleça a diferença dos seguintes elementos: média, moda, mediana?
5. Os dados a baixo referem-se as notas de 24 Alunos do Curso de Estatística
Sanitária do IPSN-2020, na Disciplina de Estatística Inferencial.
4 4 4 4
4 4 7 7
7 7 8 8
8 9 9 9
9 9 10 10
12 12 12 12
a) Calcula a média, mediana e moda?
6. Os dados a seguir estão relacionados com o peso de alguns estudantes do ITSN-
2019.
33 35 35 39 41 41 42 45 47 48
50 52 53 54 55 55 57 59 60 60
61 64 65 65 65 66 66 66 67 68
69 71 73 73 74 74 76 77 77 78
80 81 84 85 85 88 89 91 94 97
c) Calcula as todas as frequências apreendidas?
d) Calcule a média, mediana e moda?
SACAVEIA, E. L. (2020) Página 37
3.2. Medidas de Dispersão
A informação contida em variáveis quantitativas costuma ser analisada,
geralmente, por meios de medidas. As mais usuais são as medidas de posição
central (medidas de tendência central) como a média, mediana e moda,
apresentadas anteriormente (Milone, 2004).
As medidas de dispersão, objecto de análise deste capítulo, completam a
informação contida nas medidas de posição central, revelando o afastamento
absoluto ou relativo dos dados. Quanto maior for a dispersão, menor a informação
contida na medida de posição central (Milone, 2004).
Muitas das medidas de dispersão, como desvio médio absoluto, a variância ou o
desvio-padrão, analisam o afastamento em relação à média, mais tradicional e
utilizada medida de posição central (Bruni, 2008).
Segundo Pagano & Gravreau (2004), o objectivo das medidas de dispersão consiste
na medição da variabilidade. Dentre as mais usuais medidas de dispersão,
destacam-se: a amplitude total ou intervalo; desvio médio absoluto; a variância; o
desvio-padrão e o coeficiente de variação.
Quanto maior o valor encontrado para a medidas de dispersão, maior o
afastamento dos dados. Ou seja, menor a informação contida nas medidas de
posição central calculadas, como a média ou a mediana (Pagano & Gravreau
(2004).
3.2.1. Amplitude total
Representa a diferença entre o maior e o menor valor numérico de um conjunto de
dados analisados. Para determinar a amplitude sugere-se que os dados estejam
ordenados em um rol. A amplitude também é denominada intervalo, intervalo total
ou range e costuma ser representado pela letra R.
SACAVEIA, E. L. (2020) Página 38
A amplitude apresenta a vantagem de poder ser obtida de forma fácil e simples.
Porém, Em virtude de apenas analisar os extremos, sua interpretação pode tornar-
se razoavelmente difícil, já que os extremos aberrantes (extraordinariamente
grandes ou pequenos) distorcem quaisquer cálculos que o envolvam.
3.2.2. Desvio médio absoluto (DMA)
Segundo Pagano & Gravreau (2004), o desvio médio absoluto analisa a dispersão
dos dados em torno de um valor central, representado pela média aritmética.
Corresponde ao somatório do módulo da diferença de cada número pertencente ao
conjunto e sua média aritmética, posteriormente dividido pela quantidade de
números do conjunto. Representa o afastamento médio dos pontos em relação à
média. Algebricamente apresenta-se da seguinte forma:
∑| ̅|
Onde:
O desvio médio absoluto apresenta vantagem de trabalhar com todos os valores da
série, amenizando os problemas da análise da amplitude total. Ele também possui
pontos fracos, dentre os quais podem ser destacados o facto de ser sensível a
valores extremos aberrantes e, computacionalmente, apresentar uma metodologia
de cálculo um pouco mais complexa. Na extracção do módulo é preciso considerar
o sinal da grandeza envolvida nos cálculos.
3.2.3. Variância ( Desvio padrão (
Como forma de amenizar os problemas computacionais associados à extracção dos
módulos das diferenças para o cálculo do DMA, uma outra alternativa envolvida é a
elevação das diferenças obtidas ao quadrado. Qualquer número real, positivo ou
SACAVEIA, E. L. (2020) Página 39
negativo, quando elevado a expoente par, torna-se positivo (Pagano & Gravreau
(2004).
A variância corresponde ao somatório do quadrado da diferença entre cada
elemento e sua aritmética, posteriormente dividido pela quantidade de elementos
do conjunto. Algebricamente, a variância pode ser apresentada como:
∑ ̅
Onde:
A maior desvantagem decorrente da análise da variância diz respeitoà
impossibilidade de comparação entre a variância e a média.
O Desvio Padrão, resolve o problema decorrente da análise da variância,
representada pelo facto de esta apresentar grandezas elevadas ao quadrado. O
desvio-padrão corresponde a raiz quadrada da variância, ou a raiz quadrada do
somatório do quadrado da variância entre os elementos de um conjunto e a sua
média aritmética, posteriormente dividido pela quantidade de números do
conjunto. Algebricamente, o desvio-padrão pode ser calculado mediante a seguinte
equação:
∑
√ √
Onde:
SACAVEIA, E. L. (2020) Página 40
Embora apresente um cálculo razoavelmente extenso, o desvio padrão tem uma
praticidade e empregabilidade muito grande em estatística. Geralmente é a medida
de dispersão mais empregada.
3.2.4. Variância ( e Desvio padrão ( ) amostral
Quando os dados analisados correspondem a uma amostra composta por menos
de 30 elementos, a variância é calculada de forma polarizada, com a redução de um
grau de liberdade do denominador ( . No cálculo amostral, a variância é
geralmente denominada pela letra elevada ao quadrado, ou:
∑ ̅
O desvio padrão amostral é representado por e pode ser apresentado
algebricamente através da seguinte equação:
∑ ̅
√ √
Nota: o desvio padrão e variância podem ser calculados de forma amostral (partes
do todo) ou populacional (o todo).
Dada a amostra composta pelos seguintes elementos { }. O primeiro
passo consiste em transformar os dados brutos em rol:{ }.
SACAVEIA, E. L. (2020) Página 41
Tabela 12: Cálculo do desvio médio absoluto.
| ̅|
1 4 8
2 6 6
3 12 0
4 16 4
5 22 10
Soma 60 28
n 5 5
Soma/n 12 5,6
Fonte: Autor.
∑| ̅|
,
O valor encontrado para DMA foi igual a 5,6; indicando que os números se afastam
em média 5,6 da média aritmética dos dados analisados.
Tabela 13: Cálculo da Variância.
̅
1 4 64
2 6 36
3 12 0
4 16 16
5 22 100
Soma 60 216
N 5 5
Soma/n 12 43,2
Fonte: Autor.
∑ ̅
=
4ºDesvio padrão.
SACAVEIA, E. L. (2020) Página 42
∑
√ √ =√
3.2.5. Medidas de Dispersão para dados agrupados
De forma similar, o desvio padrão também pode ser calculado para dados
agrupados. Para obter as demais medidas solicitadas é preciso calcular a média.
Como a média representa uma soma ponderada dos valores por suas respectivas
frequências. Podem-se construir os somatórios com auxílio da tabela seguinte.
Tabela 14: Idades dos alunos do Colégio Pitágoras do Namibe-2020
12 5 60
14 4 56
18 3 54
22 10 220
26 4 104
Soma 26 494
Fonte: Autor.
∑
A média é igual a: ̅ ∑
=
Para obter o desvio médio absoluto, é preciso obter o somatório de cada valor,
subtraído da média, apresentado em valor absoluto e multiplicado por sua
frequência (| ̅| ), o que pode ser feito com o auxílio da tabela seguinte.
SACAVEIA, E. L. (2020) Página 43
Tabela 15: Idades dos alunos do Colégio Pitágoras do Namibe-2020
| ̅|
12 5 35
14 4 20
18 3 3
22 10 30
26 4 28
Soma 26 116
Fonte: Autor.
∑| ̅|
O desvio médio absoluto é igual a: DMA =
∑
O cálculo da variância populacional ou amostral e o desvio padrão, pode ser feito
com auxílio da tabela seguinte:
Tabela 16: Idades dos alunos do Colégio Pitágoras do Namibe-2020
̅
12 5 245
14 4 100
18 3 3
22 10 90
26 4 196
Soma 26 634
Fonte: Autor.
A variância populacional pode ser obtida mediante o emprego da fórmula
apropriada e das somas apresentadas na tabela anterior.
∑ ̅ ]
∑
De forma similar, pode-se obter a variância amostral.
∑ ̅ ]
∑
SACAVEIA, E. L. (2020) Página 44
O desvio padrão populacional corresponde à raíz quadrada da variância
populacional. Algebricamente:
∑ ̅ ]
√ √ √
∑
Empregando procedimentos idênticos, pode-se obter o desvio padrão amostral.
∑ ̅ ]
√ √ √
∑
3.2.6. Medidas de Dispersão para dados agrupados em Classes
Quando os dados estão apresentados em classes de frequência, é preciso
representar cada classe por seu ponto médio e repetir os procedimentos descritos
anteriormente. A média será igual a ponderação dos pontos médios por suas
respectivas frequências. Veja a seguinte.
Tabela 17: Facturamentos mensais (em $ mil) de 15 empresas de Moçâmedes-2020.
Classe
05|-15 10 1 10
15|-25 20 3 60
25|-35 30 4 120
35|-45 40 3 120
45|-55 50 4 200
Soma ………. 15 510
Fonte: Autor.
∑
A média será: ̅= ∑
SACAVEIA, E. L. (2020) Página 45
O desvio médio absoluto, a variância e o desvio padrão podem ser calculados com
o apoio da tabela apresentada a seguir.
Tabela 18: Facturamentos mensais (em $ mil) de 15 empresas de Moçâmedes-2020.
Classe | ̅| ̅
05|-15 10 1 10 24 576
15|-25 20 3 60 42 588
25|-35 30 4 120 16 64
35|-45 40 3 120 18 108
45|-55 50 4 200 64 1.024
Soma …….. 15 510 164 2.360
Fonte: Autor.
∑| ̅|
Cálculo do desvio médio absoluto: DMA =
∑
∑[ ̅̅̅ ]
Cálculo da variância populacional:
∑
∑[ ̅̅̅ ]
Cálculo da variância amostral:
∑
Cálculo do desvio padrão populacional:
∑ ̅ ]
√ √ √
∑
Cálculo de desvio padrão amostral.
∑ ̅ ]
√ √ √
∑
De um modo geral, o desvio padrão representa a mais clássica medida de dispersão
da estatística. Dados quantitativos são comummente sintetizados por meio da
apresentação de uma medida de posição central, comummente a média, e uma
medida de dispersão, comummente o desvio padrão.
SACAVEIA, E. L. (2020) Página 46
As medidas de dispersão relativa analisam a media e o desvio padrão de uma única
vez, através do cálculo da razão existente entre ambos. A mais usual medida de
dispersão relativa é o coeficiente de variação representado pela razão entre o
desvio padrão e a média aritmética. Algebricamente, o coeficiente de variação, ou,
simplesmente, CV, pode ser apresentado como:
=
̅
Onde:
̅ ou = Média aritmética
ou = Desvio padrão
A grande utilidade do coeficiente de variação é permitir a comparação da
variabilidade de diferentes conjuntos de dados.
Se: CV 15% Baixa dispersão: Homogênea, estável, regular.
15% CV 30% Média dispersão.
CV 30% Alta dispersão – Heterogênea.
Por exemplo, em uma prova de Registo Sanitário, nota média de turma formada
por 40 alunos foi igual 28 e desvio padrão foi igual 4. Em FAI, o grau médio da
turma foi igual a 25 com desvio padrão igual a 3,6. Que matéria apresentou a maior
dispersão relativa? Expressa através do coeficiente de variação.
Tabela 19: Coeficiente de variação das cadeiras de Registo Sanitário e FAI-2020.
A B
Desvio padrão 4,00 3,60
Média 28,00 25,00
CV 0,143 0,144
Fonte: Autor.
Logo, as notas obtidas em física apresentaram maior dispersão que as notas
obtidas em cálculo.
SACAVEIA, E. L. (2020) Página 47
3.2.7. Exercícios de Aplicação
1. Das medidas de resumo, qual delas é a mais usual?
2. Qual é o objectivo da medida de dispersão?
3. Faça uma análise das medidas de dispersão em função do afastamento?
4. Estabeleça a diferença entre: DMA, Variância, Desvio Padrão?
5. Qual é a medida de dispersão mais utilizada?
6. Qual é a medida de dispersão relativa mais usual? O que ela representa?
7. Os dados a baixo referem-se as notas de 24 Alunos do Curso de Estatística
Sanitária do IPSN-2020, na Disciplina de Estatística Inferencial.
4 4 4 4
4 4 7 7
7 7 8 8
8 9 9 9
9 9 10 10
12 12 12 12
b) Calcula os seguintes elementos: DMA, Variância, Desvio Padrão?
8. As notas de 50 alunos em um teste foram: 75 89 66 52 90 68 83 94 77 60 38 47
87 65 97 58 82 49 65 70 73 81 85 77 83 56 63 79 82 84 69 70 63 62 75 29 88
74 37 81 76 74 63 69 73 91 87 76 71 71.
a) Calcule as medidas de dispersão.
9. Uma pesquisa sobre o consumo de gasolina deu os seguintes valores para a
quilometragem percorrida por três marcas de carro (da mesma classe), em
cinco testes com um tanque de 40 litros:
Carro A 400 397 401 389 403
Carro B 403 401 390 378 395
Carro C 399 389 403 387 401
a) Utilize a medida mais adequada para comparar o desempenho dos carros?
SACAVEIA, E. L. (2020) Página 48
3.3. Medidas de Posição (Ordenamento)
Os procedimentos de análise de variáveis quantitativas costumam empregar
medidas de posição central, como a média, associadas a medidas de dispersão,
como o desvio padrão, no processo de síntese das informações contidas em
diferentes bases de dados. Porém, medidas como a média e o desvio padrão
costumam ser fortemente influenciadas pela presença eventual de valores
extremos.
A presença de irregularidades, como valores extremos ou distribuições de
frequência não convencionais, motiva a necessidade da aplicação e interpretação
de outras medidas, como as de posição. Este capítulo objectiva apresentar da
forma mais simples e clara possível os principais conceitos referente às medidas
de ordenamento (posição).
As medidas de ordenamento fornecem uma ideia sobre a distribuição dos dados
ordenados. Apresentam a vantagem de não serem afectadas pela forma de
distribuição dos dados analisados ou por valores extremos.
Um exemplo de medida de posição já trabalhado anteriormente é dado pela
mediana, que representa o ponto central de uma série ordenada de dados. Em
relação à mediana 50% dos dados são superiores e 50% são inferiores. A mediana
é, ao mesmo tempo, medida de posição central e de ordenamento.
Ao analisar uma pesquisa feita em determinado shopping center, um analista de
marketing encontra uma mediana igual a $ 80,00. Assim, com base na mediana
pode-se dizer que um cliente com gasto igual a $ 170,00 encontra-se acima da
mediana. É um cliente que relativamente, gasta mais.
Porém a mediana representa apenas o ponto central da série. Muitas vezes, é
preciso aumentar a informação da análise feita. Surge a necessidade do uso de
outras medidas como, quartis, decis, e percentis, que dividem a série ordenada de
dados em quatro, dez e cem partes, respectivamente.
SACAVEIA, E. L. (2020) Página 49
3.3.1. Quartis
Dividem a distribuição ordenada em quatro partes iguais. Pode ser obtido por
meio da aplicação da seguinte expressão:
[ ]
Onde:
Por exemplo: Pede-se para obter os quartis da seguinte série bruta de dados, que
apresenta as idades de uma amostra de crianças da creche cantinho feliz:
{ }. Para encontrar os quartis, é necessária a obtenção do rol. No
caso, rol é: { } Atribuíndo números aos elementos do rol, tem-se a
representação seguinte.
i 1 2 3 4 5 6
1 2 3 5 6 9
Para o primeiro quartil, tem-se que:
[ ] [ ]
Ou seja, o primeiro quartil é igual ao segundo elemento ( da série ordenada, que
é igual a 2. Para obter o segundo quartil, basta aplicar a mesma fórmula.
[ ]
O segundo quartil é igual ao elemento 3,5 (entre o elemento e o elemento ) da
serie ordenada, que e igual a média entre 3 e 5, que é igual a 4. Podemos resolver a
mesma questão de outra forma:
[ ]
SACAVEIA, E. L. (2020) Página 50
A obtenção do terceiro quartil também é feita mediante o emprego da fórmula:
[ ]
O terceiro quartil é igual ao elemento 5º da série ordenada, que é igual a 6. Em
outras palavras, os números 2, 4 e 6 dividem a série ordenada em quatro partes
iguais, cada uma contendo um elemento.
Para determinar medidas de posição (ordenamento), como os quartis, em algumas
ocasiões é preciso aplicar o procedimento abaixo indicado. Por exemplo, para
encontrar o terceiro quartil da série de dados: {3, 7, 9, 11, 15,}, pode-se aplicar a
fórmula anterior:
[ ]
3.3.2. Decis
Dividem a distribuição ordenada em dez partes iguais. Ampliam informação
contidas na mediana e nos quartis. Os decis podem ser obtidos por meio da
aplicação da seguinte expressão:
[ ]
Onde:
SACAVEIA, E. L. (2020) Página 51
3.3.3. Percentis
Percentis: Dividem a distribuição ordenada em 100 partes iguais. Ampliam
informação contidas na mediana, nos quartis e nos decis. Os Percentis podem ser
obtidos por meio da aplicação da seguinte expressão:
[ ]
Onde:
Quartis ampliam a informação contida na mediana. Em relação ao exemplo
anterior, sobre os gastos feitos em determinado shopping center, supondo quartis
iguais a $35,00; $ 80,00; $130,00; pode-se afirmar que um cliente com gasto igual a
$170,00 encontra-se acima do terceiro quartil. É um elemento que faz parte do
grupo formado por 25% dos clientes que mais gastam.
RESOLVA:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
62 65 76 82 98 106 110 119 122 137 140 159 193 197 201 219
a) Calcule os Quartis (1; 2; 3), Decis (5; 6; 9) e Percentis: 25; 50; 75; 90 .
SACAVEIA, E. L. (2020) Página 52
No caso de dados agrupados sem intervalos de classe, podemos utilizar um recurso
que nos auxilia a calcular a mediana: a coluna de frequências acumuladas (Fi).
Tabela 20: Nº de faltas dos alunos do Curso de Fisioterapia do ITSN-2020.
Nº de faltas (x) Nº alunos
0 4 4
1 9 13
2 7 20
3 4 24
4 1 25
25 ……….. …………
Fonte: Autor.
Servindo-se das fórmulas anteriores podemos calcular o quartil (2; 3), decil (5; 7) e
percentil (50; 75).
[ ] [ ]
[ ] [ ]
[ ] [ ]
SACAVEIA, E. L. (2020) Página 53
3.3.4. Medidas de posição para dados agrupados em classe
Para os dados agrupados em classe o cálculo das medidas de posição obedece os
seguintes passos:
a) Localizar a classe do Quartil, Decil e Percentil:
∑ ∑ ∑
b) Obedecer a seguinte fórmula:
Tabela 20: Altura dos alunos de uma turma do IPSN-2021.
Alturas em cm (x)
[145-150[ 2 2
[150-155[ 4 6
[155-160[ 5 11
[160-165[ 7 18
[165-170[ 3 21
[170-175[ 2 23
Total 23 ………………
Fonte: Autor.
Resolução:
a) Localizar a classe do Quartil:
∑
Pertence a 2ª classe:
SACAVEIA, E. L. (2020) Página 54
∑
RESOLVA: .
SACAVEIA, E. L. (2020) Página 55
3.3.5. Exercícios de Aplicação
1. Que elemento tem influenciado fortemente a média e o desvio padrão?
2. Qual é a razão da utilização das medidas de posição?
3. Cite a medida que pertence ao mesmo tempo nas medidas de tendência central
e nas medidas de ordenamento (posição)?
4. Quartis, Decis, Percentis, dividem o conjunto de dados ordenados em quantas
partes?
5. Durante o mês de Dezembro do ano passado a Fábrica ALC, Lda registou uma
quantidade de defeitos em lotes já mais verificada desde o início da sua
actividade, descrita na tabela a seguir.
2 1
4 3
6 4
10 3
12 3
16 6
TOTAL 20
a) Calcula o coeficiente de variação?
b) Calcula os seguintes elementos: Quartis 1, 2 e 3; Decis 2, 5 e 7, Percentis 10,
25, 50, 75 e 90?
6. Um centro de saúde registou na tabela seguinte as idades dos pacientes
atendidos em uma semana do mês de Agosto do ano 2021.
Classe
3|---7 5
7|---11 8
11|---15 17
15|---19 6
19|---|23 4
TOTAL 40
a) Calcule o coeficiente de variação?
b) Calcula os seguintes elementos: Quartis 1e 3, Decis 3 e 9, Percentis 10 e 90?
SACAVEIA, E. L. (2020) Página 56
3.4. Simetria e curtose
Estas medidas referem-se à forma da curva de uma distribuição de frequência,
mais especificamente do polígono de frequência ou do histograma. Denomina-se
assimetria o grau de afastamento de uma distribuição da unidade de simetria.
3.4.1. Simetria
Em uma distribuição simétrica, tem-se igualdade dos valores da média, mediana e
moda: ̅.
𝑋̅ 𝑀 𝑀𝑒
Toda distribuição deformada é sempre assimétrica. Entretanto, a assimetria pode
dar-se na cauda esquerda ou na direita da curva de frequências. Em uma
distribuição assimétrica positiva, ou assimetria à direita, tem-se: ̅.
𝑀 𝑀𝑒 𝑋̅
SACAVEIA, E. L. (2020) Página 57
Em uma distribuição assimétrica negativa, ou assimetria à esquerda, predominam
valores inferiores à Moda: ̅ .
𝑋̅ 𝑀𝑒 𝑀
Existem várias fórmulas para o cálculo do coeficiente de assimetria. As mais
utilizadas são:
o 1º Coeficiente de Pearson
Onde:
̅
o 2º Coeficiente de Pearson
Onde:
SACAVEIA, E. L. (2020) Página 58
Quando:
o
o
o
3.4.2. Curtose
Curtose é o grau de achatamento (ou afilamento) de uma distribuição em
comparação com uma distribuição padrão (chamada curva normal). De acordo
com o grau de curtose, classificamos três tipos de curvas de frequência:
o Mesocúrtica: é uma curva básica de referência chamada curva padrão ou
curva normal;
o Platicúrtica: é uma curva mais achatada (ou mais aberta) que a curva
normal;
o Leptocúrtica: é uma curva mais afilada que a curva normal;
SACAVEIA, E. L. (2020) Página 59
Para medir o grau de curtose utiliza-se o coeficiente:
Onde:
o Se K= 0,263, diz-se que a curva correspondente à distribuição de frequência
é mesocúrtica.
o Se K > 0,263, diz-se que a curva correspondente à distribuição de
frequência é platicúrtica.
o Se K < 0,263, diz-se que a curva correspondente à distribuição de
frequência é leptocúrtica.
SACAVEIA, E. L. (2020) Página 60
3.4.3. Exercícios de aplicação
1. Em que se referem a simetria e curtose?
2. O que é simetria?
3. Diferencie distribuição simétrica da assimétrica?
4. Quanto a curtose, como se classificam as curvas?
5. Durante o mês de Dezembro do ano passado a Fábrica ALC, Lda registou uma
quantidade de defeitos em lotes já mais verificada desde o início da sua
actividade, descrita na tabela a seguir.
2 1
4 3
6 4
10 3
12 3
16 6
TOTAL 20
a) Calcula o coeficiente de variação?
b) Calcula os seguintes elementos: Quartis 1, 2 e 3; Decis 2, 5 e 7, Percentis 10,
25, 50, 75 e 90?
6. Um centro de saúde registou na tabela seguinte as idades dos pacientes
atendidos em uma semana do mês de Agosto do ano 2021.
Classe
3|---7 5
7|---11 8
11|---15 17
15|---19 6
19|---|23 4
TOTAL 40
a) Para a tabela apresentada encontre: o coeficiente de variação?
b) Calcula os seguintes elementos: Quartis 1e 3, Decis 3 e 9, Percentis 10 e 90?
c) Calcule o grau de assimetria (1º coeficiente de Pearson) e curtose?
SACAVEIA, E. L. (2020) Página 61
UNIDADE IV: PROBABILIDADE
As situações marcadas pela possibilidade de ocorrência de mais de um resultado
possível costumam ser analisadas em Estatística com auxílio das probabilidades.
Pretende-se que ao culminar desta unidade o aluno deverá absorver o seguinte:
• Descrever a resenha histórica de probabilidades;
• Definir probabilidade;
• Explicar os conceitos básicos de probabilidades (Experimento aleatório,
espaço amostral e eventos);
• Representar probabilidades em diagramas de vem;
• Resolver exercícios relacionados com o tema em causa.
4. PROBABILIDADE
4.1. História da probabilidade
A história do estudo das probabilidades se inicia, provavelmente, com o homem
das cavernas, que sentia temor e perplexidade ante os fenómenos naturais, porque
não podia explicá-los. Mitos e magias dominavam o seu pensamento. Então, de
forma lenta e gradual o homem primitivo começou a compreender a natureza e
aprendeu a respeitá-la e a melhor aproveitá-la. Assimilou que diversos dos
fenómenos incertos poderiam ser modelados e melhor entendidos. Assim, fez
nascer as primeiras aplicações práticas para as probabilidades.
Os primeiros cálculos de probabilidades foram feitos pelos italianos quinhentistas,
que só tinham as preocupações de comparar as frequências de ocorrência e
estimular ganhos de jogos de azar, sem a preocupação de formulação de
postulados ou produção de teoremas.
Um dos primeiros estudiosos da probabilidade foi Cardano que introduziu técnicas
de análises combinatória para calcular a quantidade de possibilidades favoráveis
em um evento aleatório. Além deste citam-se os trabalhos de Pacioli, Tartaglia e
Galileu, este último, porém, sem muito destaque. As técnicas desenvolvidas pelos
matemáticos citados eram simples e restritas a casos numéricos.
Em 1600, Francois Viéte inventou o cálculo literal, e com a álgebra desenvolvida
por Descartes em 1630, foi capaz de resolver problemas que envolvessem muitas
possibilidades os eventos de natureza genérica. Contudo, só a partir da metade do
século XVII apareceram as condições para a abordagem geral de probabilidades.
Da forma como é conhecida e trabalhada hoje, a probabilidade surgiu em meados
do século XVII, a partir dos trabalhos de estudiosos franceses: o cavaleiro De Mére,
um nobre de vida faustosa, Blaise Pascal, e Pierre de Fermat, dois matemáticos de
horas vagas. Pascal tinha como interesses principais a física, a religião, além da
geometria projectiva. Fermat era jurista, com grande interesse em geometria
analítica e teoria dos números.
SACAVEIA, E. L. (2020) Página 63
4.2. Definição de probabilidade
A probabilidade representa a relação entre o número de eventos favoráveis ao que
se estuda em relação ao número possível de eventos.
A probabilidade ) de ocorer um evento é igual ao número de maneiras pelas
quais pode ocorrer dividido pelo número total de maneiras pelas quais o evento
pode ocorrer. Expressando algebricamente:
)=
Para quantificar o número de eventos favoráveis e o número de eventos possíveis,
diferentes métodos podem ser empregados:
Método clássico: Quando o resultado é provável. Seu emprego é bastante comum
nas situações didácticas que envolvem, por exemplo, dados, moedas ou baralhos.
Nestas situações, sabe-se, previamente, quais os resultados possíveis e, destes,
quantos são favoráveis. Por exemplo, a probabilidade de extrair a face cara de uma
moeda é igual ½; a probabilidade de extrair uma carta de paus de um baralho é
igual a 1/4.
Método empírico: Depende da frequência de ocorrer o evento, determinada a
partir de uma série de observações práticas anteriores. Por exemplos, caso se
conheça que dos 1.000 habitantes de um pequeno vilarejo 480 são do sexo
feminino, estima-se que a probabilidade de um habitante escolhido ao acaso ser do
sexo feminino 480/1.000, ou 0.48 ou 48%. Neste caso a probabilidade esta
associada a frequência relativa %) dos eventos analisados.
Método subjectivo: A probabilidade é estimada com base em opinião pessoal. Por
exemplo, um cientista político pode estimar que a probabilidade de vitória da
oposição na próxima eleição presidencial seja igual a 60%.
Independentemente do método empregado, aplicar probabilidade significa usá-la
em situação em que não se pode prever um resultado futuro. Os resultados são
incertos, regidos pelo acaso.
SACAVEIA, E. L. (2020) Página 64
4.3. Terminologia e conceitos
Para poder estudar probabilidades, torna-se necessário definir alguns conceitos e
terminologias usuais, como os relativos a experimento aleatório, espaço amostral e
eventos.
Experimento aleatório: Um experimento aleatório consiste em um fenómeno
caracterizado por múltiplos resultados possíveis, para os quais modelos não
determinísticos são apropriados. Como exemplos de experimentos aleatórios,
podem ser citados:
Espaço amostral: Um conjunto de resultados totais pode ser obtido ao ser
realizado uma experiência, embora um e somente um resultado possa ser obtido
por vez. O conjunto de resultados possíveis de um experimento é chamado de
espaço amostral. Ou seja, para cada experimento considerado, o espaço amostral
representa o conjunto de todos os resultados possíveis do experimento.
Considerando os experimentos aleatórios anteriores, o espaço amostral para cada
um deles pode ser descrito como:
: {1; 2; 3; 4; 5 ; 6};
: {0; 1; 2; 3};
: {bola preta; amarela; branca}
Eventos: Representam subconjuntos dos resultados possíveis, ou seja
subconjuntos do espaço amostral. Em relação aos experimentos aleatórios
apresentados anteriormente podem ser citados como eventos:
: {2; 4; 6}; isto é, um nº par ocorre.
SACAVEIA, E. L. (2020) Página 65
: {2}; isto é, duas caras ocorrem
: {bola preta}; isto é, bola preta ocorre.
4.4. Uniões e intersecções
A consideração de mais que um evento em operações com probabilidades pode
envolver análises de uniões ou intersecções. Uniões significam que um ou outro
evento deve ser considerado. São representadas pela expressão “ou” e pelo
símbolo “ ”. Considera-se os seguintes eventos:
A = {Extrair a face 2 do lance de um dado ou honesto}.
B = {Extrair uma a face ímpar do lance de um dado honesto}.
O evento (A B) apresenta o espaço amostral S ={1,2,3,5}. Todos os elementos de
A e todos os elementos de B são considerados no espaço amostral.
Intersecções significam que apenas elementos em comum devem ser considerados.
São representadas pela expressão “e” e pelo símbolo “ ”. Considera-se os seguintes
eventos:
A = {Extrair a face 2 do lance de um dado ou honesto}.
C = {Extrair uma face par do lance de um dado honesto}.
O evento (A C) apresenta o espaço amostral S= {2}. A única intersecção é o
elemento 2.
4.5. Eventos excludentes e exaustivos
Operações com probabilidades podem envolver considerações sobre eventos
exaustivos ou Excludentes. Veja as definições apresentadas a seguir.
4.5.1. Eventos mutuamente exclusivos ou excludentes
São aqueles que não ocorrem simultaneamente. Não existe elemento comum entre
si. Quer dizer, a ocorrência de um evento impede a ocorrência de outro. Isso pode
ser observado no nosso dia-a-dia, como comer e respirar: ouvir duas pessoas ao
mesmo tempo. Diferenciam-se, portanto, dos não mutuamente exclusivos em que a
SACAVEIA, E. L. (2020) Página 66
ocorrência de um não impede a ocorrência de outro. O cálculo da probabilidade de
dois eventos ocorrerem juntos (simultaneamente) é feito pela regra da
multiplicação.
Figure 1: Eventos mutuamente exclusivos
Se A e B são mutuamente exclusivos, sua intersecção resulta em um conjunto vazio,
A B = {vazio} e a probabilidade de ocorrência conjunta dos dois eventos é nula,
P(A e B)= 0
4.5.2. Eventos colectivamente exaustivos
São aqueles que esgotam todas as probabilidades dentro do espaço amostral. A
soma da probabilidade dos eventos colectivamente exaustivos é sempre igual a 1
(100%).
Figure 2: Eventos colectivamente
exaustivos
Se A e B são colectivamente exaustivos, a união de ambos resulta no próprio
espaço amostral, A ou B é ={Espaço amostral}. A probabilidade de união dos dois
eventos é igual a 100%, P (A ou B) = 1=100%.
Geralmente, quando dois eventos são colectivamente exaustivos, diz-se que um
deles é complemento do outro. Assim, no caso dos eventos A e B apresentados na
figura anterior, diz-se que B é complemento de A (ou vice/versa). O complemento
de A pode ser apresentado em diferentes formas, como , ou ̅.
SACAVEIA, E. L. (2020) Página 67
Veja os exemplos apresentados a seguir, em que os eventos são classificados como
mutuamente exclusivos ou excludente ou colectivamente exaustivos.
a) Extrair uma carta vermelha e extrair uma carta de ouros de um baralho. Estes
são eventos que não são mutuamente excludentes nem colectivamente
exaustivos. É possível extrair uma carta que seja ao mesmo tempo vermelha e
de ouros (ouros é um dos naipes vermelhos do baralho), o que impede o facto
de os eventos serem mutuamente excludentes. Além disso, as cartas dos naipes
pretos não seriam incluídas. Logo, também não são eventos colectivamente
exaustivos.
b) Extrair uma carta vermelha e extrair uma carta de paus de um baralho. Como
paus é um naipe preto, os eventos são mutuamente excludentes. Não são
colectivamente exaustivos, já que outras cartas do baralho não seriam
incluídas.
c) Extrair uma carta vermelha e extrair uma carta preta de um baralho. Estes são
eventos mutuamente excludentes e colectivamente exaustivos. Não é possível
que uma carta seja das duas cores ao mesmo tempo. Como no baralho só
existem cartas destas duas cores, o evento é colectivamente exaustivo, também.
d) Extrair cara e extrair coroa do lance de uma moeda. Estes também são eventos
simultaneamente mutuamente excludentes e colectivamente exaustivos. Não é
possível que uma face seja cara e coroa ao mesmo tempo. Como na moeda só
existem estas duas faces, o evento é colectivamente exaustivo também.
e) Extrair face par e extrair 5 do lance de um dado. Como 5 é um número impar os
eventos são mutuamente excludentes. Não são colectivamente exaustivos, já
que outros números do dado não seriam incluídos. Faltariam os números 1 e 3.
f) Extrair face par e extrair 2 do lance de um dado. Já que 2 é um número par,
estes são eventos que não são nem colectivamente exaustivos nem
mutuamente excludentes.
SACAVEIA, E. L. (2020) Página 68
4.6. Princípios básicos de probabilidade
O entendimento das operações com probabilidades depende da compreensão do
significado de alguns termos próprios, como eventos excludentes, exaustivos ou
complementares, além das propriedades elementares envolvidas. Veja alguns dos
conceitos apresentados a seguir:
a) A Probabilidade de um evento ocorrer deve estar entre 0 e 1
Apresenta uma noção simples e importante. Já que a probabilidade apresenta a
relação entre os numeros de eventos favoráveis e possíveis , o número de eventos
favoráveis fica limitado entre zero e o número de eventos possíveis. Assím, pode-se
dizer que a menor probabilidade de ocorrência de um determinado evento é igual
a zero e o maior valor é igual a 1 ou 100%. Algebricamente, tem-se que:
b) A probabilidade do espaço amostral é igual a 1
Naturalmente, o espaço amostral abrange todos os eventos possíveis. Assim, ao
considerar a probabilidade do espaço amostral, observa-se que o número de
eventos favoráveis é igual ao número de eventos possíveis. Assim, a probabilidade
será igual a 1 ou 100%. Algebricamente, tem-se que:
c) A probabilidade de ocorrência de eventos mutuamente excludentes é
nula
Eventos mutuamente excludentes são aqueles que não apresentam elementos em
comum. A ocorrência de um determinado evento impede a ocorrência do outro
evento. Por exemplo, a extracção de uma carta vermelha e de uma carta preta são
eventos mutuamente excludentes. Não é possível que uma carta seja vermelha e
preta ao mesmo tempo.
Se dois eventos forem mutuamente excludentes, não existe intersecção entre eles.
Algebricamente considerando eventos mutuamente excludentes, tem-se
que:
SACAVEIA, E. L. (2020) Página 69
A probabilidade de eventos mutuamente excludentes ocorrerem ao mesmo tempo
é zero, ja que não a elemento comum entre eles.
d) A probabilidade de ocorrência de eventos colectivamente exaustivos é
igual a 1
Eventos colectivamente exaustivos são aqueles que contemplam todo os espaço
amostral. Assim, a probabilidade de ocorrência destes eventos é igual à
probabilidade de ocorrência do próprio espaço amostral, que é igual a 1 ou 100%.
Se dois eventos forem colectivamente exaustivos, a soma das probabilidades da
ocorrência de um ou outro é igual a 1 ou 100%. Algebricamente, tem-se que:
No lance de um dado honesto, os eventos {sair face par} e {sair face ímpar} são
eventos colectivamente exaustivos. Logo, a probabilidade de {sair face par ou sair
face ímpar} será igual a 1 ou 100%.
e) A probabilidade de um complemento é igual a 1 menos a
probabilidade do evento
Se é complemento de A, isto é, os elementos do espaço amostral não
pertencentes a A, a probabilidade é igual à probabilidade de A tendo sido
subtraída de 1. Algebricamente, tem-se que:
Considerando os eventos associados ao nascimento de um bebé {ser do sexo
masculino} e {ser do sexo feminino}, sabendo que a probabilidade de nascimentos
de homens é igual a 48%, encontra-se que a probabilidade associada ao
nascimento de uma menina será igiual a (1 – 48%), que resulta em 52%.
4.7. Representando probabilidades em diagrama de venn
Uma forma fácil e simples de representar probabilidades pode ser feita com
auxílios de gráficos que mostrem os diferentes conjuntos e subconjuntos
analisados. Estes gráficos costumam ser apresentados sob a denominação de
diagramas de venn. Os diagramas consistem em uma forma lúdica e fácil de
SACAVEIA, E. L. (2020) Página 70
representar as probabilidades associadas a dois ou mais eventos, mutuamente
exclusivos ou não.
Os diagramas de venn representam os conjuntos analisados, apresentando
elementos ou probabilidades. Por exemplo, imagine uma turma de 27 alunos do 2º
ano do curso de estatística revele 15 indivíduos do género masculino. A
representação dos números pode ser feita com o auxílio do diagrama da figura a
seguir:
Masculino
15
12
S=27
Figure 3: Diagrama de venn
apresentado com frequências
absolutas.
Em relação ao exemplo anterior da classe de Estatística do 2º ano onde constam 27
estudantes dos quais 15 são do género masculino e 12 do feminino, pode admitir a
existência de um segundo evento, que é o estudante gostar da disciplina de
estatística. Supondo que 10 do total de estudantes dizem gostar de estatística. Faça
no espaço abaixo uma nova representação do diagrama de venn.
4.8. Principais teoremas
Nas operações com probabilidades, torna-se necessário conhecer e aplicar dois
teoremas fundamentais da álgebra das probabilidades: o teorema do produto e o
teorema da soma. A compreensão e o emprego dos dois teoremas facilita em
grande parte as operações algébricas com probabilidades.
4.8.1. Teorema da soma
Aplica-se nas operações aditivas de probabilidades. Operações aditivas geralmente
envolvem a expressão “ou” e são representados pelo símbolo de união “ ”. Por
exemplo, a aplicação do teorema da soma permite obter qual a probabilidade da
extracção de um rei (considerando evento ) ou de um valete. (considerando
evento ) de um baralho.
SACAVEIA, E. L. (2020) Página 71
O teorema da soma pode ser apresentado de suas formas, a depender da sua
existênçia de intersecção entre os eventos analisados.
O teorema da soma para eventos mutuamente exclusivos: Deve ser aplicado quando
os eventos e não possuem elementos em comum. Neste caso, a probabilidade
da união é igual a soma das probabilidades individuais. Algebricamente, a soma
pode ser apresentada como:
Convém destacar que, se os eventos são mutuamente exclusivos, sua intersecção
resulta em um conjunto vazio, e a probabilidade da intersecção é igual a zero.
Ex: para a extracção de um rei ou de um valete num baralho contendo 52 cartas. A
extracção de um rei e um valete são eventos mutuamente exclusivos.
Considerando { } e { } as probabilidades
associadas a e são:
Teorema da soma para eventos não mutuamente exclusivos: deve ser aplicado
quando e possuem elementos em comum, isto é, quando existe interseção.
Algebricamente, pode ser apresentado como:
Ex: para a extracção de um rei ou de uma carta vermelha num baralho contendo 52
cartas. A extracção de um rei e uma carta vermelha. É preciso saber quantas cartas
podem ser rei e vermelhas ao mesmo tempo. A extracção de um rei e uma carta
vermelha não são eventos mutuamente exclusivos, já que podem ocorrer ao
mesmo tempo.
Considerando { } e { } as probabilidades
associadas a e são:
SACAVEIA, E. L. (2020) Página 72
Existem num baralho de 52 cartas 26 cartas vermelhas e a probabilidade da
intersecção é igual a por existirem no baralho apenas dois reis vermelhos.
4.8.2. Teorema do produto
Aplica-se nas operações multiplicativas de probabilidades. Operações
multiplicativas geralmente envolvem a expressão “e” e são representados pelo
símbolo de intersecção “ ”. Por exemplo, a aplicação do teorema da soma permite
obter qual a probabilidade da extracção de uma bola vermelha e uma bola branca
de uma urna com 6 bolas vermelhas e quatro bolas brancas.
O teorema do produto pode ser apresentado de duas formas distintas, que
dependem da classificação dos eventos analisados em dependentes ou
independentes. Na análise de eventos dependentes, o resultado de um evento
subsequente depende dos resultados dos eventos antecedentes. Eventos
independentes ocorrem, como o próprio nome já revela, de forma não associada
aos resultados antecedentes.
Independente: Quando a extracção for do tipo com reposição. O resultado da
segunda extracção em nada depende do que ocorreu na primeira extracção, já que
existe a reposição da bola extraída na urna.
Por exemplo, considere o evento efectuar dois sorteios com reposição de uma urna
com 6 bolas vermelhas e quatro bolas brancas. Naturalmente, ja que existe a
reposição da bola extraída após o primeiro sorteio, os sorteios são eventos
independentes.
A probabilidade de extracção de uma bola vermelha no segundo sorteio independe
do que ocorreu no primeiro sorteio. Em ambos os sorteios, as probabilidades de
extracção de bola serão iguais a 6/10 ou 60%.
SACAVEIA, E. L. (2020) Página 73
Dependente: Quando a extracção for do tipo sem reposição. O resultado da
segunda extracção depende do que ocorreu na primeira extracção, já que não
existe a reposição da bola extraída na urna.
Em outro exemplo, considere o evento extrair sequencialmente duas bolas de uma
urna com 6 bolas vermelhas e 4 bolas brancas. Como não existe a reposição da bola
extraída após o primeiro sorteio, os sorteios são eventos dependentes.
No primeiro sorteio, a probabilidade de extracção de uma bola vermelha será igual
a 6/10 ou 60%.
Porém, a probabilidade de extracção de uma bola vermelha no segundo sorteio
depende do que ocorreu no primeiro sorteio. O seja, caso uma bola branca já tivera
sido extraída no primeiro sorteio, a probabilidade de extracção de uma bola
vermelha no segundo sorteio será igual a 6/9. Por outro lado, caso uma bola
vermelha tinha sido extraída no primeiro sorteio, a probabilidade de extracção de
uma bola vermelha no segundo sorteio será igual a 5/9.
Para aplicar o teorema do produto, é preciso reconhecer o facto de os eventos
serem dependentes ou independentes.
SACAVEIA, E. L. (2020) Página 74
4.9. Exercícios de Aplicação
1. Descreva de forma singela o conceito de probabilidade?
2. Diferencie modelos determinísticos dos probabilísticos, dando três (3)
exemplos para cada modelo?
3. Estabeleça a diferença entre: experimento, eventos e espaço amostral?
4. Cite os tipos de eventos e defina cada um deles?
5. Sobre espaços amostrais diga: quando é que ocorre uma reunião, intersecção e
complementação?
6. Descreva de forma sucinta os eventos mutuamente exclusivos ou excludentes e
os colectivamente exaustivos?
7. Quando é que se está perante uma probabilidade do tipo: dependente e
independente?
8. Os valores das probabilidades variam sobre que limites?
9. Qual é a importância da probabilidade como ciência?
10. Descreva a importância da probabilidade na Saúde?
11. Um grupo de 20 pessoas é formado por 12 homems e 8 mulheres. Em relação
ao sorteio de um elemento deste grupo, calcule:
(a) a probabilidade de ser homem;
(b) a probablidade de ser mulher;
(c) a probabilidade de ser homem ou mulher.
12. Calcule a probabilidade de não sair a face 2 no lance de um dado honesto.
13. Seguam A e B mutuamente excludentes,
(a) A e B são colectivamente exaustivos? Explique;
(b) Determine ̅
(c) Determina
SACAVEIA, E. L. (2020) Página 75
14. Um aluno da turma de estatística única, chega atrasado em 40% das aulas e
esquece o material didáctico das aulas em 18% das aulas. Supondo eventos
independentes, calucule a probabilidade de:
(a) chegar na hora e com material;
(b) não chegar na hora certa e ainda assim aparecer sem o material.
15. Em uma competição na produção de fármacos, existem duas empresas (elsusa
company & Alc company) que chegaram à final. As referídas empresas tem um
grau de eficiência na produção de fármacos de 2/3 e de 1/3 respectivamente.
(a) qual é a probabilidade de que ambos acertem;
(b) qual é a probabilidade de pelo menos uma das empresas acertar;
(c) qual é a probabilidade de apenas uma acertar.
16. A probabilidade de um homem estar vivo daqui a 20 anos é de 0,4 e de sua
mulher é de 0,6. Qual é a probabilidade de que:
(a) ambos estejam vivos;
(b) apenas um tenha falecido;
(c) ambos tenham falecido no período;
(d) o homem ou a mulher tenham falecido.
17. O conjunto de empresas que actuam num dado sector industrial 25% possuem
departamento de investigação (I), 50% realizam lucros (L) e 20% possuem
departamento de investigação (I) e realizam lucros (L). pretende-se calcular a
probabilidade de uma empresa escolhida ao acaso estar nas seguintes
condições:
(a) Possuir departamento de investigação ou realizar Lucros;
(b) Não possuir departamento de investigação;
(c) Não possuir departamento de investigação nem realizar lucros;
(d) Não possuir departamento de investigação ou não realizar lucros;
(e) Possuir departamento de investigação e não realizar lucros;
(f) Não possuir departamento de investigação e realizar lucros.
SACAVEIA, E. L. (2020) Página 76
REFERÊNCIAS BIBLIOGRÁFICAS
Barbetta, P. A. (1998). Estatística Aplicada às Ciências Sociais. Florianópolis:
Editora Da UFSC.
Barbetta, Pedro A.; Reis, Marcelo M. & Bornia, Antonio C. (2004). Estatística para
Cursos de Engenharia e Informática. São Paulo: Atlas.
Bruni, Adriano Leal (2008). Estatística Aplicada à Gestão Empresarial. 2ª ed. São
Paulo: Atlas.
Guedes, T. Aparecida et al. (2015). Estatística Descritiva: Aprender a fazer
Estatística. Braga: Universidade do Minho.
Magalhães, M. N. & Lima, A. C. P. de (2000). Noções De Probabilidade E Estatística.
São Paulo: IME-USP.
Milone, Giuseppe (2004). Estatística Geral E Aplicada. São Paulo: Pioneira Thomson
Learning.
Morais, C. (2000). Descrição, análise e interpretação de informação quantitativa.
Escalas de medida, estatística descritiva e inferência estatística. Braga: Universidade
do Minho.
Neto, Annibal Muniz Silvany (2008). Bioestatística sem segredos. Salvador – Bahia:
Copyleft.
Pagano, Marcello & Gauvreau, Kimberlee (2004). Princípios de Bioestatística.
Tradução da 2ª Edição Norte-Americana. São Paulo: Pioneira Thomson Learning.
Reis, Elizabeth (1998). Estatística Descritiva. 4ª Ed. Lisboa: Silabo.
SACAVEIA, E. L. (2020) Página 77
Soares, José F.; Alfredo A. Farias & César, Cibele C. (1991). Introdução à Estatística.
Rio De Janeiro: Livros Técnicos e Científicos Editora.
SACAVEIA, E. L. (2020) Página 78