UNIROVUMA
Informática Aplicada, 2o Ano, 1o Semestre
Introdução Probabilidade e Estatística
Tema: Estatística Descritiva
Nome do docente: Emílio António
Nome do Estudante: Saúl Augusto Fernando
Nampula
2024
Índice
Introdução..........................................................................................................................3
Estatistica descritiva..........................................................................................................4
Medidas de Centralidade...................................................................................................4
Medidas de Dispersão........................................................................................................4
Medidas de Posição Relativa.............................................................................................5
Representações Gráficas....................................................................................................6
Conclusão..........................................................................................................................8
Referências........................................................................................................................9
Introdução
A estatística descritiva é um ramo da estatística que aplica várias técnicas para
descrever e resumir um conjunto de dados. Diferencia-se da estatística inferencial, ou
estatística indutiva, pelo objectivo: organizar, resumir dados ao invés de usar os dados
em aprendizado sobre a população. Esse princípio torna a estatística descritiva uma
disciplina livre.
Estatistica descritiva
Estatística descritiva é uma área da estatística que se concentra em resumir e descrever
as características principais de um conjunto de dados. Esse processo envolve a
organização, resumo e apresentação de dados de maneira clara e informativa. A
estatística descritiva é frequentemente o primeiro passo na análise de dados e pode ser
dividida em duas categorias principais: medidas de centralidade e medidas de dispersão.
Medidas de Centralidade
1. Média:
A média aritmética é a soma de todos os valores dividida pelo número de
valores.
Fórmula: x‾=∑xin\overline{x} = \frac{\sum x_i}{n}x=n∑xi
Exemplo: Para os valores 3, 7, 8, a média é x‾=3+7+83=6\overline{x} = \frac{3
+ 7 + 8}{3} = 6x=33+7+8=6.
2. Mediana:
A mediana é o valor central quando os dados estão ordenados. Se houver um
número par de observações, a mediana é a média dos dois valores centrais.
Exemplo: Para os valores 3, 7, 8, a mediana é 7. Para os valores 3, 7, 8, 10, a
mediana é 7+82=7.5\frac{7 + 8}{2} = 7.527+8=7.5.
3. Moda:
A moda é o valor que ocorre com mais frequência em um conjunto de dados.
Exemplo: Para os valores 3, 7, 8, 8, 10, a moda é 8.
Medidas de Dispersão
1. Amplitude:
A amplitude é a diferença entre o valor máximo e o valor mínimo.
Fórmula: A=maˊximo−mıˊnimoA = \text{máximo} - \
text{mínimo}A=maˊximo−mıˊnimo
Exemplo: Para os valores 3, 7, 8, 8, 10, a amplitude é 10−3=710 - 3 = 710−3=7.
2. Desvio Padrão:
O desvio padrão mede a quantidade de variação ou dispersão dos valores em
relação à média.
Fórmula (para uma população): σ=∑(xi−μ)2N\sigma = \sqrt{\frac{\sum (x_i - \
mu)^2}{N}}σ=N∑(xi−μ)2
Fórmula (para uma amostra): s=∑(xi−x‾)2n−1s = \sqrt{\frac{\sum (x_i - \
overline{x})^2}{n-1}}s=n−1∑(xi−x)2
Exemplo: Para os valores 2, 4, 4, 4, 5, 5, 7, 9, o desvio padrão é calculado
encontrando a média, somando os quadrados das diferenças de cada valor para a
média, dividindo pelo número de valores menos um (para uma amostra), e então
tirando a raiz quadrada.
3. Variância:
A variância é o quadrado do desvio padrão e fornece uma medida de dispersão.
Fórmula (para uma população): σ2=∑(xi−μ)2N\sigma^2 = \frac{\sum (x_i - \
mu)^2}{N}σ2=N∑(xi−μ)2
Fórmula (para uma amostra): s2=∑(xi−x‾)2n−1s^2 = \frac{\sum (x_i - \
overline{x})^2}{n-1}s2=n−1∑(xi−x)2
Medidas de Posição Relativa
1. Quartis:
Os quartis dividem os dados em quatro partes iguais.
O primeiro quartil (Q1) é o valor que divide os 25% inferiores dos dados dos
75% superiores.
O segundo quartil (Q2) é a mediana.
O terceiro quartil (Q3) é o valor que divide os 75% inferiores dos 25%
superiores.
2. Percentis:
Os percentis dividem os dados em 100 partes iguais.
Por exemplo, o 90º percentil é o valor abaixo do qual 90% dos dados estão.
Representações Gráficas
1. Histograma:
Um histograma é um gráfico de barras que representa a distribuição de
frequências de um conjunto de dados contínuos.
2. Gráfico de Barras:
Um gráfico de barras representa dados categóricos com barras cuja altura
corresponde à frequência ou à proporção de cada categoria.
3. Boxplot (Gráfico de Caixa):
Um boxplot mostra a distribuição dos dados com base nos quartis, mediana e
valores extremos.
Exemplo Prático
Vamos considerar um conjunto de dados: 4, 8, 6, 5, 3, 8, 9, 10, 4, 6
1. Média: x‾=4+8+6+5+3+8+9+10+4+610=6.3\overline{x} = \frac{4 + 8 + 6 + 5 +
3 + 8 + 9 + 10 + 4 + 6}{10} = 6.3x=104+8+6+5+3+8+9+10+4+6=6.3
2. Mediana:
Ordenando os dados: 3, 4, 4, 5, 6, 6, 8, 8, 9, 10
Mediana: 6+62=6\frac{6 + 6}{2} = 626+6=6
3. Moda:
Os valores 4, 6 e 8 são os mais frequentes (ocorrem 2 vezes cada), então a moda
é 4, 6 e 8.
4. Amplitude: A=10−3=7A = 10 - 3 = 7A=10−3=7
5. Desvio Padrão (amostra):
Primeiro, calcule a média: 6.3
Depois, calcule a soma dos quadrados das diferenças para a média:
∑(xi−x‾)2=(4−6.3)2+(8−6.3)2+⋯+(6−6.3)2=49.7\sum (x_i -\overline{x})^2 = (4-6.3)^2
+ (8-6.3)^2 + \cdots + (6-6.3)^2 = 49.7∑(xi−x)2=(4−6.3)2+(8−6.3)2+⋯+(6−6.3)2=49.7
Desvio padrão: s=49.79≈2.35s = \sqrt{\frac{49.7}{9}} \approx 2.35s=949.7
≈2.35
A estatística descritiva fornece as ferramentas essenciais para descrever e entender os
dados antes de aplicar técnicas mais complexas de inferência estatística. Essas
ferramentas ajudam a resumir grandes conjuntos de dados em formas compreensíveis e
visuais, permitindo análises e decisões informadas.
Conclusão
A Estatística é o estudo da coleta, análise, interpretação, apresentação, organização e
utilização de dados. É uma disciplina interdisciplinar que utiliza métodos matemáticos,
computacionais e teóricos para resolver problemas relacionados a decisões baseadas em
dados. A estatística é amplamente aplicada em muitas áreas, incluindo ciências sociais,
ciências da saúde, economia, ciências da computação, ciências biológicas, entre outras.
Referências
Babbie, Earl R. (2009). The Practice of Social Research 12th ed. [S.l.]: Wadsworth.
pp. 436–440.
BARBETTA, Pedro A. Estatística aplicada às ciências sociais. Editora UFSC.
Florianópolis, 2008.
BORGES, Simone S. et al. Reduced GUI for an interactive geometry software: Does it
affect students' performance? Computers in Human Behavior, v. 54, p. 124- 133, 2016.
BUSSAB, Wilton O.; MORETTIN, Pedro A. Estatística Básica. Editora Saraiva. São
Paulo, 2005.
CASELLA, George; BERGER, Roger L. Statistical inference. Pacific Grove, CA:
Duxbury, 2002.
COSTNER, Herbert L. Criteria for measures of association. American Sociological
Review, p. 341-353, 1965.
KIM, Tae-Hwan; WHITE, Halbert. On more robust estimation of skewness and
kurtosis. Finance Research Letters, v. 1, n. 1, p. 56-73, 2004.
MOOD, Alexander McFarlane; GRAYBILL, Franklin A.; BOES, Duane C.
Introduction to the Theory of Statistics. McGraw-Hill Kogakusha, 1974.
PAIVA, Ranilson et al. What do students do on-line? Modeling students' interactions to
improve their learning experience. Computers in Human Behavior, v. 64, p. 769-781,
2016.