DADOS Y DATOS lll
El paso de la incertidumbre al riesgo
DADOS Y DATOS lll
El paso de la incertidumbre al riesgo
Edicin: Institut dEstadstica de les Illes Balears (IBESTAT)
Direccin del proyecto: Andreu Sans Rossell
Coordinacin general: Dami Perell Femenia y Sara Fernndez Vzquez
C/ de Sant Sebasti, 1
07001 Palma (Mallorca)
Telfono: 971 784 575
Fax: 971 784 579
Autor: Javier Cubero
Gestin y produccin: inrevs SL
Ilustraciones y maquetacin: Alex Fito
Coordinacin y guin adaptado: Pere Joan
Coleccin: Estadstica al carrer. Volumen 3
Ttulo: Dados y datos III. El paso de la incertidumbre al riesgo
Nm. IBESTAT: 4/2008
Depsito legal:
Impresin: Jorvich
Fecha de edicin: 2010
Derechos de reproduccin: Institut dEstadstica de les Illes Balears (IBESTAT)
PRESENTACIN
on la constitucin del Institut dEstadstica de les Illes Balears (IBESTAT), este
2008, como entidad autnoma, se ha querido dar un paso muy importante en
todo lo que debe ser la vertebracin de un verdadero sistema estadstico para nuestra comunidad autnoma. Tambin ha sido un momento de anlisis y de reflexin
sobre la labor que ya se haba llevado a cabo en etapas anteriores y que, por su calidad y vala, era necesario recuperar y proyectar hacia el futuro. Este ha sido el caso
de la coleccin Dados y datos, que con Javier Cubero como autor, ha sido capaz de
encontrar una formulacin muy pedaggica para hacer llegar los grandes conceptos
estadsticos a amplios sectores de la poblacin, entre los cuales cabe mencionar a
los ms jvenes.
El formato amable y atractivo que supone el uso del cmic como soporte lo hace
prcticamente nico en su especialidad, pero no por ello falto de rigor ni del nivel
que requiere una publicacin de carcter cientfico como sta. Esto ha llevado a
que las dos ediciones anteriores, que se materializaron bajo los auspicios de los
directores generales de Economia Antoni Monserrat (volumen I) y Maria Marqus
(volumen II), hayan tenido que ser reeditadas y completadas con un tercer volumen
que cerrar una triloga muy completa por lo que respecta al conocimiento de los
principios estadsticos. Todo este proceso se enmarca en la voluntad de fomentar la
estadstica como disciplina til para el conocimiento de la realidad que nos rodea a
partir de elementos que aparentemente son sencillos pero cuyo alcance formativo
es grande.
Para terminar, quisiera agradecer la colaboracin de todas las personas que han
participado en la edicin de este material didctico, tanto por lo que respecta a los
creativos y dibujantes como a los tcnicos. Igualmente, me gustara animar a todo
el mundo para que se acerque a estas publicaciones y as descubrir un mundo lleno
de conocimientos que sin duda nos ayudarn a comprender mejor nuestra realidad
de una forma ms apasionante y racional a la vez.
Andreu Sans Rossell
Director del IBESTAT
NDICE
Captulo 1 - GEORGES LOUIS LECLERC
pg. 6
Captulo 2 - Sir Francis Galton
pg. 23
Captulo 3 - Pafnuti ChebyshEv
pg. 51
LOS PERSONAJES
55
acertijo
azarita
binomio
gauss
grfiCA
Captulo 1
GEORGES LOUIS LECLERC
Conde de Buffn (1773)
Montbard, Borgoa,1707 Pars, 1788
Matemtico y naturalista francs.
Estudioso de la mecnica, la astronoma, medicina, la teora de los nmeros,
el clculo, la geometra y la probabilidad.
Se hizo famoso en esta ltima materia por su curioso experimento de determinar
muchas cifras decimales en el valor del nmero tratndolo como una experiencia
de probabilidad geomtrica conocida como la aguja de Bufn.
Captulo 1 Georges Louis Leclerc
Ya comenzamos, Ahora un problema! Debemos
realizar un trabajo sobre: Nmeros ndices.
Eso no es
lo del I.P.C.
y todos esos
numeracos
econmicos
que hoy da
van tan mal?
Pues vaya
tiempo para
mandarnos
el trabajo,
en otras fechas
hubiera sido
un exitazo.
O sea, si mi abuelo
Un poco menos de 004.
compraba una
Lo repito: menos de cuatro
ensaimada a 6
cntimos.
pesetas
y lo
Qu?!
comparamos
con lo que nos
cuesta hoy...
Captulo 1 Georges Louis Leclerc
Bueno, algo de eso y
Cuntos das u horas o minutos tena que
de muchas cosas ms
trabajar mi abuelo para comprar una ensaimada?
que comparamos; pues
y cuntos tendra que trabajar yo, hoy da?
fijaos, podramos pensar
Y sera una ensaimada de iguales caractersticas?
lo siguiente:
Sin querer hemos rozado los
conceptos de deflactacin,
precio en unidades constantes,
ndice de precio, hasta muy de
lejos el de precio hednico.
Has pasado
mala noche
verdad?
Bueno, lo que s veo es que tenemos
que inventar algo general
que defina esas comparaciones
y ms que pudieran surgir.
Y tendra que tener
tratamiento matemtico, para
su aplicacin correcta.
10
Captulo 1 Georges Louis Leclerc
Pues lo tenemos:
son los NMEROS
NDICE. Mirad la
pantalla.
nmeros ndice
Medida estadstica que compara dos
situaciones de una misma variable,
permitiendo estudiar su evolucin
Periodo corriente o actual
Periodo de referencia o base
esta pantalla queda
Pues que el
Verbigracia: el ndice de
muy bien y con unos
nmero ndice es
precios del melocotn,
dibujos animados
el cociente entre
tomando como base el ao
Mejor! Pero
dos cantidades.
qu quiere decir?
2000 y, como actual, el
actual ao 2008 sera
Djame la
pizarra
Dejadla
sola!
11
Captulo 1 Georges Louis Leclerc
Os aclaro que aunque para operar
Entonces lo das en
lo haremos como indica la pizarra,
tantos por ciento.
generalmente para su exposicin se
multiplica el resultado por cien.
Ol! Eureka!
UNO!
He estado con Grfica en la
Hemos elaborado unos
biblioteca y hemos observado
servirnos para el trabajo.
Nmeros ndice.
12
grficos que pueden
algunas propiedades de los
Mirad!
Captulo 1 Georges Louis Leclerc
Identidad
INVERSIN
CCLICA
13
Captulo 1 Georges Louis Leclerc
CIRCULAR
Pues creo que
Dediquemos ahora un buen
Bueno, ni tanto ni tan calvo
nos va a ayudar
rato, en cuerpo y alma a
Creo que podramos divertirnos...
bastante.
divertirnos. Y cuando se nos
Pero para la semana que viene nos
olvide este rato, empezamos
repartimos una serie de trabajos.
de nuevo.
Los podramos hacer en la
sala de nuevas tecnologas;
nos dejan usarla.
...Y con todos hacer
una exposicin privada
por nosotros, con
nosotros y para
nosotros.
14
Captulo 1 Georges Louis Leclerc
Una semana despus
ndice precio relativo:
La visin y el
continente son
extraordinarios.
No os despistis.
Veamos los contenidos.
Esto quiere decir que si el
precio de un producto en el ao
2007 es de 30 y en el 2001 era
de 25... El ndice es:
15
Captulo 1 Georges Louis Leclerc
A ver
si lo he entendido
El precio ha aumentado
el 120-100= 20%"
ndice cantidad relativa:
O sea, si del producto
anterior en 2007
compramos 200 kilogramos
y en 2001 habamos
comprado 300 kgs
Ssssss!
Perfecto!
O sea, compramos
un 333 % menos.
ndice valor relativo:
16
Captulo 1 Georges Louis Leclerc
Claro, el valor
de un producto
igual a precio del kilogramo de
ser el precio
los melocotones por cantidad
por la cantidad.
Ya lo hemos complicado!
Valor de los melocotones es
de melocotones comprados.
de cantidades,
Qu curioso!
pero decir cuntico
El ndice de Valor es igual al
es ms divertido.
producto del ndice de precios
por el ndice cuntico.
Qu?!
Ya en una experiencia
anterior hablamos de
Menos mal que lo
Laspeyres y Paasche
has dicho, pues yo
crea que Cuntico
Bueno, dejaos de
era eso del F.B.I.
bromas y dejemos
del anlisis de
tambin los ndices
personalidad que
simples, as la
creo que est en
semana que viene los
esa ciudad.
Podramos
complicamos.
17
Captulo 1 Georges Louis Leclerc
hacer lo mismo que
hemos hecho con ndices
complejos ponderados.
VAMOS!
ndice Laspeyres de precios
Lp
cantidades
viejas
cantidades viejas
cantidades viejas
precios
nuevos
precios nuevos
precios viejos
cantidades
viejas
precios
viejos
ndice Laspeyres cuntico
LQ
cantidades
nuevas
precios viejos
precios viejos
cantidades nuevas
cantidades viejas
cantidades
viejas
18
precios
viejos
precios
viejos
Captulo 1 Georges Louis Leclerc
ndice Paasche de precios
Pp
cantidades
nuevas
precios
nuevos
cantidades nuevas precios nuevos
cantidades nuevas precios viejos
cantidades
nuevas
precios
viejos
ndice Paasche cuntico
PQ
cantidades
nuevas
precios
nuevos
precios nuevos cantidades nuevas
precios nuevos cantidades viejas
cantidades
viejas
precios
nuevos
19
Captulo 1 Georges Louis Leclerc
Ahora estableceremos
en la pizarra para
Laspeyres de precios
Laspeyres cuntico
o de produccin
Paasche de precios
unas cuantas frmulas
Paasche cuntico
complementar el trabajo.
ndice de Fisher precios
20
ndice de Fisher cuntico
Captulo 1 Georges Louis Leclerc
Gauss, t dijiste
al principio algo
de explosin o
deflagracin.
Cmo te gusta
hacer el burro!
Ja, ja, Ja
Hablaste de
deflactacin, y creo que
interesa saber pasar
de moneda corriente a
moneda constante.
O sea:
MONEDA CORRIENTE, la de cada periodo.
MONEDA CONSTANTE, la que
rige en el periodo estudiado.
21
Captulo 1 Georges Louis Leclerc
Pues si deflactacin es el paso a moneda
constante y se usa normalmente Laspeyres,
y a veces tambin Paasche
haremos un ltimo
ejercicio
Pero despus Ya que este
captulo lo dedicamos al Conde
de Buffon tendramos que hacer
algo de l.
Veamos primero lo
menos simptico.
Laspeyres precios x Paasche cuntico.
ndice de Valor
Laspeyres cuntico x Paasche precios.
No! Menos mal
que ha acabado.
ndice de Valor
Un aplauso a Gauss por lo bien
que lo ha hecho.
22
UF!
Captulo 1 Georges Louis Leclerc
La aguja de BUFFON
El nmero es frecuente e importante en realizaciones estadsticas y el Conde de Buffon, mediante un experimento que de forma simple y sencilla exponemos a continuacin, fue uno de los muchos que dedicaron
esfuerzos a la tarea de descubrir cuantas ms cifras, mejor, de un nmero que tiene infinitas.
Experimento:
Tomemos una hoja de papel, tracemos en ella ocho particiones iguales, separadas
por segmentos como indica la figura, y obtengamos un palillo con longitud "p" igual
a la distancia entre los segmentos, ya sea recortndolo o midiendo primero el
palillo y despus las divisiones de la hoja.
Realizacin:
Lancemos el palillo sobre la hoja, cuantas
ms veces mejor (lanzamientos suaves) y
anotemos el nmero total de lanzamientos
al que llamaremos T. Vayamos al mismo
tiempo contando las veces que de estos
lanzamientos la aguja corta a las rayas rojas; a este conteo le llamaremos C.
No
Nmero de lanzamientos T
Nmero de cortes
El conteo puedes hacerlo como lo indicamos en una de nuestras primeras experiencias.
T=
.............................
C=
.......................................
= 1.103
= 702
Una vez que tengis vuestros resultados efectuis la siguiente operacin:
Veris que el nmero resultante se va aproximando estocsticamente a a medida que las tiradas van siendo ms numerosas.
23
Captulo 1 Georges Louis Leclerc
Sala de en el Palais de la Decouverte. Pars
24
Captulo
Captol X2
Sir Francis Galton
(1909)
Duddeston, 1822 Haslemere, 1911
Antroplogo y gegrafo, fue creador de la escuela biomtrica
Antropleg i gegraf, va crear lescola biomtrica anglesa. inglesa.
Realiz, terminados els estudios, grandes viajes grans viatges amb lobjectiu dinvestigar,
Una vegada acabats sus seus estudis, va realitzarcon objetivo investigador, como su primo
Charles Darwin.
com el seu cos Charles Darwin.
Es uno de traductors dels mtodes estadstics aplicats la Biologa conjuntament amb en
s un dels los introductores de los mtodos estadsticosaaplicados a la Biologa conjuntamente
con Karl Pearson, curiosament s autor duna biografia del personatge tractat.
Karls Pearson queque curiosamente es autor de una biografa del personaje tratado.
Entre molts altres temes va ser el primer en explicar el fenmenode regressi mitjana y usar
muchos otros temas fue el primero
fenmen de regresin media i
la lnea la regresin; fue uno de los pioneros en el en de de la distribuci normal.
emprar delnia de regressi; va ser un dels pioners usols la distribucin normal.
Su ingenio le el va dur a construir la mquina de Quincunx.
El seu enginy llev a construir la mquina de Quincunx.
Captulo 2 Sir Francis Galton
Un poco de aire nos ir bien
para refrescar las ideas. Os
acordis de cuando hablbamos
de variables aleatorias?
Aquello del
saltamontes y el
caracol
Eso era una clasificacin:
en discretas y en continuas.
Esperad, que me gustara hacer
un dibujo, por si refresca la
idea de variable aleatoria.
Pues no est mal.
Quedan monos!
26
Captulo 2 Sir Francis Galton
Esta cartera que les
acompaa siempre, debe
de ser la probabilidad
Me lo explicis,
verdad?
por favor.
Afirmativo. Toda variable
aleatoria tiene siempre
anexionada en s una
probabilidad.
Y por qu? Aunque se ve bien
parece como movida.
La variable aleatoria puede adoptar varios valores, en algunos casos
infinitos, cada uno con su acompaante inseparable que es la probabilidad.
Y la suma de todas
las probabilidades ha
de ser siempre UNO.
0,15
0,50
0,25
0,10
1
27
Captulo 2 Sir Francis Galton
Entonces, cmo se dibujara
lo de continua y discreta? Me
parece que esta ltima ser
ms difcil o no ser muy
discreta.
Lo de discreta no es
por calladita, sino
porque los valores no
son continuos.
Dan saltos.
DISCRETA
1/6
1/6
1/6
1/6
1/6
1/6
Continua
p1
p2
Sabiendo que
28
p3
p4
p5
p1+p2+p3+ ... + pk = 1
pk
Captulo 2 Sir Francis Galton
Pongamos estos dos dibujos en un plan un poco ms serio.
La tirada de un dado
DISCRETAS
Igual probabilidad
Sabiendo que
O si lo miramos con tornillos, por ejemplo.
DISCRETAS
distinta probabilidad
97%
3%
Tornillos defectuosos 3%
Tornillos buenos 97%
Probabilidad
Pero esta no se parece a la
variable de Bernoulli?
29
Captulo 2 Sir Francis Galton
Esto es aquello que deca Si
lanzo una moneda al aire, tengo
la probabilidad 05 de que salga
cara y 05 de que salga cruz.
Que no ser lo mismo
que tener media probabilidad
de cara y media de cruz.
Mira, t lo que tienes
Pero Qu dices!
que hacer es
Lo ves, no acierto
ni una
Pensar mucho las
cosas y cuando lo
hayas pensado bien
Di lo contrario y
Si el experimento de
acertars!
Bernoulli se repite
jA! jA! jA! jA! jA!
Podemos tener
S, pero antes fijaos en
la distribucin
esto Una transparencia
Binomial.
con las caractersticas
ms importantes.
30
Captulo 2 Sir Francis Galton
Distribucin de Bernoulli
Siendo p la probabilidad de xito y (1-p), como es lgico, la de fracaso.
xito
fracaso
Su media o esperanza
Su varianza
Repetimos el
Muy bien! Y ahora
volvamos a la binomial.
experimento n
Qu sabemos de ella?
veces; cada prueba
que repetimos es
independiente
Pues que en cada realizacin slo hay dos
resultados posibles: xito y fracaso, con
dos probabilidades que suman uno.
No tienen nada que
ver una con otra
Sigo
La probabilidad de xito
Es independiente
es igual en todas las
de las dems.
repeticiones.
31
Captulo 2 Sir Francis Galton
Ir Tal vez va bastante bien,
pero a m, como no me digas
un verbigracia, como dice
Va bastante bien.
55, no me viene.
Cuntos tornillos
defectuosos esperamos hallar
en una caja de 1.000 unidades?
La probabilidad de ser
un tornillo es de
defectuoso
0,03.
Por lo tanto la probabilidad de
no serlo es de 1 - 0,03 = 0,97.
Eso va un poco mejor
Pues creo que es la
hora de la binomial.
Funcin de probabilidad de la variable
aleatoria BINOMIAL
32
Captulo 2 Sir Francis Galton
Uf! Buf! Puf! Aqu veo muchas clases de
problemas, s, de verdaderos problemas
Por ejemplo
Qu probabilidad tengo de que
me salga un tornillo defectuoso
si compro cuatro?
Otro problema! Y de
Anda! Y de
que me salgan dos si
que me salgan
compro cuatro?
tres si compro
cuatro?
Vaya! Y de cuatro
defectuosos si
compro cuatro?
Sigo! Y de que
me salgan cinco
defectuosos si
compro cuatro?
Para! Sooo! Que la
probabilidad es cero.
Pues tengo un grfico con el cual
respondemos a Acertijo en todo lo que
ha preguntado.
33
Captulo 2 Sir Francis Galton
Si nos fijamos, la probabilidad de comprar cero
defectuosos en cuatro tornillos ser:
Y la suma sera:
pues son todas las oportunidades posibles.
34
Captulo 2 Sir Francis Galton
S, pero de mi
pregunta, qu?
Los tornillos defectuosos que
"esperamos" al comprar 1.000.
La esperanza, o sea, la media
tornillos defectuosos.
Ya estoy agotado, por qu no lo
dejamos para la semana que viene?
Y a ver si damos el campanazo de Gauss
hablando de la distribucin normal.
Vale!
35
Captulo 2 Sir Francis Galton
Aqu traigo mi
trabajito, amigos!
a l N[, o- ]
n d e d en si d a d N o rm
Fu n ci
2
Lo tuyo bien, pasemos
a ver lo de Grfica.
SIMTRICA
MESOCRTICA
95% de la
- 1'96
90% de la
+1'96
- 1'645
36
poblacin
+1'645
poblacin
Captulo 2 Sir Francis Galton
Fu n ci n d e d en si d a d
La ltima integral, la vamos
a dejar por ahora; no
obstante, sabemos algunos
valores. Cules son?
a cu m u la d a
n ci n d e d is tr ib u ci n
Fu
La
es la suma de todas las
probabilidades.
Correcto.
pues no habra ninguna
oportunidad.
Pues yo lo que saba era
Y la
que la media, mediana y
moda coinciden en una
distribucin normal y he
dibujado esto:
porque es simtrica y
adems el mximo (MODA)
coincide con la media.
37
Captulo 2 Sir Francis Galton
Alehop!
Extraordinario
Pues lo mismo que ha
intentado Acertijo
simplificar a su modo,
as se propuso una
simplificacin con la
distribucin normal.
Tipificndola?
Dale!
Es verdad
Dale!
Tipificndola o
Daleeee...!
estandarizndola.
Tipificar es restar a cada variable su media
y dividir el resultado por su desviacin tpica.
38
Captulo 2 Sir Francis Galton
Vale, y qu
Que la media se convierta en cero
conseguimos?
y su varianza en 1.
Y todas se pueden
Vamos a ver
estandarizar
clarita la
distribucin
Normal
Pues claro!
Estndar, y
desde ahora
me las dais
Y para qu he
tipificadas
perdido el tiempo
todas.
estudiando todo lo
anterior?
N[0,1]
Funcin de densidad
Funcin de distribucin acumulada
As me aprendo una y
las resuelvo todas.
95%
-1'96
+1'96
39
Captulo 2 Sir Francis Galton
Acertijo, toma una tabla con todos los
valores de esta ltima
N[0,1] calculados:
uci normal estndard
Taula 1: Funci de distrib
O sea, que cuando es una
Normal normalilla, corrientilla
se pone
N[,
en plan de
simplificar y cuando es normal
estndar se indica con
Verdaderamente
creis que esto que
estamos haciendo es
normal?
N[0,1].
Verdaderamente tipificado
Vamos de paseo un rato, a
no s si ests, pero tpico
ver si nos normalizamos.
eres vaya si lo eres.
40
Captulo 2 Sir Francis Galton
Otra jornada y un da
de campo y trabajo;
empecemos recordando
el concepto de grados
Estis confundidos, esto no es
de libertad.
libertad, es prisin de primer
grado, de tercer grado
No tiene nada que ver
con crceles, ni con
maldades.
Digamos que es un
concepto estocstico,
del azar.
Definmoslo a travs
Entonces
de un entretenimiento.
Voy a lanzar un dado
a escondidas.
Acertijo tratar de adivinar el
resultado. Grafi, por favor,
lleva las cuentas.
41
Captulo 2 Sir Francis Galton
Ha salido uno.
Tienes otra oportunidad.
Has fallado.
Tres.
Has fallado.
Otra
oportunidad.
Ha salido un seis.
Has fallado.
Otra!
Ha salido un cuatro.
Has fallado.
Tienes otra
oportunidad.
Venga, ha salido un cinco.
Has fallado.
Ni que fuera tonto, ahora s
que es el dos seguro.
Mira, el dado tiene seis
oportunidades de mostrar
una cara distinta.
42
Captulo 2 Sir Francis Galton
Pero t slo has
tenido que elegir cinco.
Has tenido cinco
grados de libertad.
Ya que tu ltima
eleccin era forzada,
como muy bien dijiste.
Compliquemos un poco la cosa.
Hay que rellenar
las casillas
con nmeros
cualesquiera,
con la condicin
de que sumen
los totales ya
definidos, tanto
en filas como en
columnas. (Los
nmeros pueden
ser negativos).
Cuntas casillas podis
rellenar libremente?
O lo que es lo mismo, cules
sern los Grados de libertad?
A pensar toca:
43
Captulo 2 Sir Francis Galton
Esto es lo mo; en la horizontal es
forzoso poner 12, y en la vertical 3
Podra rellenar todos los
cuadros de color, mientras que los
en blanco vienen forzados.
Es decir, tendramos
4 x 7 = 28 grados de libertad.
Ahora! Ahora s
O sea: GRADOS DE LIBERTAD:
[NMERO COLUMNAS 1] x [NMERO FILAS 1]
Por ah he visto que existe
una distribucin que se llama
no s qu de
44
Pearson.
Captulo 2 Sir Francis Galton
khi
cuadrado de Pearson.
Esa s la s; se llama
La frmula de
esta distribucin s
que es complicada
1) Tomamos un cierto nmero de distribuciones normales estndar.
Para aprenderla,
N[0 1]
nosotros la veremos de
N[0 1]
N[0 1]
otra forma:
2) Elegiremos las que sean independientes entre s.
a) Puede ser slo una.
b) Podran ser de la forma N ( 1) pero nosotros supondremos
siempre que son estndar, por simplificar su estudio.
3) Las elevamos al cuadrado:
{N[0 1]}
][
2
{N[0 1]}2
{N[0 1]}
45
Captulo 2 Sir Francis Galton
4) Las sumamos.
NID: Normales independientemente distribuidas.
O sea, es una khi-cuadrado
con
v grados de libertad.
Generalmente los grados de
libertad se representan con esta letra,
v, que es la n griega, la nu.
A ver!
Quiero decir que los
A ver si
grados de libertad son el
lo veo.
nmero de normales que
sumamos.
Si tomo 5 distribuciones
normales tipificadas
independientes entre s,
las elevo al cuadrado
y despus las sumo,
sale una.
Exacto.
46
Captulo 2 Sir Francis Galton
Y ms an, de esa distribucin
sabemos que su media ser 5
y su varianza ser 10.
La media es igual a
los grados de libertad,
y la varianza, al doble.
Examinaremos sus grficas.
Funcin de
densidad de la
Siempre positivas
Funcin de
distribucin de
Las representaciones son distintas segn los grados de libertad.
47
Captulo 2 Sir Francis Galton
Pues lo nico que me
queda por decir es:
Quiero decir...
lo siguiente:
Qu?
Que es
productiva.
Uf! Vale
Esto se anima.
Acordaos de aquel seor Cmo se llamaba?
Sealey Gosset, que para publicar sus estudios
tena que poner un seudnimo
Student.
Pobre hombre, con seudnimo
y su distribucin con minscula.
48
S! Pues tiene
una distribucin, la
de Student.
Captulo 2 Sir Francis Galton
Creo que ser mejor indicarla
en una hoja de Grafi.
SIMTR
ICA
PLATIC
RTICA
La tambin tiene
grados de libertad.
S, pero son los mismos
que tiene la
khi cuadrado.
Y la media o esperanza:
Esta distribucin nos
ser de mucha utilidad
cuando tengamos que
trabajar con muestras
pequeas.
Y la varianza es:
49
Captulo 2 Sir Francis Galton
Y sus grficas son:
Funcin de densidad
de probabilidad de t v
Funcin de distribucin
de probabilidad de t v
Un gran detalle!
Un pequeo detalle:
Ya est bieeeen!
50
Captulo 2 Sir Francis Galton
Mquina de Galton
Caja con artilugio para que vayan cayendo las bolitas, que irn chocando aleatoriamente con unos clavos situados
como se ve en la figura, para al final caer sobre los casilleros de la base.
Las bolitas, al chocar con los clavos, tienen la misma probabilidad de ir a la derecha que a la izquierda.
Recordemos una experiencia realizada en el primer tomo.
51
Captulo 2 Sir Francis Galton
Tendremos como resultado, cuando el nmero de bolitas sea lo suficientemente grande,
una colocacin sobre los casilleros que se acercar a la forma de la distribucin normal.
1.000 bolitas
100.000 bolitas
infinitas bolitas
52
Captulo
Captol X3
Pafnuti ChebyshEv
1821 - 1894
Sir Francis Galton
(1909)
Matemtico ruso tambin conocido como Tchebychew, Chebychev o Cebisev.
Defendi la tesis Un intento de anlisis elemental de la teora probabilstica.
Duddeston, 1822 Haslemere, 1911
Recibi la medalla de plata por el trabajo Clculo de las races de las ecuaciones.
La disertacin sobre la integracin con ayuda de algoritmos le hizo conseguir la plaza de Profesor
Antropleg i gegraf, va crear lescola biomtrica anglesa.
Titular en la Universidad de San Petersburgo.
Una vegada acabats els seus estudis, va realitzar grans viatges amb lobjectiu dinvestigar,
Pero es ms conocido entre los estudiantes de estadstica, principalmente, por su Desigualdad de
com el seu cos Charles Darwin.
Chebyshov.
s un dels traductors dels mtodes estadstics aplicats a la Biologa conjuntament amb en
Karls Pearson que curiosament s autor duna biografia del personatge tractat.
Que en un caso prctico sera:
Entre molts altres temes va ser el primer en explicar el fenmen de regressi mitjana i
emprar la lnia de regressi; va ser un dels pioners en ls de la distribuci normal.
El seu enginy el va dur a construir la mquina de Quincunx.
La probabilidad de un elemento para cualquier distribucin estadstica de encontrarse entre la media
y menos dos desviaciones tpicas, y la media ms dos desviaciones tpicas es mayor al 75%.
Captulo 3 Pafnuti Chebyshev
Pienso yooo.
JA!
JA!
JA!
Bueno quiero pensar
Explcate y te iremos
que la estadstica me
poniendo las pegas.
servira, por ejemplo,
No te digo!
si pongo una
fbrica de camisas y
pantalones modernos.
Bueno, si puedo hacer una
estadstica de alturas y dimensiones
de todos los posibles clientes
y si tambin realizo
una estadstica de
gustos en el vestir
54
Captulo 3 Pafnuti Chebyshev
con locura
mucho
un poco
ni s ni no
nada
O sea:
Bueno, has dicho
Podra saber qu
tallas fabricar y en
qu cantidad cada una
de ellas.
tantas cosas, bastante
buenas, que creo que
debemos definirlas
conceptualmente, por su
importancia.
Vamos a la biblioteca virtual,
nos informamos, preparamos el
tema a ver cmo sale.
55
Captulo 3 Pafnuti Chebyshev
Id dndome material
e ir fabricando una
presentacin.
Deberemos reunir todas
las imgenes, ver las
repeticiones
Pero, primero
hay que
realizarlas
elegir y
determinar las
que falten.
56
Yo har un
filtro de las
imgenes
elaboradas.
Captulo 3 Pafnuti Chebyshev
Individuos. O sea, un
Creo que la primera
conjunto de personas!
imagen debe ser
Todos y cada uno de los elementos (individuos) de los que
se desea tener una informacin.
No, especficamente
Fjate.
Que pueden ser
Elementos o individuos.
personas, rboles,
mesas, vigas, gustos,
ilusiones, cerdos,
elefantes
Lo que queramos estudiar.
57
Captulo 3 Pafnuti Chebyshev
De estos elementos podemos
S! Es decir, las
A estas ltimas las
estudiar una o varias
variables que pueden
llamamos atributos,
caractersticas, verdad?
ser cuantitativas
corrientemente.
y cualitativas.
Estatura (cuantitativa)
Elegancia (cualitativa)
Peso (cuantitativa)
O sea! Si queremos hallar
la media (media aritmtica)
de una variable de cierta
poblacin esta variable
puede ser la estatura.
58
Captulo 3 Pafnuti Chebyshev
Sumamos los datos de
esta variable, estatura, y
dividimos la suma entre el
nmero de elementos de
la poblacin.
Perfecto!
Cmo tericamente?
Tericamente
Perfecto! Y ya est.
No, porque a veces no
podemos medir
Por qu?
la poblacin.
Verbigracia
Yo creo que habra que ver algunos ejemplos.
Servidor pone el
ejemplo nmero 1:
Pues a ver quin
los va inventando;
premio al mejor.
59
Captulo 3 Pafnuti Chebyshev
Medir la resistencia media de las
vigas de la fbrica La resistente.
A ver, ponemos pesas hasta que se rompa
En el momento en que se rompe, apuntamos el
la viga, y as sabremos lo que resisten.
peso colocado y esa ser la resistencia.
Cuando hayamos probado todas las vigas, podremos hallar la
resistencia media.
Y tendremos que salir corriendo, ya que, gracias a nuestro
estudio, el fabricante podr saber mucho de cul era la
resistencia de sus vigas
pero no podr vender ninguna
60
Ahora pongo el mo,
Estarn todas rotas!!!
ejemplo nmero 2.
Captulo 3 Pafnuti Chebyshev
Vamos a probar la calidad de
Para ello iremos probando las manzanas
las manzanas de la frutera
y calificndolas como: Extraordinaria, Muy buena,
La fruta de oro.
Buena, Regular.
am!
am!
am!
Encuesta
completada
Extraordinaria
Muy buena
Buena
Regular
Qu piensas, Acertijo?
Que corramos, parece que nos quieren regalar una calabaza
...de una forma
muy rara.
61
Captulo 3 Pafnuti Chebyshev
Bueno, vamos a ver si el mo no acaba mal. Ejemplo nmero 3:
Me han pedido
Ya se cul es la
que halle el
poblacin pero
peso medio de
los cerdos, de
todos los cerdos
cuntas patas son?
de la empresa
Porquerizas el
Gorrino.
De cuatro, hombre de cuatro. Los ir pesando uno
a uno, y calculando posteriormente el peso medio.
62
Captulo 3 Pafnuti Chebyshev
Uf! Voy a tener que repetir
Quizs se podra
todo el proceso, pues
arreglar; teniendo
parece que los primeros
muchsimas balanzas y
que pes han engordado.
muchsimos pesadores.
Que han
engordado? Si
parecen elefantes.
63
Captulo 3 Pafnuti Chebyshev
Pero para eso hay que
tener mucho dinero
para gastar en el
Y ahora que
Dirs que estn en
estamos en crisis!...
crisis porque nosotros
lo estamos siempre.
estudio, y generalmente
el presupuesto es
ajustadito.
Unas veces por razones econmicas,
Pues tendremos
otras por destruccin de la poblacin,
que estimar
etc., parece que no podemos trabajar
los parmetros
con la poblacin.
que nos piden
de otra forma.
Pero no s qu pinta aqu lo primero,
Parmetro es un valor
ese palabro no lo conozco.
fijo, nico, aunque pueda
ser desconocido.
64
He odo
parmetro
y estimar;
lo segundo lo
conozco: yo estimo
mucho a Azarita.
Captulo 3 Pafnuti Chebyshev
Por ejemplo, la media de nuestro peso, el de
los seis en este momento, que es un nmero,
una variable determinista, un parmetro.
Es decir, sumamos nuestros pesos y lo dividimos
entre 6; el resultado es 47,8 kilos, que es el
parmetro peso medio de la poblacin formada por
nosotros seis.
Y de lo de estimar, qu?
A m me interesa mucho.
65
Captulo 3 Pafnuti Chebyshev
Una estimacin, ya lo dijimos, es una
aproximacin ms o menos acertada de un
parmetro, o un intervalo donde pensamos
que se encuentra el parmetro.
Si t dices: de aqu hasta all, habr
O si dices tengo
unos 15 metros. Nadie pensar que
entre 20 y 25 euros,
son 15 metros justos (parmetro),
es una estimacin,
sino que aproximadamente los habr,
es una variable
o sea, una estimacin.
aleatoria.
Te miras los bolsillos,
cuentas, tienes 21 ,
Esto es un parmetro, una
variable determinista.
66
Ahora lo pillo!
Qu?
Captulo 3 Pafnuti Chebyshev
Llegamos a la conclusin de que o bien no se puede
calcular el parmetro mediante la poblacin, o se puede
con muchas dificultades, generalmente.
Por lo que tendremos que inventar algo que
Existen dos
nos d una aproximacin, a ser posible muy
clases de
buena, sobre el parmetro, un estimador.
estimadores:
puntuales y por
intervalos.
Antes de seguir os quiero recordar una escena
de nuestros anteriores episodios sobre estimacin.
67
Captulo 3 Pafnuti Chebyshev
A m me gustara que viramos estas frases
que he encontrado en dos carteles.
La estadstica es la ciencia que estudia
el paso de la incertidumbre al riesgo.
Ms vale acertar aproximadamente que fallar exactamente.
68
Captulo 3 Pafnuti Chebyshev
La primera es para que
Las frases son muy bonitas,
nos acordemos de
pero a qu vienen?
que cuando hacemos
una estimacin siempre
corremos un riesgo de
equivocarnos, de cometer
un error.
Supongo que ya se habrn
Una cosa parecida,
La segunda nos indica
hecho investigaciones
podamos decir que es
que las estimaciones
para que sea lo ms
verdad con un cierto
debemos hacerlas
pequeo posible.
riesgo.
por intervalos, nunca
puntualmente, pues
corremos un elevado
riesgo de fallar.
Pues siempre daremos en toda
estimacin un intervalo, bueno
cuando
sepamos
hacerlo.
69
Captulo 3 Pafnuti Chebyshev
Os lo digo ms claro, seguid
Alegra! Alegra!
creando problemas.
Pero de qu
problemas hablas?
Los
enumerar:
1: Cmo hallamos el
estimador?
2: Dnde lo buscamos?
3: Cmo definimos el
intervalo?
4: Cmo comprobamos que
la estimacin es aceptable?
5: Qu utilidad le daremos?
Para ello vamos a analizar varias
cuestiones que al final creo que
paciencia, pero por favor, no lo
te dejarn contento.
70
De acuerdo, tendr un poco de
compliquemos demasiado.
Captulo 3 Pafnuti Chebyshev
Primero observemos
una definicin:
Muestra: Conjunto reducido de elementos de una poblacin,
extrados convenientemente para un mantenimiento lo ms
proporcional posible, con respecto a aquella, de las variables o
caractersticas estudiadas; de dicha muestra obtendremos una
informacin, que podremos inferir respecto de la poblacin.
Verdaderamente esto
es heavy metal.
Uaf! Bruuuf!
71
Captulo 3 Pafnuti Chebyshev
Haremos un esquema y creo
que se ver mejor.
Poblacin
Muestra
dimensin mUEstral= 15
72
Captulo 3 Pafnuti Chebyshev
Me gustara explicaros cuatro
cosas sobre el esquema:
1: La poblacin sera mucho mayor, pero
por claridad del dibujo vamos a suponer que
su tamao muestral es 75.
2: Se ha decidido que la muestra sea de 15
elementos.
3: La muestra se elige por unos procedimientos
que supongo que veremos posteriormente;
aqu la eleccin es terica, para poder
establecer las definiciones bsicas.
Yo he encontrado que:
Unidad Muestral:
Es cada uno de los posibles componentes
de la muestra.
Pues yo he encontrado que lo que hacamos
antes se llama Censo porque:
Censo:
El estudio de todos y cada uno de los elementos de la poblacin.
Yo aporto lo siguiente:
Marco muestral:
Enumeracin exhaustiva de todas las unidades
muestrales.
73
Captulo 3 Pafnuti Chebyshev
O sea, como aparece en el esquema:
Y lo que Grafi puso en el esquema sera:
Poblacin marco: Cada uno de los posibles componentes de la muestra.
He encontrado:
Coeficiente de elevacin: Cantidad de unidades poblacionales
representadas por cada uno de los componentes de la muestra.
En el ejemplo: 5
Qu casualidad, yo he encontrado:
Fraccin de muestreo: Inversa del coeficiente de elevacin.
O sea:
74
Captulo 3 Pafnuti Chebyshev
En resumen, quiero saber si tengo claros estos dos conceptos:
Parmetro:
Valor determinista fijo, aunque puede ser desconocido.
En nuestro caso, calculable a partir de los datos de la poblacin.
Estimador: Variable aleatoria calculada
a partir de una muestra; para aproximarse al
parmetro poblacional.
Esto va bien. Ahora tenemos que
contestar al primer problema de
Acertijo.
Cmo hallamos el estimador?
75
Captulo 3 Pafnuti Chebyshev
Yo s un mtodo, llamado de los momentos, que consiste en hacer un copia y pega
de la frmula que usaramos para calcular en la poblacin, y aplicarla a la muestra.
Por favor una racin
de ejemplos, que si no me
mareo
Supongamos que quiero calcular la estatura media de todos
los jvenes de 14 a 18 aos de Baleares; mediante una muestra.
La muestra estara bien
elegida, verdad?
Entraran chicos
de Palma?
S y ms que de Manacor, porque la poblacin es mas numerosa en Palma que en
Manacor, y tambin entraran de Santa Eulria, y de Ciutadella Aproximadamente en la
proporcin que en esta caracterstica contaran en la poblacin.
Qu bien, yo sera candidato a
pertenecer a esa muestra.
76
Captulo 3 Pafnuti Chebyshev
A lo que vamos. Para estimar la estatura media de la poblacin,
efectuaramos la suma de todas las estaturas, y la dividiramos por la
cifra de la poblacin.
Poblacin
Media
A ver si lo he entendido
Para hallar la estimacin a partir de la muestra efectuaramos:
Muestra
Estimacin de la media
Si entrara en la muestra, a m
Pero este estimador es un solo valor, o sea, es
tambin me mediran Bien!
puntual, y yo crea que habamos quedado en que
lo bueno era dar un intervalo.
77
Captulo 3 Pafnuti Chebyshev
Los intervalos los veremos hacia el final, ahora haremos una
pausa para enfrentarnos a los distintos tipos de muestreo.
Primero haremos un
largo descanso, muuuuuy
laaaaaargo y despus
De acuerdooooo.
veremos las formas de
muestrear.
Arriba!! Vamos con el muestreo!
zzz z z
78
Captulo 3 Pafnuti Chebyshev
Muestreo
Herramienta cientfica que ayuda en la investigacin de la estimacin de parmetros poblacionales.
Supongo que esta herramienta nos ayudar a
apretar los tornillos, en todos aquellos casos
que anteriormente vimos con la poblacin.
S, ayuda cuando la poblacin es muy numerosa.
79
Captulo 3 Pafnuti Chebyshev
Tambin cuando la medicin ha de hacerse
Cuando hay procesos
Veamos, pues,
con un procedimiento destructivo.
de alteracin.
los principales tipos
de muestreo:
PROBABILSTICOS
NO PROBABILSTICOS
STICOS
ROBABIL
P
MAS: o aleatorio simple.
Muestre
tico.
sistem
aleatorio
Muestreo
do.
estratifica
Muestreo
rados.
conglome
streo por
Mue
o.
polietpic
Muestreo
les.
s especia
Muestreo
NO PROBABILSTICOS
Muestreo de conveniencia.
Muestreo de juicios.
Muestreo por cuotas.
Muestreo de bola de nieve.
Empecemos viendo qu
Es el mtodo ms
es ese "MAS"...
sencillo conocido, pero
que debe ser lo ms.
generalmente el menos
usado.
80
Captulo 3 Pafnuti Chebyshev
Binomio, ve dando un nmero a todos y cada
uno de los elementos de la poblacin.
He repartido 1.329 nmeros.
Acertijo, trae un sombrero
Introduzcamos
grande, y vamos a ir
las papeletas
elaborando 1.329 papeletas
en el sombrero
numeradas.
y establezcamos
el tamao
muestral.
Voy!
81
Captulo 3 Pafnuti Chebyshev
Ahora viene lo de la
No, lo har Gauss; que sea el que ms
mano inocente Yo!
sabe de todos nosotros no implica que
no pueda ser el ms inocente.
El 27!
Pase a ser parte
de la muestra.
Y as hasta llegar a 20.
82
Captulo 3 Pafnuti Chebyshev
Hagamos algunas transparencias de definicin y resumen del proceso.
El MAS o Muestreo Aleatorio Simple,
selecciona la muestra por procesos
aleatorios, cumpliendo la condicin
de ser equiprobabilstico para todo
elemento.
Equiqu?
Cualquier elemento de
la poblacin tiene igual
probabilidad de formar
parte de la muestra.
con reposicin
sin reposicin
El procedimiento puede ser con
reposicin y sin reposicin.
Cul es mejor?
83
Captulo 3 Pafnuti Chebyshev
El mejor es con
reposicin; no obstante,
en poblaciones muy
grandes y con tamaos
de muestra adecuados,
el procedimiento sin
Podemos usar el sombrero, o un
bombo de lotera, y para muestras
grandes los seleccionaremos
mediante una tabla de nmeros
aleatorios.
reposicin es muy
aceptable.
Las tablas de nmeros aleatorios estn
generalmente en cualquier libro de estadstica.
Estn agrupados de
cuatro en cuatro, pero
nosotros podemos
agruparlos de 5 en 5,
o como queramos.
84
Captulo 3 Pafnuti Chebyshev
Tambin sera extraordinario tomar como lista de nmeros aleatorios
la de los primeros premios de la lotera durante muchos aos.
No es nada
extraordinario,
porque son nmeros
aleatorios.
No, si lo de extraordinario lo digo, porque si demostramos
que no lo son Qu montn de dinero bamos a ganar!
Creo que deberamos
empezar con el
Muestreo aleatorio
sistemtico.
Pues escenifiqumoslo:
Han salido: del primer
Y del segundo, un 7.
bombo, el 5
85
Captulo 3 Pafnuti Chebyshev
Empecemos el proceso:
Y as seguiramos con la
El muestreo aleatorio sistemtico es
muestra hasta que el nmero
con un sistema previo de realizacin; el
a la cantidad muestral.
86
como el muestreo aleatorio simple, pero
de seleccionados fuera igual
que se ha expuesto antes o
Captulo 3 Pafnuti Chebyshev
Se utiliza un solo bombo y, posteriormente, al nmero
resultante se le va sumando una constante:
Poblacin (tamao
Tamao muestral
Constante
Sorteo
1 de la muestra
2
3
4
25
50
87
Captulo 3 Pafnuti Chebyshev
Esto ha sido un ejemplo; del sorteo saldra posiblemente otro nmero en otro caso, y la
constante dependera, entonces, de la poblacin y de la cantidad muestral que se estableciera.
Para ir viendo los restantes tipos de
muestreo, creo que sera muy interesante que
Grafi nos elaborara unas pseudopeliculillas
de esas que ella sabe hacer tan bien.
Muestreo
estratificado???
Vale, a por ello.
poblacin total 20+10+5+30+20= 85 ????
88
Captulo 3 Pafnuti Chebyshev
Tenemos una poblacin, en la que existen subgrupos
internamente homogneos, aunque diferentes entre
s cuantitativa y cualitativamente.
Ya hemos
encontrado
los Estratos.
Tamaos poblacionales en cada estrato:
N1; N2; N3; N4; N5; N6
Tamao poblacional:
N1 + N2 + N3 + N4 + N5 + N6 = N
Tamaos muestrales en cada estrato:
n1; n2; n3; n4; n5; n6
Cmo elegimos las
cantidades muestrales de
cada estrato?
Tamao muestral:
n1 + n2 + n3 + n4 + n5 + n6 = n
Las tcnicas ms
generalizadas son:
1. Muestreo estratificado proporcional.
2. Muestreo estratificado no
proporcional.
3. Asignacin ptima de los estratos.
89
Captulo 3 Pafnuti Chebyshev
Para contestar ms directamente a Binomio tendramos
que buscar un nuevo concepto y sus clases:
estrato 1
Afijacin
estrato 2
d
cantida
artir la atos.
de rep
Forma entre los estr
al
muestr
Afijacin uniforme
Unidades muestrales de cada estrato:
Los estratos pequeos salen
beneficiados en precisin.
90
estrato
Captulo 3 Pafnuti Chebyshev
Todas las unidades de
la poblacin tienen la
misma probabilidad de
pertenecer a la muestra.
Desviaciones tpicas o estndares de cada estrato:
Tamaos muestrales de cada estrato:
91
Captulo 3 Pafnuti Chebyshev
Estrato 1
Los tamaos de las muestras de cada
estrato vienen influenciados por la
variabilidad y el propio tamao del estrato.
Aqu s que me he
podemos aclarar
fuera de juego.
92
Vamos a ver si
quedado un poco
algo.
Estrato 3
Captulo 3 Pafnuti Chebyshev
Estrato 2
Estrato 3: Tama
o grande
Variabilidad gra
nde
Estrato 4: Tama
o pequeo
Variabilidad gran
de
Estrato 2: Tama
o grande
Estrato 4
Variabilidad peq
uea
Estrato 1: Tama
o pequeo
Variabilidad peq
uea
El tamao muestral
tiene ese mismo
orden: 3, 4, 2, 1 de
mayor a menor.
93
Captulo 3 Pafnuti Chebyshev
O sea, que aparte del tamao se mira si
Va en la lnea, pero t lo
son muy diferentes o todos parecidos.
resuelves mediante la frmula.
Como ltimo tipo de
afijacin veremos la:
Afijacin ptima
En este tipo se tiene tambin en cuenta el coste. Sus frmulas son:
94
Captulo 3 Pafnuti Chebyshev
Veamos un nuevo tipo de muestreo: el
muestreo por conglomerados.
Har un pequeo esbozo.
95
Captulo 3 Pafnuti Chebyshev
Seleccionamos al azar una
Primero, desagregaremos
muestra de estos grupos,
la poblacin en grupos
tambin denominados reas o
heterogneos de individuos.
conglomerados.
Parece que est
cambiando el tiempo
Eh! Que digo que
est empezando
a nevar, chicos.
96
Captulo 3 Pafnuti Chebyshev
Y de los conglomerados seleccionados como muestra, hacemos un estudio
censal, o sea, estudiamos a todos los individuos que los componen.
Y as podramos
continuar con muchas
formas de muestreo.
Lo que tenemos que hacer
es continuar a cubierto.
97
Captulo 3 Pafnuti Chebyshev
Planteemos el ltimo esquema y en
el prximo ya veremos
Pero viendo el maravilloso
tiempo blanco que se est
formando
Proceso del muestreo
Definicin de los objetivos de la encuesta.
Definicin de la poblacin objeto de estudio.
Elementos. Unidades de muestreo.
Alcance. Tiempo.
Definicin del marco muestral.
Seleccin del procedimiento de muestreo.
Establecimiento de la medida de la muestra.
Obtencin de la muestra.
98
Captulo 3 Pafnuti Chebyshev
Antes de que nos
marchemos He
encontrado un tipo
de muestreo que le va
como anillo al dedo.
Qu
nevada!
Muestreo en bola de nieve: consiste
en hacer una primera seleccin y que
los encuestados te recomienden a
otros para encuestar y as
Cmo dices?
99
Captulo 3 Pafnuti Chebyshev
Las cosas estn cambiando Antes Acertijo siempre era
el primero en quererse ir, y hoy es el ltimo investigando.
100
Captulo 3 Pafnuti Chebyshev
A la nieve!!!
101
Captulo 3 Pafnuti Chebyshev
FIN
102