UNIVERSIDAD DEL VALLE DE MÉXICO
ASIGNATURA
Estadística Inferencial
DOCENTE
Víctor Tinoco Cedillo
ACTIVIDAD 8
Proyecto Integrador Etapa I
PRESENTA:
UBALDO MOUETT GÓMEZ
DOUGLAS ALEXANDER LINARES PEÑATE
JOSÉ DE JESÚS VARGAS ESTRADA
ALEJANDRO GUADALUPE CEJA RAMÍREZ
FECHA DE ENTREGA: 22 DE AGOSTO DEL 2021.
Introducción.
Esta actividad consiste en aplicar los conocimientos adquiridos a lo largo del curso y retomar lo aprendido en
cada una de las actividades realizadas, lo que garantiza la transversalidad de los contenidos revisados para
fortalecer el desarrollo de competencias y lograr el fin de formación planteado.
Objetivo.
El objetivo del proyecto integrador es aplicar las técnicas de estadística inferencial estudiadas a una encuesta
real, de tal forma que el estudiante se familiarice con fuentes de datos de encuestas nacionales y sea capaz de
obtener inferencias de la población objetivo.
El estudiante revisará el método de recopilación de datos, planteará preguntas de investigación de su interés,
elaborará un análisis exploratorio de las variables pertinentes de acuerdo con sus preguntas de investigación y,
finalmente, procederá a la aplicación de las técnicas inferenciales interpretando sus resultados
¿Qué fuente de datos se utilizará?
En este proyecto integrador trabajará con un extracto de la General Social Survey(GSS), una encuesta
sociológica diseñada y recolectada regularmente desde el año 1972 por el Centro Nacional de Investigación
sobre Opiniones de la Universidad de Chicago,E.U.A. Su financiamiento está a cargo de la Fundación Nacional
de Ciencias. Recopila información acerca de las preocupaciones, experiencias, actitudes y prácticas de los
residentes de los Estados Unidos.
Desde 1972, la GSS ha estado monitoreando el cambio social y estudiando la creciente complejidad de la
sociedad estadounidense. Es uno de los estudios más influyentes en ciencias sociales y con frecuencia se hace
referencia a él en publicaciones líderes como The New York Times, The Wall Street Journal y The Associated
Press.
Los objetivos de la GSS son recopilar datos sobre la sociedad estadounidense contemporánea para monitorear
y explicar tendencias y constantes en actitudes, comportamientos y atributos; examinar la estructura y el
funcionamiento de la sociedad en general, así como el papel desempeñado por los subgrupos poblacionales;
comparar a los Estados Unidos con otras sociedades para colocar a la sociedad estadounidense en una
perspectiva comparativa y desarrollar modelos nacionales de la sociedad; otro de sus objetivos es hacer que
datos de alta calidad sean fácilmente accesibles para académicos, estudiantes, funcionarios públicos y otros,
con un costo mínimo.
Los datos recopilados en esta encuesta incluyen tanto la información demográfica como las opiniones de los
encuestados acerca de asuntos que van desde el gasto público hasta temas como el racismo, pasando por la
existencia y la concepción individual de Dios.
Debido a la amplia gama de temas tratados y la recopilación integral de información demográfica, los resultados
de las encuestas permiten a los científicos sociales correlacionar factores demográficos como la edad, la raza,
el género y la educación urbana/rural con las creencias, y así determinar si, por ejemplo, un encuestado
masculino afroamericano de mediana edad tendría más o menos probabilidades de mudarse a un estado
diferente de los Estados Unidos por razones económicas que una mujer blanca de edad similar encuestada; o
si una persona altamente educada con una educación rural es más propensa a creer en un Dios trascendente
que una persona con una educación sólo de nivel secundaria pero urbana.
Los resultados de la GSS están disponibles en internet para las personas interesadas, son ampliamente
utilizados en la investigación sociológica. Los datos están disponibles en distintos formatos para programas
estadísticos (por ejemplo, R/SAS/SPSS/Stata), el Explorador de Datos de GSS permite a los usuarios buscar
información de forma rápida, probar hipótesis y buscar correlaciones interesantes directamente en el sitio web.
La GSS se vinculó recientemente al Índice Nacional de Mortalidad. Este conjunto de datos de libre acceso
permite a los investigadores explorar la asociación entre las variables en la GSS y la longevidad humana. Por
ejemplo, es posible explorar la asociación entre la felicidad y la esperanza de vida. El con nto y diccionario de
datos están disponibles para su descarga.
Submuestra de la GSS
Utiliza el conjunto de datos de la GSS gss.csv e impórtalo en MINITAB. El archivo contiene 57061 registros
(personas encuestadas) y 114 variables (columnas). Es un extracto de la GSS en el periodo 1972-2012 que
proporciona una muestra de variables seleccionadas de la encuesta con el objetivo de proporcionar un archivo
de datos conveniente para los estudiantes que están aprendiendo razonamiento estadístico.
A diferencia del archivo acumulativo completo de la GSS, se han eliminado de las respuestas los valores
faltantes y se han creado variables categóricas para facilitar el análisis. Se espera que esto permita a los
estudiantes centrarse en conceptos estadísticos sin tener que (inicialmente) preocuparse por algunos de los
problemas de gestión e interpretación de datos asociados con los datos faltantes y variables categóricas. Aparte
de las dos modificaciones mencionadas anteriormente, todos los datos y la codificación proceden del conjunto
de datos original.
Se invita a los estudiantes e investigadores que buscan llevar a cabo análisis más ambiciosos a explorar el
diccionario de datos completo del archivo acumulativo completo de la GSS en el siguiente vínculo:
Etapa 1 del Proyecto Integrador
Introducción.
I. Exploración de Encuesta
1.1 Selección de Variables
1.2 Planteamiento de Preguntas de Investigación
I. Exploración de encuesta
1.1 Identificación de variables
Realiza el tratamiento de datos mediante el programa MINITAB, el documento final debe elaborarse en el
procesador de textos Word. Para la escritura de las expresiones matemáticas se recomienda el uso del editor
de ecuaciones de dicho programa de cómputo.
a. Como primer paso, revisa el archivo que contiene el diccionario de datos (gss_diccionario_datos.html) y
estudie detenidamente el significado de cada una de las variables (columnas) del archivo. Para ello,
identifique el tipo de cada variable, cualitativas (nominales o categóricas) o cuantitativas.
Variable Definición Tipo
caseid Numero de muestra Cuantitativa
year Año en que se realizó la Cuantitativa
encuesta
age Edad del encuestado Cuantitativa
sex Sexo del encuestado Cualitativa categórica
race Estudios del encuestado Cualitativa categórica
hispanic Es de ascendencia Cualitativa categórica
hispanoamericana
uscitzn Si pertenece a un Cualitativa categórica
ciudadano de los EUA
educ Años de estudio de los Cuantitativa
encuestados
paeduc Año de estudios más Cuantitativa
altos del padre
maeduc Año de estudios más alto Cuantitativa
de la madre
speduc Año de estudios más alto Cuantitativa
del esposo
degree Grado más alto de estudios del encuestado
vetyears Años en la fuerzas Cuantitativa
armadas
sei Índice socioeconómico Cuantitativa
wrkstat Situación actual laboral Cualitativa categórica
wrkslf Autoempleo o empleado Cualitativa categórica
de alguien mas
marital Estado civil Cualitativa categórica
spwrksta Trabajo de la esposa Cualitativa categórica
sibs Numero de hermanos y Cuantitativa
hermanas
childs Número de hijos e hijas Cuantitativa
agekdbrn Año de nacimiento del Cuantitativa
primer hijo
incom16 Personas en la familia Cualitativa categórica
con 16 años
born Nacido en EUA Cualitativa categórica
parborn Padres nacidos en EUA Cualitativa categórica
granborn Abuelos nacidos en EUA Cuantitativa
income06 Ingreso familiar total Cuantitativa
coninc Número de personas Cuantitativa
que generan ingresos en
la familia
region Región de le entrevista Cualitativa categórica
partyid Afiliación política Cualitativa categórica
polviews Inclinación política Cualitativa categórica
relig Religión Cualitativa categórica
attend Con que frecuencia Cualitativa categórica
asiste a servicios
religiosos
natspac Programa de exploración Cualitativa ordinal
espacial
natenvir Mejorar y proteger el Cualitativa ordinal
medio ambiente
natheal Mejora para proteger la Cualitativa ordinal
salud de las naciones
natcity Solucionar problemas de Cualitativa ordinal
las grandes ciudades
natcrime Aumento de la tasa de Cualitativa ordinal
delincuencia.
natdrug Adicción a las drogas Cualitativa ordinal
nateduc Solución del sistema de Cualitativa ordinal
educación
natrace Mejora de las Cualitativa ordinal
condiciones de las
personas de color
natarms Militares armamento y Cualitativa ordinal
defensa.
nataid Ayuda extrema Cualitativa ordinal
natfare bienestar Cualitativa ordinal
natroad Carreteras y puentes Cualitativa ordinal
natsoc Seguridad social Cualitativa ordinal
natmass Transporte masivo Cualitativa ordinal
natpark Parques y recreación Cualitativa ordinal
confinan Confinamiento Cualitativa categórica
conbus Confidencialidad en Cualitativa categórica
compañías en los
mayores
conclerg Confianza en la religión Cualitativa categórica
coneduc Confianza en la Cualitativa categórica
educación
confed Confianza en la rama Cualitativa categórica
ejecutiva del gobierno
federal
conlabor Confianza en labor Cualitativa categórica
organizada
conpress Confianza en la prensa Cualitativa categórica
conmedic Confianza en la medicina Cualitativa categórica
contv Confianza en la tv Cualitativa categórica
conjudge Confianza en los jueves Cualitativa categórica
consci Confianza en la Cualitativa categórica
comunidad científica
conlegis Confianza en la actividad Cualitativa categórica
legisladora
conarmy Confianza en el ejercito Cualitativa categórica
joblose Desempleo Cualitativa categórica
jobfind Búsqueda reciente de Cualitativa categórica
empleo
satjob Trabajo en casa Cualitativa categórica
richwork Si es rico continua Cualitativa categórica
trabajando
jobinc Trabajando en una Cualitativa categórica
empresa
jobsec Sin peligro de ser Cualitativa ordinal
despedido
jobhour Horas de trabajos Cualitativa ordinal
jobpromo Trabajo de medio tiempo Cualitativa ordinal
jobmeans Trabajos importante y Cualitativa ordinal
obtención de logros
class Identificación de clase Cualitativa ordinal
rank Posición social Cualitativa ordinal
satfin Satisfacción de Cualitativa categórica
soluciones financieras
finalter Cambio en la situación Cualitativa categórica
financiera
finrela Opinión familiar Cualitativa categórica
unemp Desempleo del último Cualitativa categórica
año
govaid Alguna vez recibió Cualitativa categórica
asistencia social.
getaid Necesita asistencia Cualitativa categórica
social
union Permanece en unión con Cualitativa categórica
su cónyuge
getahead Opinión de como salen Cualitativa categórica
adelante las personas
parsol Vives con tu padres Cualitativa categórica
kidssol Niños viviendo contigo Cualitativa categórica
abdefect Oportunidad de un Cualitativa categórica
defecto serio
abnomore Casado sin hijos Cualitativa categórica
abhlth Mujer con peligro Cualitativa categórica
abpoor Bajos ingresos Cualitativa categórica
abrape Embarazada como Cualitativa categórica
resultado de violación
absingle No casado Cualitativa categórica
abany Aborto por cualquier Cualitativa categórica
razón
pillok Control de natalidad 14 a Cualitativa categórica
16 años
sexeduc Recibió educación Cualitativa categórica
sexual
divlaw Divorciado Cualitativa categórica
premarsx Sexo premarital Cualitativa categórica
teensex Sexo menos de los 18 Cualitativa categórica
años
xmarsex Sexo con otras persona Cualitativa categórica
que no sea la pareja
homosex Es homosexual Cualitativa categórica
suicide1 Suicidio por enfermedad Cualitativa categórica
incurable
suicide2 Suicidio por quiebra Cualitativa categórica
suicide3 Suicido por deshonra de Cualitativa categórica
la milicia
suicide4 Suicidio porque está Cualitativa categórica
cansado de la vida
Fear Miedo a caminar de Cualitativa categórica
noche por el barrio
owngun Es propietario de un Cualitativa categórica
arma
pistol Con pistola en casa Cualitativa categórica
shotgun Con escopeta en casa Cualitativa categórica
rifle Con rifle en casa Cualitativa categórica
news Con que frecuencia Cualitativa categórica
realiza la lectura de
noticias
tvhours Horas del día viendo tv Cualitativa categórica
racdif1 Diferencia por Cualitativa categórica
discriminación m
racdif2 Diferencias por Cualitativa categórica
discapacidad innata
racdif3 Diferencias por falta de Cualitativa categórica
educación
racdif4 Diferencias por falta de Cualitativa categórica
voluntad
helppoor Debería el gobierno Cualitativa categórica
mejorar el nivel de vida
helpnot El gobierno debería Cualitativa categórica
hacer más?
helpsick El gobierno debería dar Cualitativa categórica
atención medica
helpblk Los gobiernos deberían Cualitativa categórica
ayudar a las personas de
color
Nota: Recuerda que las proporciones se aplican a las variables cualitativas y los promedios se aplican a las
variables cuantitativas, esto significa que el tipo de análisis estadístico que puede aplicarse a una o más
variables depende de su tipo. Además, revisa la unidad de medición de las variables para que puedas
expresar sus resultados en las unidades correctas que se están planteando en la encuesta.
b. Observa que existen diversos temas como educación, salud, empleo, ingresos, política, racismo,
religión, expectativas sobre calidad de vida, vivienda...
c. Para la realización del proyecto deberás seleccionar el tema de tu interés utilizando los datos de la
encuesta para la aplicación de la estadística inferencial.
El tema elegido es ABANY, el cual habla de la aprobación de que una mujer embarazada pueda tener un
aborto legal sin razón especifica.
d. Describe la forma en que las observaciones fueron recolectadas y las implicaciones de este método
de recolección en el ámbito (alcance) de la inferencia estadística (generalización de los
resultados/causalidad). Nota que necesitarás revisar la documentación de la GSS (http://gss.norc.org/)
para responder esta pregunta.
Recolección de Datos (en general): Las observaciones se recopilaron mediante encuestas realizadas a adultos
(mayores de 18 años) que vivan en Estados Unidos. La muestra de GSS se extrae utilizando un diseño de
probabilidad de área que selecciona aleatoriamente a los encuestados en hogares de todo Estados Unidos para
participar en la encuesta. Los encuestados que se convierten en parte de la muestra de GSS provienen de una
mezcla de áreas geográficas urbanas, suburbanas y rurales. La participación en el estudio es estrictamente
voluntaria. Sin embargo, debido a que solo unos pocos miles de encuestados son entrevistados en el estudio
principal, cada encuestado seleccionado es muy importante para los resultados. La encuesta se lleva a cabo
cara a cara con una entrevista en persona por NORC en la Universidad de Chicago. La encuesta se realizó
todos los años de 1972 a 1994 (excepto en 1979, 1981 y 1992). Desde 1994, se ha llevado a cabo cada dos
años. La encuesta tarda unos 90 minutos en administrarse. A partir de 2014, se han recogido 30 muestras
nacionales con 59.599 encuestados y más de 5.900 variables.
Recolección de Datos (en particular, sobre el aborto): las observaciones recolectadas en torno a la aceptación
o no del aborto (en las diferentes circunstancias en que se cuestionó a las personas) fueron recolectadas
mediante una encuesta presencial en donde las opciones de respuesta a las diferentes preguntas consistían
en: a) Si (apoya el aborto), b) No (apoya el aborto), c) NA (no quiso responder). Este modelo de recolección de
datos implica que de acuerdo con la muestra que se toma para el estudio podemos destacar que la mayoría de
los diferentes rangos de edades dan su opinión al respecto y a partir de esta se puede obtener una
representación del sentir de la población sobre el tema del aborto.
Preguntas asociadas a la variable:
ABANY:
¿Piensa que debería ser posible para una mujer embarazada obtener un aborto legal si la mujer quiere
hacérselo por cualquier razón?
1.2 Planteamiento de preguntas de investigación
e. Identifica y expresa por escrito cuatro preguntas de investigación de su interés similares a las
preguntas que se han planteado en las distintas actividades. Debes formular las preguntas de
investigación de una manera consistente con los planteamientos teóricos presentados en los
libros de referencia.
a. Generando grupos de entrevistados por cada 10 años a partir de 1972, cuáles son los promedios de edad y
porcentajes de sexo de cada uno y cuál es su opinión respecto al aborto.
b. ¿Cuál es una estimación puntual para la proporción de adultos que creen que en Estados Unidos es
incorrecto que una mujer aborte solo por ser su decisión?
c. Estime la proporción de todas las personas que se muestren en contra mediante un intervalo de confianza
de 90%.
d. Dentro de la población 12,887 están a favor del aborto sin razón alguna ¿Cuál es el porcentaje de
aceptación al aborto de las partes de la población que optaron por dar su opinión al tema? También estime la
proporción de todas las personas que se muestren a favor mediante un intervalo de confianza de 90%.
Puedes crear nuevas variables a partir de las ya existentes (por ejemplo, recodificándolas o realizando
operaciones entre ellas). Junto con las preguntas de investigación incluya una breve discusión (3
párrafos) sobre la razón por la cual estas cuatro preguntas son de interés para usted o su audiencia.
Discute con tu profesor la pertinencia de las preguntas planteadas.
Conclusion:
Basándonos en el tema las repuestas varían por el grupo de edades en los cuales tiende a favorecer al aborto
de manera legal en rangos de edades mas jóvenes, debido a las nuevas corrientes o en especifico a la tercera
ola del feminismo.
Es de suma importancia conocer las respuestas de cada grupo de edades, por eso hemos decidido generar
grupos de entrevistados que sean divididos por 10 años a partir de 1972, conforme pasa el tiempo las ideas
cambian y el acceso a la información puede ser una variante.
La encuesta se realizará en un país ajeno al nuestro para conocer la perspectiva de una nación más
desarrollada en comparación con nosotros para así poder generar mayor impacto en la nuestra.
En dicha nación el sector más joven se basa en lo que puede llegar a limitar en la vida profesional a una
persona con metas a corto plazo o con diferentes prioridades.
Existen países donde el aborto es totalmente prohibido y solo se permite en situaciones donde peligra la vida
de la mujer (tal es el caso del nuestro), 1 de cada 4 abortos es seguro ya que al practicarse de manera
clandestina aumenta exponencialmente los riesgos de que algo salga mal.
Esto genero nuestro interés a partir de la información expresada en la muestra de la GSS nos permite
visualizar el comportamiento de una determinada población con un riesgo de error medible en términos de
probabilidad y a partir de esos datos inferir (en este caso puntual del aborto) estadísticas tales como: cuantos
adultos creen que es incorrecto que una mujer aborte o cuáles son los promedios de edad y porcentajes de
sexo de cada uno y cuál es su opinión respecto al aborto.
Referencias.
Devore, J. L. (2016). Probabilidad y Estadistica para Ingenieria y Ciencias (9 ed.). Cengage Learning.
Retrieved from https://elibro.net/es/lc/uvm/titulos/93280
McClave, J., & Sincich, T. (2014). Statistics (12 ed.). Harlow: Pearson. Mendenhall, W. I., Beaver, R. J., &
Beaver, B. M. (2015). Introducción a la probabilidad y estadística (14 ed.). México, D.F: CENGAGE Learning.
Sweeney, D. J., Anderson, D. R., & Williams, T. (2011). Estadistica para negocios y economia (11 ed.).
Cengage Learning. Retrieved from https://elibro.net/es/lc/uvm/titulos/39949
GSS Data Explorer | NORC at the University of Chicago. (s. f.). GSS The General Social Survey. Recuperado
23 de agosto de 2021, de http://gss.norc.org/About-The-GSS
GSS Data Explorer | NORC at the University of Chicago. (s. f.). GSS Data Explorer | NORC at the University of
Chicago. Recuperado 19 de agosto de 2021, de https://gssdataexplorer.norc.org/variables/51/vshow