0% encontró este documento útil (0 votos)
40 vistas9 páginas

Regresión Lineal Múltiple en Precios de Casas

El modelo de regresión lineal múltiple muestra que el precio de una casa depende de su tamaño, número de habitaciones y antigüedad. El tamaño de la casa tiene un efecto positivo significativo en el precio, mientras que el número de habitaciones y la antigüedad no tienen un efecto significativo en el precio. El modelo tiene un buen ajuste con un R-cuadrado de 0.9386 y un valor p muy bajo de 6.561e-10, lo que indica que el modelo es estadísticamente significativo.

Cargado por

Anabel Hiraldo
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
40 vistas9 páginas

Regresión Lineal Múltiple en Precios de Casas

El modelo de regresión lineal múltiple muestra que el precio de una casa depende de su tamaño, número de habitaciones y antigüedad. El tamaño de la casa tiene un efecto positivo significativo en el precio, mientras que el número de habitaciones y la antigüedad no tienen un efecto significativo en el precio. El modelo tiene un buen ajuste con un R-cuadrado de 0.9386 y un valor p muy bajo de 6.561e-10, lo que indica que el modelo es estadísticamente significativo.

Cargado por

Anabel Hiraldo
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

UNIVERSIDAD TECNOLÓGICA DE SANTIAGO, UTESA

SISTEMA CORPORATIVO
Facultad de Arquitectura e Ingeniería, Carrera de Ingeniería en Sistemas

Regresión Lineal Múltiple


Laboratorio de Métodos Numéricos

Facilitador:
Felix Suriel Duran

Presentado por:
Anabel Hiraldo 1-21-2668

Santiago de los Caballeros, República Dominicana,


12 de diciembre del 2023
Regresión Lineal Múltiple en R studio

Planteamiento del problema:


Se presenta un modelo de regresión lineal múltiple relacionado con casas, el precio de la casa
sería la variable dependiente, es decir, la variable que estamos tratando de predecir o explicar.
Las variables independientes, que son las que utilizamos para predecir el precio, serían el tamaño
de la casa (en pies cuadrados o metros cuadrados), el número de habitaciones y la antigüedad de
la casa (en años).
El objetivo de este modelo sería entender cómo estas variables independientes influyen en el
precio de una casa. Por ejemplo, podríamos querer saber si las casas más grandes (con mayor
tamaño) tienden a tener precios más altos, o si las casas más antiguas tienden a tener precios más
bajos. Este modelo nos permitiría cuantificar estas relaciones y hacer predicciones sobre el
precio de una casa basándonos en su tamaño, número de habitaciones y antigüedad. Sin
embargo, es importante recordar que la regresión lineal sólo puede capturar relaciones lineales
entre las variables, y que siempre habrá algún grado de incertidumbre en nuestras predicciones.

Dataset:
La tabla de datos muestra cuatro columnas: Precio, Tamaño, Habitación y Antigüedad. Estas son
las posibles variables independientes y dependientes que se estudiaran. La variable dependiente
“Precio", es el precio de una casa cambia según su tamaño, número de habitaciones o
antigüedad. Por otro lado, la variable independiente “Tamaño”, podría analizar cómo el tamaño
de una casa cambia según el número de habitaciones o antigüedad. Finalmente, la variable
independiente “Habitación”, podrías analizar cómo el número de habitaciones de una casa
cambia según su antigüedad.
Codigo en R

Conclusiones:

Matriz de correlacion:

Se dice que si el valor está en el rango de -1 a 1. Si el valor es cercano a 1, significa que hay una
fuerte correlación positiva entre las dos variables. Cuando está cerca de -1, las variables tienen
una fuerte correlación negativa.

Guiándome de lo anterior se puede analizar que:


 Precio y Tamaño: Hay una fuerte correlación positiva (0.9659086), lo que significa que
a medida que el tamaño de la casa aumenta, también lo hace el precio.
 Precio y Habitaciones: Hay una fuerte correlación positiva (0.8881939), lo que indica
que a medida que aumenta el número de habitaciones, también lo hace el precio.
 Precio y Antigüedad: Hay una fuerte correlación negativa (-0.9185094), lo que significa
que a medida que aumenta la antigüedad de la casa, el precio tiende a disminuir.
 Tamaño y Habitaciones: Hay una fuerte correlación positiva (0.8880249), lo que indica
que las casas más grandes suelen tener más habitaciones.
 Tamaño y Antigüedad: Hay una fuerte correlación negativa (-0.9213128), lo que
sugiere que las casas más antiguas suelen ser más pequeñas.
 Habitaciones y Antigüedad: Hay una fuerte correlación negativa (-0.9572887), lo que
indica que las casas más antiguas suelen tener menos habitaciones.

Covarianza:

 Precio y Tamaño: La covarianza positiva entre "Precio" y "Tamaño" (76368.42) indica


que, en general, a medida que el tamaño de la vivienda aumenta, también tiende a
aumentar el precio.
 Precio y Habitaciones: La covarianza positiva entre "Precio" y "Habitaciones" (2400.00)
sugiere que, en general, hay una tendencia positiva de que el precio aumente a medida
que aumenta el número de habitaciones.
 Precio y Antigüedad: La covarianza negativa entre "Precio" y "Antigüedad" (-4505.26)
sugiere que, en general, hay una tendencia negativa de que el precio disminuya a medida
que la antigüedad de la propiedad aumenta.
 Tamaño y Habitaciones: La covarianza positiva (16.68) indica que, en general, a
medida que el tamaño de la vivienda aumenta, también tiende a aumentar el número de
habitaciones.
 Tamaño y Antigüedad: La covarianza negativa (-31.42) sugiere que, en general, hay
una tendencia negativa de que el tamaño de la vivienda disminuya a medida que aumenta
la antigüedad.
 Habitaciones y Antigüedad: La covarianza negativa (-1.12) sugiere que, en general, hay
una tendencia negativa de que el número de habitaciones disminuya a medida que
aumenta la antigüedad.
Pearson's product-moment correlation:

 Estadístico t: El valor t es 7.7084. Este valor t se utiliza para probar si la correlación


entre las variables es significativamente diferente de cero. En este caso, un valor t más
grande sugiere una correlación más fuerte.
 Grados de libertad (df): 18. Los grados de libertad se utilizan en la prueba de hipótesis
y en la construcción del intervalo de confianza.
 Valor p: El valor p es 4.142e-07, que es muy pequeño. Esto sugiere que la correlación
observada es muy poco probable que ocurra por azar. En términos generales, un valor p
pequeño (generalmente < 0.05) indica que puedes rechazar la hipótesis nula de que la
correlación es cero.
 Hipótesis alternativa: La hipótesis alternativa es que la verdadera correlación no es
igual a cero. En este caso, la correlación es significativamente diferente de cero.
 Intervalo de confianza: El intervalo de confianza del 95% para la correlación está entre
0.708 y 0.950. Esto significa que puedes estar bastante seguro de que la verdadera
correlación en la población se encuentra dentro de este intervalo.
 Estimación de la muestra: La estimación de la muestra para la correlación (cor) es
0.876. Esto sugiere una fuerte correlación positiva entre las variables "Precio" y
"Habitaciones". El valor de correlación cercano a 1 indica que a medida que el número de
habitaciones aumenta, el precio tiende a aumentar también.

Summary

El modelo de regresión lineal múltiple muestra que el precio de una casa depende de su tamaño,
número de habitaciones y antigüedad. El tamaño de la casa tiene un efecto positivo significativo
en el precio, mientras que el número de habitaciones y la antigüedad no tienen un efecto
significativo en el precio. El modelo tiene un buen ajuste con un R-cuadrado de 0.9386 y un
valor p muy bajo de 6.561e-10, lo que indica que el modelo es estadísticamente significativo.

Diagrama de dispersión:
Residuos vs Ajustados: es que existe una tendencia decreciente, lo que indica que los residuos
disminuyen a medida que aumentan los valores ajustados. Esto podría sugerir que el modelo
lineal lm(Precio ~ Tamaño + Habitaciones + Antiguedad) puede no ser el mejor ajuste para los
datos.

Predicciones:
Gráfico de residuo:

En este caso, los puntos de datos están estrechamente alineados con la línea de cuantiles teóricos,
lo que sugiere que los residuos se distribuyen normalmente.

El gráfico muestra los residuos estandarizados (en la escala de raíz cuadrada) en función de los
valores ajustados para un modelo lineal que predice el precio en función del tamaño, el número
de habitaciones y la antigüedad.
observaciones basadas en el gráfico:
1. Los residuos estandarizados están dispersos a lo largo de diferentes niveles de
apalancamiento.
2. La línea roja curvada, conocida como la “distancia de Cook”, atraviesa el gráfico. Esta
línea es una medida para evaluar la influencia de cada observación en el modelo de
regresión.

También podría gustarte