7 Regresión Lineal Múltiple

Podemos ver la regresión lineal multiple como una extensión de la regresión lineal simple y como se relacionan dos o más variables. En regresión lineal simple tenemos solamente dos variables, una variable dependiente $y$ y una variable independiente $x$, pero en regresión lineal múltiple no es de esta forma, tenemos más de una variable independiente. Comúnmente a las variables independientes les llamamos variables predictoras y a la variable dependiente como variable de respuesta. La ecuación que describe esta situación en forma matemática para la regresión lineal multiple es:

y=a+b_{1} x_{1}+b_{2}x_{2}+ ...+ b_{n}x_{n}

donde la variable dependiente o variable de respuesta es y, a,b_{1},...,b_{n} son coeficientes y las variables independientes, o variables predictoras son x_{1},x_{2},...,x_{n}.

Para crear en R un modelo usamos el comando

lm()

El modelo determina los valores de los coeficientes usando una base de datos. Después de esto, podemos predecir el valor de la variable de respuesta usando los valores de los coeficientes.

La función lm(), crea relación entre las variables predictoras y la variable de respuesta. Para usar esta función de R, podemos ingresar el siguiente comando

lm(y ~ x1+x2+...+xn,data)

Ejemplo:

Aprovechando que al instalar $R$ tenemos acceso a un conjunto de bases de datos, usaremos en esta ocasión la base “mtcars”. Esta base nos da una comparación entre modelos de carros en términos de millas por galón (mpg), cilindros (disp), caballos de fuerza (hp), peso del carro (wt) y algunos paraámetros importantes que son de interés para quienes comparan autos.

input <- mtcars[,c("mpg","disp","hp","wt")]

El siguiente comando crea el modelo.

modelo <- lm(mpg~disp+hp+wt, data=input)

Para ver el modelo

print(modelo)

Tomamos los valores de los coeficientes como un vector

cat("# # # # Valores de los coeficientes # # # ","\n")

Después

a <- coef(modelo)[1] Xdisp <- coef(modelo)[2] Xhp <- coef(modelo)[3] Xwt <- coef(modelo)[4] a Xdisp Xhp Xwt   Para crear una ecuación del modelo de regresión nos basamos en los valores de los coeficientes, con esto, tenemos la el modelo matemático para predecir la variable dependiente $y$. La sintaxis puede ser   Y = a+Xdisp.x1+Xhp.x2+Xwt.x3  o bien  Y = 37.15+(-0.000937)*x1+(-0.0311)*x2+(-3.8008)*x3

Para aplicar esta ecuación y predecir nuevos valores, podemos cambiar los valores de las variables independiente para ver lo que sucede con la variable de respuesta. Si disp=221, hp=102 y wt=2.91 el valor de las millas por galón es

Y = 37.15+(-0.000937)*221+(-0.0311)*102+(-3.8008)*2.91 = 22.7104

Primer examen