La regresión lineal múltiple es una técnica estadística utilizada para modelar la relación entre una variable dependiente y dos o más variables independientes. Se basa en la ecuación de una línea recta en un espacio multidimensional y permite predecir valores de la variable dependiente en función de las independientes.
La regresión lineal se remonta al siglo XIX, cuando Carl Friedrich Gauss y Adrien-Marie Legendre desarrollaron el método de mínimos cuadrados para minimizar errores en modelos predictivos. Más tarde, se amplió a múltiples variables, dando lugar a la regresión lineal múltiple, ampliamente utilizada en estadística, economía e ingeniería.
Dado un conjunto de puntos (x0,y0),(x1,y1),…,(xn,yn), el polinomio interpolante de Lagrange Pn(x) se define como:
Y es la variable dependiente.
β0 es la intersección con el eje Y (término independiente).
β1,β2,…,βn son los coeficientes de regresión que representan el impacto de cada variable independiente.
X1,X2,…,Xn son las variables independientes.
ε es el término de error.
Recolección y Preprocesamiento de Datos
Selección de variables independientes y dependiente.
Limpieza de datos (manejo de valores faltantes, estandarización).
Cálculo de Coeficientes
Se minimiza la suma de los errores cuadrados (método de mínimos cuadrados):
β=(XTX)−1XTY
Se pueden usar algoritmos como la Descomposición QR o Gradiente Descendente para optimizar los coeficientes.
Evaluación del Modelo
Medidas de ajuste como el coeficiente de determinación (R2).
Prueba de significancia de coeficientes con valores p.
Diagnóstico de residuos para detectar sesgos o errores sistemáticos.
Predicción y Aplicación del Modelo
Se utiliza el modelo entrenado para predecir nuevos valores de Y.
Modelado de Procesos Químicos
Predicción de conversión en reacciones químicas en función de temperatura, presión y concentración.
Optimización de Operaciones Unitarias
Modelado de eficiencia en intercambiadores de calor según el caudal y la temperatura de entrada.
Control de Calidad
Predicción de la calidad de productos basándose en parámetros del proceso de producción.
Diseño de Materiales
Relación entre propiedades físico-químicas y rendimiento de nuevos materiales.
Simulación de Procesos Industriales
Estimación del consumo energético en destilación, absorción y otros procesos.