Regresión lineal vs logística
En el análisis estadístico, es importante identificar las relaciones entre las variables relacionadas con el estudio. A veces puede ser el único propósito del análisis en sí. Una herramienta sólida empleada para establecer la existencia de una relación e identificar la relación es el análisis de regresión.
La forma más simple de análisis de regresión es la regresión lineal, donde la relación entre las variables es una relación lineal. En términos estadísticos, resalta la relación entre la variable explicativa y la variable de respuesta. Por ejemplo, al usar la regresión podemos establecer la relación entre el precio del producto y el consumo en base a los datos recopilados de una muestra aleatoria. El análisis de regresión producirá una función de regresión del conjunto de datos, que es un modelo matemático que se ajusta mejor a los datos disponibles. Esto puede ser fácilmente representado por un diagrama de dispersión. Gráficamente, la regresión es equivalente a encontrar la mejor curva de ajuste para el conjunto de datos dado. La función de la curva es la función de regresión. Usando el modelo matemático se puede predecir el uso de un producto a un precio determinado.
Por lo tanto, el análisis de regresión se usa ampliamente para predecir y pronosticar. También se utiliza para establecer las relaciones en datos experimentales, en los campos de la física, la química y en muchas ciencias naturales y disciplinas de ingeniería. Si la relación o la función de regresión es una función lineal, entonces el proceso se conoce como regresión lineal. En el diagrama de dispersión, se puede representar como una línea recta. Si la función no es una combinación lineal de los parámetros, entonces la regresión no es lineal.
La regresión logística es comparable a la regresión multivariada, y crea un modelo para explicar el impacto de múltiples predictores en una variable de respuesta. Sin embargo, en la regresión logística, la variable de resultado final debe ser categórica (generalmente dividida; es decir, un par de resultados alcanzables, como la muerte o la supervivencia, aunque las técnicas especiales permiten modelar información más categorizada). Una variable de resultado continuo se puede transformar en una variable categórica, que se utilizará para la regresión logística; sin embargo, colapsar las variables continuas de esta manera se desaconseja en gran medida porque reduce la precisión.
A diferencia de la regresión lineal, hacia la media, las variables predictoras en la regresión logística no tienen que ser obligadas a estar conectadas linealmente, a ser distribuidas comúnmente oa tener una varianza igual dentro de cada grupo. Como resultado, la relación entre el predictor y las variables de resultado no es probable que sea una función lineal.
¿Cuál es la diferencia entre regresión logística y lineal??
• En la regresión lineal, se asume una relación lineal entre la variable explicativa y la variable de respuesta y se encuentran por análisis los parámetros que satisfacen el modelo, para proporcionar la relación exacta.
• Se realiza una regresión lineal para las variables cuantitativas, y la función resultante es una función cuantitativa..
• En la regresión logística, los datos utilizados pueden ser categóricos o cuantitativos, pero el resultado es siempre categórico.