Diferencia entre covarianza y correlación

Covarianza vs. Correlación

La covarianza y la correlación son dos conceptos en el campo de probabilidad y estadística. Ambos conceptos describen la relación entre dos variables. Adicionalmente, ambas son herramientas de medición de un cierto tipo de dependencia entre variables..

"Covarianza" se define como "el valor esperado de las variaciones de dos variables aleatorias de sus valores esperados", mientras que "correlación" es "el valor esperado de dos variables aleatorias".
Para simplificar, una covarianza intenta observar y medir la cantidad de variables que cambian juntas. En este concepto, ambas variables pueden cambiar de la misma manera sin indicar ninguna relación. La covarianza es una medida de la fuerza o la debilidad de la correlación entre dos o más conjuntos de variables aleatorias, mientras que la correlación sirve como una versión escalada de una covarianza.

Tanto la covarianza como la correlación tienen tipos distintivos. La covarianza se puede clasificar como covarianza positiva (dos variables tienden a variar juntas) y covarianza negativa (una variable está por encima o por debajo del valor esperado en comparación con otra variable). Por otro lado, la correlación tiene tres categorías: positiva, negativa o cero. La correlación positiva se indica con un signo más, la correlación negativa con un signo negativo y las variables no correlacionadas, con un "0".

Tanto la covarianza como la correlación tienen rangos. Los valores de correlación están en la escala de -1 a +1. En términos de covarianza, los valores pueden exceder o pueden estar fuera del rango de correlación. Además, los valores de correlación dependen de las unidades de medida de "X" y "Y".
Otra diferencia notable es que una correlación es adimensional. En contraste, una covarianza se describe en unidades formadas multiplicando la unidad de una variable por otra unidad de otra variable. La covarianza se centra en la relación entre dos entidades, tales como variables o conjuntos de datos. En contraste, la correlación puede involucrar dos o más variables o conjuntos de datos y las relaciones entre ellas.

Otra distinción notable entre los dos es que una covarianza es a menudo unida a una varianza (una de sus propiedades, pero también la medida común de dispersión o dispersión), mientras que la correlación va de la mano con el análisis de dependencia y regresión. "Dependencia" se define como "cualquier relación entre dos conjuntos de datos o variables aleatorias", mientras que el análisis de regresión es el método utilizado para investigar la relación entre variables independientes y dependientes. Otras clasificaciones de correlación son correlaciones parciales y múltiples..

Resumen:

1. La solidaridad y la correlación son dos conceptos en el estudio de las estadísticas y la probabilidad. Son diferentes en sus definiciones pero estrechamente relacionadas. Ambos conceptos describen la relación y miden el tipo de dependencia entre dos o más variables.
2. La covarianza es el valor esperado de variación entre dos variables aleatorias de sus valores esperados, mientras que una correlación tiene casi la misma definición, pero no incluye la variación.
3. La covarianza también es una medida de dos variables aleatorias que varían juntas. Mientras tanto, la correlación se asocia con la interdependencia o asociación. En pocas palabras, la correlación es lo lejos o lo cerca que están dos variables de ser independientes entre sí..
4. La covarianza es una medida de una correlación, mientras que la correlación es una versión escalada de covarianza.
5. La covarianza puede involucrar la relación entre dos variables o conjuntos de datos, mientras que la correlación puede involucrar la relación entre múltiples variables también.
6. Los valores de correlación varían de positivo 1 a negativo 1. Por otro lado, los valores de covarianza pueden superar esta escala.
7. Tanto la correlación como la covarianza emplean una descripción positiva o negativa de sus tipos. La covarianza tiene dos tipos: covarianza positiva (donde dos variables varían juntas) y covarianza negativa (donde una variable es más alta o más baja que la otra). En términos de correlación, las correlaciones positiva y negativa están unidas por una categoría adicional, "0" - un tipo no correlacionado.