Diferencia entre varianza muestral y varianza poblacional

Explicación

En Estadísticas, el término muestreo se refiere a la selección de una parte de los datos estadísticos agregados con el fin de obtener información relevante sobre el conjunto. El conjunto o la totalidad de información estadística sobre un carácter particular de todos los miembros cubiertos por la investigación se denomina "población" o "universo". (Das, N.G., 2010). La parte seleccionada de la población que se utiliza para obtener las características de la población o el universo se denomina "muestra". Se considera que la población está formada por unidades o miembros individuales, y algunas de las unidades se incluyen en la muestra. El número total de unidades de la población se llama tamaño de la población y el de la muestra se llama tamaño de la muestra. La población y la muestra pueden ser finitas o infinitas y, de manera similar, pueden ser existentes o hipotéticas.

Diferencia: La varianza es un valor numérico que muestra cuán ampliamente las cifras individuales en un conjunto de datos se distribuyen sobre la media. Eso es lo lejos que está cada número de la media y, por lo tanto, de cada uno. Una varianza de valor cero significa que todos los datos son idénticos. Más la varianza, más son los valores dispersos sobre la media, por lo tanto, de unos a otros. Menos la varianza, menos los valores repartidos sobre la media, por lo tanto, entre sí, y la varianza no puede ser negativa.

Diferencia entre varianza poblacional y varianza muestral.

La principal diferencia entre la varianza de la población y la varianza de la muestra se relaciona con el cálculo de la varianza. La varianza se calcula en cinco pasos. Se calcula la primera media, luego se calculan las desviaciones de la media y, en tercer lugar, las desviaciones son cuadradas, en cuarto lugar se resumen las desviaciones cuadradas y, finalmente, esta suma se divide por el número de elementos para los cuales se calcula la varianza. Por lo tanto, la varianza = Σ (xi-x -) / n. Donde xi = ith. Número, x- = media y n = número de elementos ...

Ahora, cuando la variación se debe calcular a partir de los datos de población, n es igual al número de elementos. Por lo tanto, si la variación en la presión arterial de todas las 1000 personas se debe calcular a partir de los datos sobre la presión arterial de todas las 1000 personas, entonces n = 1000. Sin embargo, cuando la variación se calcula a partir de los datos de muestra 1, se deducirá de n antes de dividir Suma de las desviaciones al cuadrado. Por lo tanto, en el ejemplo anterior, si los datos de muestra tienen 100 elementos, el denominador sería 100 - 1 = 99.

Debido a esto, el valor de la varianza calculado a partir de los datos de la muestra es más alto que el valor que podría haberse encontrado utilizando los datos de la población. La lógica de hacerlo es compensar nuestra falta de información sobre los datos de población. Es imposible encontrar una variedad de alturas en los seres humanos, debido a nuestra absoluta falta de información sobre las alturas de todos los seres humanos vivos, por no hablar del futuro. Incluso si tomamos un ejemplo moderado, como los datos de población en las alturas de todos los hombres vivos en los EE. UU., Es físicamente posible, pero el costo y el tiempo involucrados en esto anularían el propósito de su cálculo. Esta es la razón por la que los datos de muestra se toman para la mayoría de los fines estadísticos, y esto se acompaña de la falta de información sobre la mayoría de los datos. Para compensar esto, el valor de la varianza y la desviación estándar, que es la raíz cuadrada de la varianza, es mayor en el caso de los datos de muestra que la varianza de los datos de la población..

Esto actúa como un escudo automático para los analistas y tomadores de decisiones. La lógica se aplica a las decisiones sobre presupuestos de capital, finanzas personales y comerciales, construcción, gestión de tráfico y muchos campos aplicables. Esto ayuda al tenedor de apuestas a estar seguro mientras toma la decisión o para otras inferencias..

Resumen: La varianza de la población se refiere al valor de la varianza que se calcula a partir de los datos de la población, y la varianza de la muestra es la varianza calculada a partir de los datos de la muestra. Debido a este valor de denominador en la fórmula para la varianza en el caso de los datos de muestra es 'n-1', y es 'n' para los datos de población. Como resultado, tanto la varianza como la desviación estándar derivadas de los datos de la muestra son más que las encontradas en los datos de la población.