Media vs Mediana vs Modo
La media, la mediana y el modo son los principales medidas de tendencia central utilizado en estadística descriptiva. Son completamente diferentes entre sí y los casos en que se utilizan para resumir los datos también son diferentes.
Media
La media aritmética es la suma de los valores de datos dividida por el número de valores de datos, es decir,.
Si los datos provienen de un espacio muestral, se denomina media muestral (), que es una estadística descriptiva de la muestra. Aunque es la medida descriptiva más utilizada para una muestra, no es una estadística sólida. Es muy sensible a los valores atípicos y las oscilaciones..
Por ejemplo, considere el ingreso promedio de los ciudadanos de una ciudad en particular. Dado que todos los valores de los datos se suman y luego se dividen, el ingreso de una persona extremadamente rica afecta significativamente la media. Por lo tanto, los valores medios no son una buena representación de los datos siempre.
Además, en el caso de una señal alterna, la corriente que pasa a través de un elemento varía periódicamente de la dirección positiva a la negativa y viceversa. Si tomamos la corriente promedio que pasa a través del elemento en un solo período, dará un 0, lo que significa que ninguna corriente ha pasado a través del elemento, lo que obviamente no es cierto. Por lo tanto, en este caso también, la media aritmética no es una buena medida.
La media aritmética es un buen indicador cuando los datos se distribuyen uniformemente. Para una distribución normal, la media es igual al modo y la mediana. También tiene los residuos más bajos al considerar el error cuadrático medio; por lo tanto, la mejor medida descriptiva cuando se requiere representar un conjunto de datos con un solo número.
Mediana
Los valores del punto de datos central después de organizar todos los valores de los datos en orden ascendente se definen como la mediana del conjunto de datos. La mediana es el segundo cuartil, el quinto decil y el percentil 50..
• Si el número de observaciones (puntos de datos) es impar, entonces la mediana es la observación exactamente en el medio de la lista ordenada.
• Si el número de observaciones (puntos de datos) es par, entonces la mediana es la media de las dos observaciones centrales en la lista ordenada.
La mediana divide la observación en dos grupos; es decir, un grupo (50%) de valores más altos y un grupo (50%) de valores más bajos que la mediana. Las medianas se utilizan específicamente en distribuciones sesgadas y representan datos bastante mejor que la media aritmética.
Modo
El modo es el número más frecuente en un conjunto de observaciones. El modo de un conjunto de datos se calcula al encontrar la frecuencia de cada elemento dentro del conjunto.
• Si no aparece ningún valor más de una vez, el conjunto de datos no tiene modo.
• De lo contrario, cualquier valor que ocurra con la mayor frecuencia es un modo del conjunto de datos.
Más de 1 modo puede existir en un conjunto; por lo tanto, el modo no es una estadística única de un conjunto de datos. En una distribución uniforme, hay un modo. El modo de una distribución de probabilidad discreta es el punto donde la función de masa de probabilidad alcanza su punto más alto. A partir de interpretaciones anteriores, podemos decir que máximos globales son modos.
Considere la aplicación de las tres medidas al siguiente conjunto de datos.
DATOS: 1, 1, 2, 3, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15 , 15
Media = (1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 10+ 14+ 16+ 15+ 15+ 15+ ) / 25 = 8.12
Mediana = 9 (elemento 13)
Modo = 9 (frecuencia de 9 = 5)
¿Cuál es la diferencia entre la media, la mediana y la moda??
• La media aritmética es la suma de los valores (observaciones) dividida por el número de observaciones. No es una estadística sólida y depende en gran medida de la naturaleza de distribución normal dentro de la distribución considerada. Un único valor atípico puede causar un cambio significativo en la media, lo que da valores relativamente engañosos. El concepto puede extenderse a la media geométrica, la media armónica, la media ponderada, etc..
• La mediana es el valor medio del conjunto de observaciones, y está relativamente menos afectado por los valores atípicos. Puede dar una buena estimación como la estadística de resumen en casos altamente sesgados.
• El modo es el valor de observación más común en el conjunto de datos. Si la distribución es sesgada positiva, el modo queda a la izquierda de la mediana y, si está sesgado negativamente, el modo corresponde a la mediana.
• Si está sesgado positivamente, la media es correcta para la mediana; Si la media está sesgada negativamente, está a la izquierda de la mediana..
• En la distribución normal, los tres, media, modo y mediana son iguales.