Minería de datos vs almacenamiento de datos
La minería de datos y el almacenamiento de datos son técnicas muy poderosas y populares para analizar datos. Los usuarios que se inclinan por las estadísticas utilizan Data Mining. Utilizan modelos estadísticos para buscar patrones ocultos en los datos. Los mineros de datos están interesados en encontrar relaciones útiles entre diferentes elementos de datos, lo que en última instancia es rentable para las empresas. Pero, por otro lado, los expertos en datos que pueden analizar las dimensiones de la empresa directamente tienden a utilizar los almacenes de datos..
La minería de datos también se conoce como Knowledge Discovery in data (KDD). Como se mencionó anteriormente, es un campo de la informática, que se ocupa de la extracción de información previamente desconocida e interesante a partir de datos sin procesar. Debido al crecimiento exponencial de los datos, especialmente en áreas como negocios, la minería de datos se ha convertido en una herramienta muy importante para convertir esta gran cantidad de datos en inteligencia empresarial, ya que la extracción manual de patrones se ha vuelto aparentemente imposible en las últimas décadas. Por ejemplo, actualmente se utiliza para varias aplicaciones, como el análisis de redes sociales, la detección de fraudes y el marketing. La minería de datos generalmente se ocupa de las siguientes cuatro tareas: agrupación, clasificación, regresión y asociación. La agrupación es identificar grupos similares a partir de datos no estructurados. La clasificación son reglas de aprendizaje que pueden aplicarse a nuevos datos y que normalmente incluirán los siguientes pasos: preprocesamiento de datos, diseño de modelos, aprendizaje / selección de funciones y evaluación / validación. La regresión es encontrar funciones con un error mínimo para modelar datos. Y la asociación está buscando relaciones entre variables. La minería de datos generalmente se usa para responder preguntas como cuáles son los principales productos que podrían ayudar a obtener altas ganancias el año próximo en Wal-Mart.?
Como se mencionó anteriormente, el almacenamiento de datos también se usa para analizar datos, pero para diferentes conjuntos de usuarios y con un objetivo ligeramente diferente en mente. Por ejemplo, cuando se trata del sector minorista, los usuarios de almacenamiento de datos están más preocupados por qué tipos de compras son populares entre los clientes, por lo que los resultados del análisis pueden ayudar al cliente a mejorar la experiencia del cliente. Pero los mineros de datos primero conjeturan una hipótesis como la que los clientes compran un determinado tipo de producto y analizan los datos para probar la hipótesis. El almacenamiento de datos podría ser realizado por un importante minorista que inicialmente almacena sus tiendas con los mismos tamaños de productos para luego descubrir que las tiendas de Nueva York venden inventarios de menor tamaño mucho más rápido que en las tiendas de Chicago. Entonces, al observar este resultado, el minorista puede abastecer la tienda de Nueva York con tamaños más pequeños en comparación con las tiendas de Chicago..
Entonces, como puede ver claramente, estos dos tipos de análisis parecen ser de la misma naturaleza a simple vista. Ambos se preocupan por el aumento de las ganancias basadas en los datos históricos. Pero por supuesto, hay diferencias clave. En términos simples, la minería de datos y el almacenamiento de datos se dedican a proporcionar diferentes tipos de análisis, pero definitivamente para diferentes tipos de usuarios. En otras palabras, Data Mining busca correlaciones, patrones para apoyar una hipótesis estadística. Pero, Data Warehousing responde a una pregunta comparativamente más amplia y corta y corta datos a partir de ahí para reconocer formas de mejora en el futuro..