los diferencia clave Entre la clasificación y el árbol de regresión es que en la clasificación, las variables dependientes son categóricas y no ordenadas, mientras que en la regresión las variables dependientes son continuas u ordenadas valores completos.
La clasificación y la regresión son técnicas de aprendizaje para crear modelos de predicción a partir de los datos recopilados. Ambas técnicas se presentan gráficamente como árboles de clasificación y regresión, o más bien diagramas de flujo con divisiones de datos después de cada paso, o más bien, "ramificación" en el árbol. Este proceso se llama partición recursiva. Campos como la minería utiliza estas técnicas de aprendizaje de regresión y clasificación. Este artículo se centra en el árbol de clasificación y regresión..
1. Resumen y diferencia clave
2. Que es clasificacion
3. ¿Qué es la regresión?
4. Comparación lado a lado - Clasificación frente a regresión en forma tabular
5. Resumen
La clasificación es una técnica utilizada para llegar a un esquema que muestra la organización de los datos a partir de una variable precursora. Las variables dependientes son las que clasifican los datos..
Figura 01: Minería de datos
El árbol de clasificación comienza con la variable independiente, que se divide en dos grupos según lo determinado por las variables dependientes existentes. Tiene el propósito de dilucidar las respuestas en forma de categorización provocada por las variables dependientes..
La regresión es un método de predicción que se basa en un valor de salida numérico supuesto o conocido. Este valor de salida es el resultado de una serie de particiones recursivas, con cada paso que tiene un valor numérico y otro grupo de variables dependientes que se ramifican a otro par como este.
El árbol de regresión comienza con una o más variables precursoras y termina con una variable de salida final. Las variables dependientes son variables numéricas continuas o discretas..
Clasificación vs Regresión | |
Un modelo de árbol donde la variable de destino puede tomar un conjunto discreto de valores. | Un modelo de árbol donde la variable de destino puede tomar valores continuos, típicamente números reales. |
Variable dependiente | |
Para el árbol de clasificación, las variables dependientes son categóricas.. | Para el árbol de regresión, las variables dependientes son numéricas.. |
Valores | |
Tiene una cantidad fija de valores no ordenados. | Tiene valores discretos pero ordenados o valores indiscretos. |
Propósito de la construcción | |
El propósito de construir el árbol de regresión es ajustar un sistema de regresión a cada rama determinante de manera que el valor de salida esperado aparezca. | Un árbol de clasificación se ramifica según lo determinado por una variable dependiente derivada del nodo anterior. |
Los árboles de regresión y clasificación son técnicas útiles para mapear el proceso que apunta a un resultado estudiado, ya sea en clasificación o en un solo valor numérico. La diferencia entre el árbol de clasificación y el árbol de regresión es su variable dependiente. Los árboles de clasificación tienen variables dependientes que son categóricas y no ordenadas. Los árboles de regresión tienen variables dependientes que son valores continuos o valores enteros ordenados.
1. "El aprendizaje del árbol de decisión". Wikipedia, Fundación Wikimedia, 13 de mayo de 2018.. Disponible aquí
1.'Data Mining'By Arbeck - Trabajo propio, (CC BY 3.0) vI a Commons Wikimedia