Rating 4.12 out of 5 (4 ratings in Udemy)
What you'll learn- Determinar la diferencia de Random Forest por clasificación y regresión
- Conocer cómo RANDOM FOREST mejora a los árboles de decisión
- Identificar en qué consiste el Bagging o el Bootstrap
- Determinar qué refiere el termino random en Bosques aleatorios
- Conocer cómo funciona el algoritmo Random Forest
- Identificar cómo se construye el modelo RANDOM FOREST
- Analizar qué significa OOB error y lo hiper- parámetros
- Determinar como esta …
Rating 4.12 out of 5 (4 ratings in Udemy)
What you'll learn- Determinar la diferencia de Random Forest por clasificación y regresión
- Conocer cómo RANDOM FOREST mejora a los árboles de decisión
- Identificar en qué consiste el Bagging o el Bootstrap
- Determinar qué refiere el termino random en Bosques aleatorios
- Conocer cómo funciona el algoritmo Random Forest
- Identificar cómo se construye el modelo RANDOM FOREST
- Analizar qué significa OOB error y lo hiper- parámetros
- Determinar como esta formada la estructura interna de los modelos
- Analizar el set de datos para clasificación (Iris) y regresión (Boston)
- Modelar en R a través de la librería Iris para clasificación
- Modela en R a través de la librería MASS datos de Boston
DescriptionLa demanda que conlleva las investigaciones científicas sobre aplicar diferentes tipos de modelación estadística, misma que nos ayudan a mejorar el rendimiento de los modelos aplicados a nuestros datos. Nos vemos interesados en mejorar nuestros conocimientos respecto a programación en software de vanguardia como lo es el paquete estadístico libre R. La herramienta Clasificación y regresión basadas en bosque entrena un modelo con unos valores conocidos proporcionados como parte de un dataset de entrenamiento. Este modelo de predicción puede utilizarse después para predecir valores desconocidos en un dataset de predicción que tenga asociadas las mismas variables explicativas. La herramienta crea modelos y genera predicciones mediante una adaptación del algoritmo de bosque aleatorio de Leo Breiman, que es un método de aprendizaje de máquina supervisado. La herramienta crea muchos árboles de decisión, denominados conjunto o bosque, que se utilizan en la predicción. Cada árbol genera su propia predicción y se utiliza como parte de un esquema de votación para hacer predicciones finales. Las predicciones finales no se basan en un solo árbol, sino en todo el bosque. El uso de un bosque completo en vez de un árbol individual le ayuda a evitar el exceso de ajuste en el modelo respecto al dataset de entrenamiento, como hace el uso de un subconjunto aleatorio de datos de entrenamiento y un subconjunto aleatorio de variables explicativas en cada árbol que compone el bosque.