Curso

Predicción de variables hidrológicas y climatológicas:
Modelos basados en árboles de decisión con R

Johanna Orellana Alvear, MSc, Universidad de Cuenca
Instructora
12 al 16 de noviembre de 2018

Descripción

El uso de técnicas de machine learning se ha incrementado en diferentes líneas de investigación en el área de recursos naturales. La aplicación más importante radica en pronósticos de diferente índole (i.e., clasificación y regresión) sobre variables de interés hidrológico y climatológico. A pesar de ser técnicas novedosas y de resultados satisfactorios, su conocimiento y utilización son limitados a nivel local y regional.

Por esta razón, el Departamento de Recursos Hídricos y Ciencias Ambientales (iDRHiCA) de la Universidad de Cuenca oferta este curso de educación continua, con el objetivo de difundir el uso de técnicas de inteligencia artificial y proveer a los profesionales de herramientas para el desarrollo de modelos para pronóstico de variables hidrológicas y climatológicas basados en datos (data-driven models).

Una de las técnicas más sencillas y ampliamente utilizada son los Arboles de Decisión y extensiones de tipo ensamblador como Random Forest. Este curso surge con el propósito de proveer una introducción conceptual y  la oportunidad de efectuar aplicaciones ‘hands-on’ usando árboles de decisión en el lenguaje de programación R.

El curso introducirá los tipos de objetos básicos de R con particular énfasis en factores y data frames, así como la selección de subconjuntos de datos. Posteriormente se revisarán los conceptos de árboles de decisión, su construcción y evaluación. Finalmente se abordará el modelo random forest para clasificación, calibración, evaluación y análisis de importancia de features usando el software R en base a la librería Random Forest.

Perfil de ingreso

El curso está dirigido a investigadores en áreas de ingeniería, recursos naturales, recursos hídricos, ciencias forestales entre otras.

Contenido

 A. Básicos de R (5.5 horas)

  • Entorno de Rstudio
  • Asignación de Variables
  • Vectores y Matrices
  • Factores – variables categoricas
  • Data Frames y listas
  • Subconjuntos de datos

B. Arboles de decisión (11 horas)

  • Introducción a árboles de clasificación
  • Ventajas de métodos basados en arboles
  • Predicción con  árboles de decision
  • Proceso de modelacioón
  • División de datos: Train-test
  • Entrenamiento y evaluacion modelo de árbol de clasificación
  • Matriz de confusión

C. Random Forest (11 horas)

  • Introducción a Random Forest
  • Entrenamiento de un modelo de Random Forest
  • Evaluación de out-of-bag error
  • Evaluación del rendimiento del modelo Random forest
  • Calibración de hyper-parmetros en un modelo Random Forest
  • Importancia de features

D. Trabajo autónomo con tutoría virtual (12.5 horas)

Detalles del curso

Fechas clave 22 Octubre: Apertura de inscripciones

05 Noviembre: Cierre de inscripciones

12 al 16 de noviembre de 2018: Desarrollo del curso

28 Noviembre: Entrega de trabajo final

Horario 8:00 a 13:30 pm
Carga horaria Total: 40 horas.

27.5 Presenciales y 12.5 de trabajo autónomo

Lugar de instrucción Aula Virtual del Campus Balzay, Universidad de Cuenca
Cupo 25 personas
Perfil del participante El curso está dirigido a investigadores o estudiantes de últimos años en áreas de ingeniería, recursos naturales, recursos hídricos, ciencias forestales, entre otras.
Requisitos El curso de Hidroinformática Aplicada ofertado en iDRHiCA es habilitante para este curso.

Para quienes no tengan experiencia previa en R se recomienda la preparación anticipada con recursos introductorios sobre R. Considere, por ejemplo, los cursos disponibles en DataCamp y Coursera. La sección A del contenido cubrirá comandos básicos de R brevemente.

Se debe traer computadora personal con R y RStudio instalados.

Instructora Johanna Orellana Alvear

MSc en Inteligencia Artificial, KU Leuven

Actualmente es investigadora doctoral en el Laboratory for Climatology and Remote Sensing de la Philipps Universität Marburg, Alemania , e iDRHiCA.

 

Costo Profesionales: US$ 150

Personal y estudiantes de la Universidad de Cuenca: US$ 70

Costo incluye Inscripción

Material didáctico

Refrigerio en el receso

Certificado de asistencia o de aprobación. Los estudiantes que aprueben satisfactoriamente el trabajo final de curso recibirán un certificado de “Aprobación”, caso contrario el certificado será de “Asistencia”.

*Para mayor información puede contactarse al correo electrónico: info_drh@ucuenca.edu.ec

No se admiten más comentarios