MachineLearning

Curso del posgrado en Recursos hidráulicos de la Facultad de Minas, Universidad Nacional de Colombia, sede Medellín

View the Project on GitHub edieraristizabal/MachineLearning

Machine learning en geociencias

El curso Machine Learning está orientado para estudiantes de posgrados que deseen adquirir conocimientos sobre modelos multivariados, para establecer patrones y análisis de inferencia estadística y predicción de una variable dependiente a partir de variables independentes o predictoras, con herramientas de aprendizaje automático (Machine learning), minería de datos (Data Mining) y Big Data, bajo un ambiente de trabajo Python en Notebooks sobre Jupyter Lab.

El curso es teórico - práctico. Se dictarán clases teóricas con las técnicas y modelos a utilizar, pero exige que el estudiante seleccione una base de datos para poner en práctica el conocimiento adquirido en el curso. El contenido del curso incluye una introducción al ambiente de trabajo en Python, construcción de un modelo basado en datos, métodos no supervisados, métodos supevisados, y finalmente intro a Deep learning.

Programa del curso

Ir al programa…

Horario del curso

Martes & Jueves 10:00 - 12:00 a.m.

Contenido del curso

Ir a presentación…

Introducción al curso

Lecture: Landslides prediction from machine learning

Ambiente de trabajo

Formulación de hipótesis

Toma y procesamiento de datos

Análisis exploratorio de datos

Selección de variables

Selección de hiperparámetros

Selección del modelo

Modelos no supervisados

Modelos supervisados paramétricos

Modelos supervisados no paramétricos

Modelos ensamblados

Deep learning

Notebooks

Evaluación del curso

El curso se evaluará con un trabajo individual donde el estudiante debe presentar los avances parciales y un informe final en formato de articulo. La presentación 1 corresponde a la definición del problema a resolver y la base de datos a utilizar con un valor del 10% de la nota final. La presentación 2 corresponde a los resultados de la implementación de modelos no supervisados con un valor del 30%. La presentación 3 corresponde a los resultados de la implementación de modelos supervisados con un valor del 30%.

Finalmente, se deberá hacer entrega de un trabajo escrito en formato artículo, con los resultados finales, donde se seleccione el mejor modelo y optimicen los resultados en los modelos de validación con un valor del 30%. Para el formato del artículo se puede seleccionar cualquier revista técnica, donde especifican el formato, tal como: número máximo de hojas, tipo de letra, tamaño, entre otras. Se debe seguir el formato estricto de la revista, esto hace parte de la evaluación.

Para la entrega del trabajo se deberá crear un repositorio en Github, donde se deberá cargar tanto el trabajo escrito en pdf, como los codigos utilizados y las bases de datos. El link del repositorio deberá ser compartido en el chat del Google Classroom.

Material adicional