Introducción a la modelización
- Introducción al lenguaje Python.
- Introducción al software Jupiter Notebook.
- Las etapas de la construcción de un modelo.
- Algoritmos supervisados y no supervisados.
- La elección entre regresión y clasificación.
Trabajo práctico
Instalación de Python 3, Anaconda y Jupiter Notebook.
Procedimientos de evaluación de modelos
- Técnicas de remuestreo en juegos de entrenamiento, validación y prueba.
- Comprobación de la representatividad de los datos de formación.
- Medición del rendimiento de los modelos predictivos.
- Matriz de confusión y de costes, curvas ROC y AUC.
Trabajo práctico
Establecer el muestreo de conjuntos de datos. Realizar pruebas de evaluación de varios modelos suministrados.
Algoritmos supervisados
- El principio de la regresión lineal univariante.
- Regresión multivariante.
- Regresión polinómica.
- Regresión regularizada.
- El Bayes ingenuo.
- Regresión logística.
Trabajo práctico
Aplicación de regresiones y clasificaciones en varios tipos de datos.
Algoritmos no supervisados
- Agrupación jerárquica.
- Agrupación no jerárquica.
- Enfoques mixtos.
Trabajo práctico
Procesamiento no supervisado de agrupaciones en varios conjuntos de datos.
Análisis de componentes
- Análisis de componentes principales.
- Análisis factorial por correspondencia.
- Análisis de correspondencias múltiples.
- Análisis factorial para datos mixtos.
- Clasificación jerárquica basada en componentes principales.
Trabajo práctico
Aplicación de la reducción del número de variables e identificación de los factores subyacentes a las dimensiones asociadas a una variabilidad significativa.
Análisis de datos de texto
- Recogida y tratamiento previo de datos textuales.
- Extracción de entidades primarias, entidades con nombre y resolución referencial.
- Etiquetado gramatical, análisis sintáctico, análisis semántico.
- Lematización.
- Representación vectorial de textos.
- Ponderación TF-IDF.
- Word2Vec.
Trabajo práctico
Explore el contenido de una base de datos de texto mediante el análisis semántico latente.