Formación : Análisis de datos con Python

Análisis de datos con Python

Descargar en formato pdf Compartir este curso por correo electrónico 2


Data Analytics es un término utilizado para expresar el proceso de análisis de datos con el fin de tomar decisiones. El lenguaje Python ofrece un ecosistema para el tratamiento estadístico, desde la construcción de modelos de análisis hasta su evaluación y representación.


Abierta
In-company
A medida

Curso práctico presencial o en clase a distancia

Ref. BDA
Precio : 2040 € I.E.
  4d - 28h00




Data Analytics es un término utilizado para expresar el proceso de análisis de datos con el fin de tomar decisiones. El lenguaje Python ofrece un ecosistema para el tratamiento estadístico, desde la construcción de modelos de análisis hasta su evaluación y representación.

Objetivos pedagógicos
Una vez finalizada la formación, el participante podrá:
  • Comprender el principio de la modelización estadística
  • Elegir entre regresión y clasificación en función del tipo de datos
  • Evaluación del rendimiento predictivo de un algoritmo
  • Crear selecciones y clasificaciones a partir de grandes volúmenes de datos para identificar tendencias

Público afectado
Gestores de centros de datos (minería de datos, marketing, calidad, etc.), usuarios de bases de datos y gestores empresariales.

Requisitos previos
Conocimientos básicos de Python. Conocimientos básicos de estadística o realización del curso "Estadística, dominando los fundamentos" (Ref. STA).

Programa de la formación

Introducción a la modelización

  • Introducción al lenguaje Python.
  • Introducción al software Jupiter Notebook.
  • Las etapas de la construcción de un modelo.
  • Algoritmos supervisados y no supervisados.
  • La elección entre regresión y clasificación.
Trabajo práctico
Instalación de Python 3, Anaconda y Jupiter Notebook.

Procedimientos de evaluación de modelos

  • Técnicas de remuestreo en juegos de entrenamiento, validación y prueba.
  • Comprobación de la representatividad de los datos de formación.
  • Medición del rendimiento de los modelos predictivos.
  • Matriz de confusión y de costes, curvas ROC y AUC.
Trabajo práctico
Establecer el muestreo de conjuntos de datos. Realizar pruebas de evaluación de varios modelos suministrados.

Algoritmos supervisados

  • El principio de la regresión lineal univariante.
  • Regresión multivariante.
  • Regresión polinómica.
  • Regresión regularizada.
  • El Bayes ingenuo.
  • Regresión logística.
Trabajo práctico
Aplicación de regresiones y clasificaciones en varios tipos de datos.

Algoritmos no supervisados

  • Agrupación jerárquica.
  • Agrupación no jerárquica.
  • Enfoques mixtos.
Trabajo práctico
Procesamiento no supervisado de agrupaciones en varios conjuntos de datos.

Análisis de componentes

  • Análisis de componentes principales.
  • Análisis factorial por correspondencia.
  • Análisis de correspondencias múltiples.
  • Análisis factorial para datos mixtos.
  • Clasificación jerárquica basada en componentes principales.
Trabajo práctico
Aplicación de la reducción del número de variables e identificación de los factores subyacentes a las dimensiones asociadas a una variabilidad significativa.

Análisis de datos de texto

  • Recogida y tratamiento previo de datos textuales.
  • Extracción de entidades primarias, entidades con nombre y resolución referencial.
  • Etiquetado gramatical, análisis sintáctico, análisis semántico.
  • Lematización.
  • Representación vectorial de textos.
  • Ponderación TF-IDF.
  • Word2Vec.
Trabajo práctico
Explore el contenido de una base de datos de texto mediante el análisis semántico latente.


Modalidades prácticas
Trabajo práctico
Desarrollo/creación de análisis utilizando software Python, con los módulos pandas, NumPy, SciPy, MatPlotLib, seaborn, scikit-learn y statsmodels.

Fechas y lugares
Selecciona tu ubicación u opta por la clase remota y luego elige tu fecha.
Clase a distancia