Formación : Python Data Science, manipulación y visualización de datos

Certificación TOSA® opcional

Python Data Science, manipulación y visualización de datos

Certificación TOSA® opcional

La ciencia de datos es un campo multidisciplinar en constante expansión. Se basa en métodos, algoritmos y procesos científicos que Python domina gracias a un ecosistema especialmente rico. Se ha convertido en el lenguaje de referencia para el análisis de datos, sea cual sea su formato. Nuestra formación le permitirá familiarizarse con las herramientas, las bibliotecas y los módulos de Python para adquirir rápidamente competencias en ciencia de datos con este lenguaje.

ABIERTA

IN-COMPANY

A MEDIDA

Formación en tus instalaciones, en nuestro centro o a distancia

Ref. IYT

4d - 28h00

Duración, formato, fechas y lugar: ¡Tú decides, nosotros nos encargamos de organizarlo!

Descargar en formato pdf

Compartir este curso por correo electrónico

OBJETIVOS
PROGRAMA
FECHAS

Objetivos pedagógicos

Una vez finalizada la formación, el participante podrá:

	Tener una visión general del ecosistema científico de Python
	Conozca las bibliotecas científicas esenciales para la ciencia de datos
	Ser capaz de manipular grandes conjuntos de datos con Python
	Comprender las ventajas de la visualización de datos
	Visualización de datos con Python

Público afectado

Ingenieros, desarrolladores, investigadores, científicos de datos, analistas de datos y cualquier persona que desee conocer el mundo científico de Python.

Requisitos previos

Práctica del lenguaje Python.

Modalidades prácticas

Trabajo práctico

Los temas se ilustran con numerosos ejercicios.

Métodos pedagógicos

El formador proporciona enseñanza activa, retroalimentación y demostraciones para que los participantes puedan ponerlas en práctica más rápidamente.

Programa de la formación

1
Presentación del ecosistema científico Python

Visión general del ecosistema científico de Python: las bibliotecas esenciales.
Saber dónde encontrar nuevas librerías y evaluar su sostenibilidad.
Las principales herramientas y software de código abierto para la ciencia de datos.
Por qué usar la distribución científica, Anaconda.
Comprender las ventajas de un entorno virtual y saber cómo utilizarlo.
El intérprete IPython y el servidor Jupyter.
Prácticas recomendadas para empezar con buen pie un proyecto de ciencia de datos con Python.
Formatos de archivos científicos y bibliotecas para manipularlos.

Trabajo práctico

Configuración del entorno de desarrollo: instalación de Anaconda, creación de un entorno virtual, exportación y duplicación de un entorno, uso de cuadernos Jupyter.

2
La pila SciPy

La base de las bibliotecas científicas esenciales en las que se basan todas las demás: la pila SciPy.
NumPy: cálculo numérico y álgebra lineal (vectores, matrices, imágenes).
SciPy, basado en NumPy para estadística, análisis funcional, análisis geoespacial, procesamiento de señales, etc.
Pandas: análisis de datos tabulares (CSV, Excel, etc.), estadísticas, pivotes, filtros, búsquedas, etc.
Matplotlib: la biblioteca esencial para la visualización de datos.

Trabajo práctico

Mida el rendimiento del NumPy instalado por su Linux y el de Anaconda. Procesamiento de imágenes con NumPy. Primeros gráficos. Análisis estadístico de ficheros CSV. Primeros elementos de mapeo. Transformadas de Fourier.

3
Mostrar bibliotecas

Visión general de las bibliotecas de visualización de Python: 2D/3D, escritorio/web, estadística, cartografía, big data, etc.
Bibliotecas orientadas al escritorio: Matplotlib, Pandas, Seaborn.
Bibliotecas orientadas a la web: Bokeh, Altair, Plotly...
Librerías 3D: Plotly, pythreejs, ipyvolume, etc.
Bibliotecas cartográficas: Cartopy, folium, ipyleaflet, Bokeh, cesiumpy, etc.
Bibliotecas de big data: datashader, Vaex...

Trabajo práctico

Una serie de ejercicios utilizando algunas de las bibliotecas presentadas. Big data, visualización cartográfica, 2D y 3D.

4
Visualización de datos

Ventajas de la visualización de datos
Uso de PyViz y el ecosistema HoloViz.
Presentación de las herramientas SuperSet, Mayavi, Paraview y VisIt.

Trabajo práctico

Seguir utilizando bibliotecas de visualización y herramientas de manipulación.

5
Formatos de archivos científicos y tratamiento de datos voluminosos

Panorama de los principales formatos de archivos científicos: NetCDF, HDF5, GRIB, JSON, PARQUET, MATLAB, CGNS, etc.
Manejo de big data con Dask, Vaex y Xarray.

Trabajo práctico

Manejo de datos de más de GB, lectura y escritura de archivos NetCDF/HDF5. Visualización de datos climáticos, imágenes de satélite, creación de vídeos/animaciones gráficas.

Fechas y lugares

Selecciona tu ubicación u opta por la clase remota y luego elige tu fecha.

Clase a distancia

Dernières places

Date garantie en présentiel ou à distance

Session garantie

Formación : Python Data Science, manipulación y visualización de datos

Python Data Science, manipulación y visualización de datos

1 Presentación del ecosistema científico Python

2 La pila SciPy

3 Mostrar bibliotecas

4 Visualización de datos

5 Formatos de archivos científicos y tratamiento de datos voluminosos

1
Presentación del ecosistema científico Python

2
La pila SciPy

3
Mostrar bibliotecas

4
Visualización de datos

5
Formatos de archivos científicos y tratamiento de datos voluminosos