1
Presentatie van het wetenschappelijke Python-ecosysteem
- Overzicht van het wetenschappelijke ecosysteem van Python: de essentiële bibliotheken.
- Weet waar u nieuwe boekwinkels kunt vinden en beoordeel hun duurzaamheid.
- De belangrijkste open source tools en software voor data science.
- Waarom wetenschappelijke distributie gebruiken, Anaconda.
- De voordelen van een virtuele omgeving begrijpen en weten hoe deze te gebruiken.
- De IPython-interpreter en de Jupyter-server.
- Best practices voor een goede start van uw data science project met Python.
- Wetenschappelijke bestandsformaten en bibliotheken om ze te manipuleren.
Praktisch werk
De ontwikkelomgeving opzetten: Anaconda installeren, een virtuele omgeving maken, een omgeving exporteren en dupliceren, Jupyter-notebooks gebruiken.
2
De SciPy-stapel
- De basis van essentiële wetenschappelijke bibliotheken waarop alle andere zijn gebaseerd: de SciPy Stack.
- NumPy: numerieke berekening en lineaire algebra (vectoren, matrices, afbeeldingen).
- SciPy, gebaseerd op NumPy voor statistiek, functionele analyse, geospatiale analyse, signaalverwerking, enz.
- Pandas: analyse van gegevens in tabelvorm (CSV, Excel, enz.), statistieken, pivots, filters, zoekopdrachten, enz.
- Matplotlib: de essentiële bibliotheek voor gegevensvisualisatie.
Praktisch werk
Meet de prestaties van de NumPy die door uw Linux is geïnstalleerd en die van Anaconda. Beeldverwerking met NumPy. Eerste plots. Statistische analyse van CSV-bestanden. Eerste mapping elementen. Fouriertransformaties.
3
Bibliotheken weergeven
- Overzicht van Python visualisatiebibliotheken: 2D/3D, desktop/web, statistiek, cartografie, big data, enz.
- Desktop-georiënteerde bibliotheken: Matplotlib, Pandas, Seaborn.
- Webgeoriënteerde bibliotheken: Bokeh, Altair, Plotly, enz.
- 3D-bibliotheken: Plotly, pythreejs, ipyvolume, enz.
- Kaartbibliotheken: Cartopy, folium, ipyleaflet, Bokeh, cesiumpy, enz.
- Big data bibliotheken: datashader, Vaex...
Praktisch werk
Een reeks oefeningen met een aantal van de gepresenteerde bibliotheken. Big data, cartografische, 2D- en 3D-visualisatie.
4
Datavisualisatie
- De voordelen van datavisualisatie
- PyViz en het HoloViz ecosysteem gebruiken.
- Presentatie van de tools SuperSet, Mayavi, Paraview en VisIt.
Praktisch werk
Visualisatiebibliotheken blijven gebruiken en tools blijven manipuleren.
5
Wetenschappelijke bestandsformaten en de verwerking van omvangrijke gegevens
- Overzicht van de belangrijkste wetenschappelijke bestandsformaten: NetCDF, HDF5, GRIB, JSON, PARQUET, MATLAB, CGNS, enz.
- Omgaan met grote gegevens met Dask, Vaex en Xarray.
Praktisch werk
Omgaan met gegevens van meer dan GB, lezen en schrijven van NetCDF/HDF5-bestanden. Visualisatie van klimaatgegevens, satellietbeelden, maken van video's/grafische animaties.