Opleiding : Python Data Science, gegevens manipuleren en visualiseren

optionele TOSA®-certificering

Python Data Science, gegevens manipuleren en visualiseren

optionele TOSA®-certificering



Data science is een steeds groter wordend multidisciplinair veld. Het is gebaseerd op wetenschappelijke methoden, algoritmen en processen die Python beheerst dankzij een bijzonder rijk ecosysteem. Het is nu de referentietaal geworden voor gegevensanalyse, ongeacht het formaat. Onze training stelt u in staat om de tools, bibliotheken en modules van Python onder de knie te krijgen, zodat u snel vaardigheden op het gebied van data science kunt opdoen met deze taal.


INTER
INTRA
OP MAAT

Praktijkcursus ter plaatse of via klasverband op afstand

Ref. IYT
  4d - 28u00
Prijs : Neem contact met ons op




Data science is een steeds groter wordend multidisciplinair veld. Het is gebaseerd op wetenschappelijke methoden, algoritmen en processen die Python beheerst dankzij een bijzonder rijk ecosysteem. Het is nu de referentietaal geworden voor gegevensanalyse, ongeacht het formaat. Onze training stelt u in staat om de tools, bibliotheken en modules van Python onder de knie te krijgen, zodat u snel vaardigheden op het gebied van data science kunt opdoen met deze taal.


Pedagogische doelstellingen
Aan het einde van de training is de deelnemer in staat om:
Een overzicht hebben van het wetenschappelijke ecosysteem van Python
Leer meer over de essentiële wetenschappelijke bibliotheken voor datawetenschap
Grote datasets kunnen manipuleren met Python
De voordelen van datavisualisatie begrijpen
Gegevens visualiseren met Python

Doelgroep
Engineers, ontwikkelaars, onderzoekers, datawetenschappers, data-analisten en iedereen die de wetenschappelijke wereld van Python wil leren kennen.

Voorafgaande vereisten
Praktijk van de Python-taal.

Praktische modaliteiten
Praktisch werk
Er worden talloze oefeningen gebruikt om de onderwerpen te illustreren.
Leer methodes
De trainer geeft actief les, feedback en demonstraties, zodat de deelnemers ze sneller in de praktijk kunnen toepassen.

Opleidingsprogramma

1
Presentatie van het wetenschappelijke Python-ecosysteem

  • Overzicht van het wetenschappelijke ecosysteem van Python: de essentiële bibliotheken.
  • Weet waar u nieuwe boekwinkels kunt vinden en beoordeel hun duurzaamheid.
  • De belangrijkste open source tools en software voor data science.
  • Waarom wetenschappelijke distributie gebruiken, Anaconda.
  • De voordelen van een virtuele omgeving begrijpen en weten hoe deze te gebruiken.
  • De IPython-interpreter en de Jupyter-server.
  • Best practices voor een goede start van uw data science project met Python.
  • Wetenschappelijke bestandsformaten en bibliotheken om ze te manipuleren.
Praktisch werk
De ontwikkelomgeving opzetten: Anaconda installeren, een virtuele omgeving maken, een omgeving exporteren en dupliceren, Jupyter-notebooks gebruiken.

2
De SciPy-stapel

  • De basis van essentiële wetenschappelijke bibliotheken waarop alle andere zijn gebaseerd: de SciPy Stack.
  • NumPy: numerieke berekening en lineaire algebra (vectoren, matrices, afbeeldingen).
  • SciPy, gebaseerd op NumPy voor statistiek, functionele analyse, geospatiale analyse, signaalverwerking, enz.
  • Pandas: analyse van gegevens in tabelvorm (CSV, Excel, enz.), statistieken, pivots, filters, zoekopdrachten, enz.
  • Matplotlib: de essentiële bibliotheek voor gegevensvisualisatie.
Praktisch werk
Meet de prestaties van de NumPy die door uw Linux is geïnstalleerd en die van Anaconda. Beeldverwerking met NumPy. Eerste plots. Statistische analyse van CSV-bestanden. Eerste mapping elementen. Fouriertransformaties.

3
Bibliotheken weergeven

  • Overzicht van Python visualisatiebibliotheken: 2D/3D, desktop/web, statistiek, cartografie, big data, enz.
  • Desktop-georiënteerde bibliotheken: Matplotlib, Pandas, Seaborn.
  • Webgeoriënteerde bibliotheken: Bokeh, Altair, Plotly, enz.
  • 3D-bibliotheken: Plotly, pythreejs, ipyvolume, enz.
  • Kaartbibliotheken: Cartopy, folium, ipyleaflet, Bokeh, cesiumpy, enz.
  • Big data bibliotheken: datashader, Vaex...
Praktisch werk
Een reeks oefeningen met een aantal van de gepresenteerde bibliotheken. Big data, cartografische, 2D- en 3D-visualisatie.

4
Datavisualisatie

  • De voordelen van datavisualisatie
  • PyViz en het HoloViz ecosysteem gebruiken.
  • Presentatie van de tools SuperSet, Mayavi, Paraview en VisIt.
Praktisch werk
Visualisatiebibliotheken blijven gebruiken en tools blijven manipuleren.

5
Wetenschappelijke bestandsformaten en de verwerking van omvangrijke gegevens

  • Overzicht van de belangrijkste wetenschappelijke bestandsformaten: NetCDF, HDF5, GRIB, JSON, PARQUET, MATLAB, CGNS, enz.
  • Omgaan met grote gegevens met Dask, Vaex en Xarray.
Praktisch werk
Omgaan met gegevens van meer dan GB, lezen en schrijven van NetCDF/HDF5-bestanden. Visualisatie van klimaatgegevens, satellietbeelden, maken van video's/grafische animaties.


Data en plaats
Selecteer uw locatie of kies voor de les op afstand en kies vervolgens uw datum.
Klas op afstand