1
Wat is datawetenschap?
- De basis: big data, data lake, datamining, kunstmatige intelligentie, machine- en deep learning, tekst mining.
- De nieuwe uitdagingen: de opkomst en vermenigvuldiging van nieuwe gegevensbronnen.
- Er moet rekening worden gehouden met heterogeniteit van gegevens, real-time stromen en explosie van gegevensvolumes.
- Het technologische ecosysteem van Big Data.
- De wereld van data science ontsluieren: beschrijvende, voorspellende en prescriptieve analyse.
- De baan, tools en methoden van de datawetenschapper.
- Inleiding tot machinaal leren, analyse onder toezicht en analyse zonder toezicht.
- Noties van over- en onderleren.
Demonstratie
Use cases voor data science in een zakelijke waardeketen (klantgedrag, productaanbod, enz.).
2
Methoden en modellen voor gegevenswetenschap
- Verzamelen, voorbereiden en onderzoeken van gegevens.
- Het belang van de aanpak van gegevenskwaliteit (opschonen, transformeren, verrijken).
- Definitie van metriek.
- Statistische basismethoden.
- De belangrijkste klassen van supervised algoritmes: beslisbomen, K-nearest neighbours, regressie, Naive Bayes.
- De belangrijkste klassen van algoritmen zonder toezicht: clustering, PCA, CAH, neurale netwerken.
- Text mining en andere families van algoritmen.
Workshop storytelling
Eenvoudige analyses met R of Python om de technieken van supervised analysis (regressie en classificatie) en unsupervised analysis (clustering, segmentatie en anomaliedetectie) te illustreren.
3
Grafische weergave en ophalen van gegevens
- R- en Python-talen voor statistische analyse.
- Hun ontwikkelomgevingen (R-Studio, Anaconda, PyCharm) en bibliotheken (Pandas, machine learning).
- DataViz-tools (Power BI, Qlik, Tableau, enz.).
- Gegevensmodellering: weergave van processen, stromen, controles en voorwaarden.
- Resultaten communiceren via data storytelling: visuals organiseren (diagrammen, ranglijsten, kaarten).
- Gegevensmodellering: tools (Orange, Power BI).
- Resultaten communiceren met behulp van data storytelling: het belang van de resultaten overbrengen.
Workshop storytelling
Oefeningen in grafische verkenning van gegevens, analyse van de positie en omvang van gegevens (wolken, histogrammen, enz.).
4
Een gegevenswetenschappelijk probleem modelleren
- Samenvatting van het proces.
- Casestudie 1: klantrelaties in de verzekeringsbranche.
- Marketingcampagnes richten. Inzicht in de oorzaken van klantuitval. Welke producten voor welke klanten?
- Casestudie 2: fraudedetectie.
- Vergelijk onderzoek met behulp van traditionele statistieken en datamining.
- Detectie met methode onder toezicht. Detectie zonder toezicht.
- Analyse van twee business cases, klantrelaties en fraudedetectie bijvoorbeeld, maar andere zijn ook mogelijk.
Casestudy
Praktische toepassing van de storytelling-methode op business cases.