1
Geschiedenis van Machine Learning en de Big Data-context
- Zet de concepten van Kunstmatige Intelligentie, machinaal leren, enz. weer in perspectief.
- De link met wiskunde, (inferentiële) statistiek, datamining en data science.
- Van beschrijvende analyse naar voorspellende en vervolgens prescriptieve analyse.
- Machine Learning-toepassingen (zoekmachines, spamdetectie, lezen van cheques).
- De typologie van algoritmen van Dominique CARDON.
- De Data Science-gemeenschap en Kaggle-uitdagingen (bijv. Netflix).
Casestudy
Studies van concrete toepassingen van Machine Learning (zoekmachines, spamdetectie, het lezen van cheques).
2
Beschikbare gegevens: verzameling en voorbereiding
- Gestructureerde, halfgestructureerde en ongestructureerde gegevens.
- Statistische aard van de gegevens (kwalitatief of kwantitatief).
- Aangesloten objecten (IoT) en streaming.
- Mogelijkheden en grenzen van Open Data.
- Correlaties identificeren, het probleem van multicollineariteit.
- Dimensievermindering door principale componentenanalyse.
- Detectie en correctie van uitschieters.
- ETL (Extract Transform Load).
- Schrapen van het web.
Demonstratie
ETL-demonstratie (Extract Transform Load). Gegevensverzameling via het web.
3
Markttools voor gegevensverwerking en Machine Learning
- Traditionele software (SAS, SPSS, Stata, etc.) en de openheid naar Open Source.
- Kies tussen de twee Open Source leiders: Python en R.
- Cloudplatforms (Azure, AWS, Google Cloud Platform) en SaaS-oplossingen (IBM Watson, Dataïku).
- Nieuwe banen in bedrijven: data engineer, data scientist, data analist, enz.
- De juiste vaardigheden afstemmen op deze verschillende tools.
- Online API's (IBM Watson, Microsoft Cortana Intelligence, enz.).
- Chatbots (gespreksagenten).
Demonstratie
Demonstratie van een chatbot (conversational agent) en Azure Machine Learning.
4
De verschillende soorten Machine Learning
- Leren onder toezicht: een voorbeeld herhalen.
- Leren zonder toezicht: de gegevens ontdekken.
- Online (Machine) Leren in tegenstelling tot batch technieken.
- Versterkingsleren: een beloning optimaliseren.
- Andere vormen van leren (overdracht, sequentieel, actief, enz.).
- Illustraties (aanbevelingsmotoren, enz.).
Demonstratie
Demonstraties van de verschillende soorten Machine Learning die mogelijk zijn.
5
Machine-learning algoritmen
- Eenvoudige en meervoudige lineaire regressie. Beperkingen van lineaire benaderingen.
- Polynomiale regressie (LASSO). Tijdreeksen.
- Logistische regressie en scoretoepassingen.
- Hiërarchische en niet-hiërarchische classificatie (KMeans).
- Classificatie met behulp van beslisbomen of de Naïve Bayes-benadering.
- Ramdom Forest (ontwikkeling van beslisbomen).
- Gradiant boosting. Neurale netwerken. Vector-ondersteuningsmachine.
- Deep Learning: voorbeelden en redenen voor het huidige succes.
- Text mining: analyse van corpora van tekstuele gegevens.
Demonstratie
Demonstratie van de verschillende basisalgoritmen in R of Python.
6
Algoritmetraining en evaluatieprocedure
- Scheiding van datasets: trainen, testen en valideren.
- Bootstrap (bagging) technieken.
- Voorbeeld van kruisvalidatie.
- Definitie van een prestatiemeting.
- Stochastische gradiëntdaling (metrische minimalisatie).
- ROC- en liftcurven om algoritmen te evalueren en te vergelijken.
- Verwarringsmatrix: fout-positieven en fout-negatieven.
Demonstratie
De keuze van het beste algoritme aantonen.
7
Productie van een Machine Learning-algoritme
- Beschrijving van een Big Data-platform.
- Hoe PLC's werken.
- Van ontwikkeling tot productie.
- Correctieve en evolutionaire onderhoudsstrategie.
- Evaluatie van operationele productiekosten.
Demonstratie
Demonstratie van API's voor geolocatie en sentimentanalyse.
8
Ethische en juridische aspecten van kunstmatige intelligentie
- De opdracht van de CNIL en toekomstige ontwikkelingen.
- Recht op toegang tot persoonlijke gegevens.
- De kwestie van het intellectuele eigendom van algoritmen.
- Nieuwe functies in het bedrijf: Chief Data Officer en Data Protection Officer.
- De vraag over de onpartijdigheid van algoritmen.
- Pas op voor confirmation bias.
- Sectoren en beroepen beïnvloed door automatisering.
Groepsdiscussie
Brainstormen om de sleutels tot succes te identificeren.