Cursus Introductie in Data Science

Man kijkt naar data
Meld je aan
De opleiding start een aantal keer per jaar
Meer informatie ...
Brochure, helpdesk
  • ASK HAN
    We helpen je graag persoonlijk verder
  • Brochure aanvragen
    En bekijk thuis rustig het aanbod

De opleiding start17 april 2025

De cursus biedt een praktische introductie in Data Science met Python, voorkennis niet vereist. Ideaal voor professionals, programmeurs, onderzoekers en studenten die zich in Data Science willen oriënteren, het begrijpen en gebruiken. Leer binnen 5 bijeenkomsten de basis voor verdere verdieping.

In het kort

    17 aprilStartdatum
    5 bijeenkomsten op donderdagDuur
    13.00 - 16.00 uurLestijden
    €950,-Kosten
    CertificaatResultaat

Over de cursus Introductie in Data Science

Data Science is een snelgroeiend vakgebied wat toegepast wordt in allerlei sectoren. We krijgen immers met steeds meer data te maken door de talloze beschikbare technologieën. Met de juiste kennis en vaardigheden in Data Science, kan de beschikbare data effectief gebruikt worden voor o.a. innovatie, efficiëntie en betere besluitvorming in vrijwel elke sector in de maatschappij. Door je als professional te verdiepen in Data Science, profiteer je van een krachtig hulpmiddel binnen je vakgebied en leer je data effectief in te zetten.

De cursus Introductie in Data Science heeft tot doel deelnemers de basis van Data Science aan te leren door middel van een mix van theorie, herkenbare voorbeelden en oefeningen.

Cursisten aan de slag met data science achter laptop

Programma cursus Introductie in Data Science

De leergang is samengesteld door docent Matthijs de Jonge en het aangesloten Applied Data Science & AI van lector Erwin Folmer en bestaat uit 5 bijeenkomsten:

Dag 0: starten met Python (optioneel)

Als je nog nooit eenvoudige programmacode hebt geschreven in Python (denk aan: sommen uitrekenen, teksten weergeven enz.), leren we je in deze optionele startles hoe dat moet.

Dag 1: beschrijvende statistiek

Je leest gegevens in uit CSV-bestanden en Excelbestanden, leert hoe je daar op statistisch zuivere wijze uitspraken over kunt doen en hoe je grafieken kunt ontwikkelen die inzicht geven in je data. Ook de normaalverdeling komt aan bod.

Dag 2: statistiek en verbanden in data

We gaan samen onderzoeken of we verbanden kunnen vinden in onze data. We leren hoe we met p-waarden en confidence intervals kunnen vaststellen of twee populaties van elkaar verschillen, we laten de computer uitrekenen of er een correlatie (verband) is tussen twee variabelen en we gebruiken lineaire regressie om voorspellingen te doen.

Dag 3: decision trees en clustering

We laten de computer verbanden zoeken in onze data. Zijn er misschien groeperingen te ontdekken in onze gegevens? Kunnen we misschien nieuwe eigenschappen vinden in onze data? We gebruiken decision trees en clustering om dit voor elkaar te krijgen en als één enkel model niet voldoende is gebruiken we een verzameling modellen (een ensemble model) om voorspellingen te doen.

Dag 4: lessons learned

In deze laatste les leren we om te gaan met de belangrijkste valkuilen bij het inzetten van data science. Wat doen we als er gegevens ontbreken of simpelweg verkeerd zijn? Hoe voorkomen we dat een computer prima waarden in onze testdata kan voorspellen maar niet in staat is om waarden uit nieuwe data te voorspellen? Hoe verbeteren we de kwaliteit van onze modellen? We gaan aan de slag met overfitting, sampling density en feature selection en voeren onze analyses uit volgens het principe train, test en validate.

Verdere informatie

Maak kennis met de docent en het lectoraat

Docent voor deze cursus is Matthijs de Jonge, docent Applied Data Science aan de opleiding HBO-ICT van de HAN. Hier geeft hij zowel onderwijs over programmeren als over de meer analytische kant van het werken met data. Hij heeft een achtergrond in het ontwikkelen van complex gedistribueerde softwaresystemen. Omdat daarbij grote hoeveelheden data een rol spelen, heeft hij zich daarin gespecialiseerd in manieren om computers geautomatiseerd patronen te laten herkennen in data.

Aangesloten bij deze cursus is het lectoraat Applied Data Science & AI van lector Erwin Folmer. Erwin is een ervaren onderzoeker en adviseur op het snijvlak van business en ICT. De afgelopen jaren gaf hij leiding aan het Data Science Team bij het Kadaster en was hij docent en onderzoeker bij de Universiteit Twente. Eerder werkte hij bij TNO als senior wetenschapper op het gebied van data interoperabiliteit en standaarden. In 2012 promoveerde Erwin op het proefschrift "Quality of Semantic Standards" bij de Universiteit Twente.

Docent Applied Data Science Matthijs de Jonge

Contact

Heb je vragen over deze cursus? Wij helpen je graag.