Studiedata, niet te verwarren met data over studies, is een verzamelnaam voor een breed scala aan gestructureerde gegevens die binnen onderwijsinstellingen benut kunnen worden voor het verbeteren van het onderwijs. Daarbij onderscheiden we drie richtingen voor verbetering: de kwaliteit van onderwijs, de effectiviteit van het onderwijs en de efficiëntie van het onderwijs.
Studiedata ontstaan door alle vormen van onderwijs of processen die het onderwijs mogelijk maken. Het gaat dan ook alle ‘actoren’ in dat onderwijs aan: studenten met inschrijvingen en studieresultaten, docenten en hun vakken, opleidingsdirecteuren en de kwaliteit van opleidingen, studieadviseurs en de studievoortgang van hun studenten, ondersteuners in het onderwijs en data over deelname aan onderwijs, beleidsmakers en inzichten die voor de ontwikkeling of evaluatie van onderwijsbeleid nuttig zijn, bestuurders en instellingsdata, en niet te vergeten onderzoekers naar onderwijs en studiedata.
Welke data hebben we zoal tot onze beschikking om deze mogelijkheden voor verbetering te benutten? De meeste studiedata zijn vastgelegd in informatiesystemen voor onder andere het geven van onderwijs, de administratie van inschrijvingen en studieresultaten, kwaliteitszorg en afnemen van toetsen. Je kan data indelen naar toepassingsgebied, de content of context van het onderwijs. Daarbij verschillen die gebieden op een aantal big data aspecten (de 4 V’s): volume, variety, velocity en value. Big data kenmerkt zich door een hoog volume aan data, hoge variëteit aan variabelen, hoge omloopsnelheid van data en veel waarde die kan ontstaan uit analyses. Een voorbeeld is analyses van aandelen op de beurs of berichten op social media. Of studiedata ook big data zijn is nog maar de vraag als we naar deze aspecten kijken. We zullen zien dat studiedata uit de content van het onderwijs meer op big data lijkt, dan dat voor het studiedata uit de context van het onderwijs.
Aanvullende studiedata kunnen verzameld worden vanwege wetenschappelijk onderzoek, zoals een onderzoeksenquête of een logboekverslag. Een vrij nieuwe vorm van studiedata kan voortkomen uit het gebruik van devices in onderwijsgebouwen zoals het wifi-gebruik, wat bijvoorbeeld iets kan zeggen over de deelname aan onderwijs, het gebruik van onderwijslocaties of de bezetting van publieke ruimtes in onderwijsgebouwen.
Door studiedata te verzamelen, te combineren en te aggregeren kunnen onderwijsinstellingen op allerlei niveaus analyses plegen voor verschillende doeleinden op dat niveau.
Laten we als voorbeeld data nemen over de studievoortgang van studenten per vak.
Een analyse van deze gegevens kan op opleidingsniveau helpen bij het beantwoorden van vragen over de studeerbaarheid van een onderwijsprogramma: Welke vakken scoren naar verhouding het minst? Speelt dit voor alle studenten of is er een verband met hun achtergrond? Was dit ieder jaar het geval, of zien we daar nog bijzondere patronen in?
In combinatie met data van dezelfde opleidingen bij andere onderwijsinstellingen kan dezelfde data op landelijk niveau dienen voor benchmarks op bijvoorbeeld het succes van afgestudeerden. Wat is het succes van studenten per opleiding? Zijn er verschillen tussen opleidingen binnen of buiten de randstad? Wat zijn hier meerjarige trends?
Op persoonlijk niveau kan dezelfde data een docent helpen bij het verbeteren van het onderwijs, of een student helpen met een gericht advies. Hoe scoor ik als student vergeleken met andere studenten? Zijn mijn scores hoger of lager dan het gemiddelde op mijn andere vakken? Wat is de mogelijke impact van dit vak op mijn verdere studieverloop? Afhankelijk van de toepassing en het soort data gelden andere mogelijkheden en verplichtingen vanuit de AVG. Het is daarbij van belang dat een onderwijsinstelling waarborgt dat in principe zo min mogelijk data wordt verzameld als nodig, de voordelen van het gebruik zo groot mogelijk zijn en aansluiten bij de ethische principes van een instelling, en er voldoende waarborgen zijn om het risico op eventuele nadelige effecten te minimaliseren.
Het verzamelen en verwerken van data doorloopt meerdere stappen om waardevolle data te worden. In dat proces kunnen nieuwe data gekoppeld en ontwikkeld worden.
Een data ‘pijplijn’ of waardeketen kan er als volgt uitzien.