Over DIRT

Het DIRT-corpus bestaat uit Nederlandstalige realityseries zoals De Mol, Chateau Meiland en Temptation Island. Dit zijn programma’s waarin niet geacteerd wordt en waarin we relatief spontaan gesproken, informeel Nederlands terugvinden.

De eerste versie van het DIRT-corpus werd gecreëerd door Ulrike Vogl en Gauthier Delaby in 2021, in het kader van een project met studenten uit het vak “Nederlandse taalkunde: het hedendaagse Nederlandse taalsysteem” en een onderzoekslijn voor bachelorstudenten Nederlands “Taalgebruik in reality-tv”. Hierbij werden afleveringen van verschillende realityseries getranscribeerd volgens een transcriptieprotocol (Ghyselen et al. 2020). Het is een corpus-in-opbouw, dat regelmatig wordt aangevuld met nieuw getranscribeerd materiaal. In totaal telt het corpus momenteel ca. 200.000 woorden. Het corpus wordt verrijkt met metadata: het bevat informatie over de regionale afkomst, gender, opleiding en leeftijd van de sprekers. Het bevat zowel oudere programma’s als actuele programma’s in zowel Belgisch Nederlands als ook Nederlands Nederlands.