Textmining Strikes

Textmining=

Datamining op tekst

Jaarcongres VVOJ (Onderzoeksjournalistiek) 2013

Antal van den Bosch is als hoogleraar verbonden aan het Center for Language Studies (Nijmegen). Hij is zowel taalkundige als informaticus. In Nederland zijn wel zo’n 10 projecten actief. Textmining is datamining op tekst. De workshop vindt plaats op zaterdag 16 november 2013 aan de Hogeschool Windesheim. Dit in het kader van het jaarcongres van de onderzoeksjournalistiek (VVOJ).

Prof. Antal van den Bosch

Stakingen (Strikes)

Een interessant en aansprekend voorbeeld is de koppeling van een tekstbestand (IISG) met een krantenbestand (KB). Het tekstbestand bestaat uit archiefdocumenten die kerngegevens bevatten van een werkonderbreking (staking) uit het verleden. Denk aan datum (begin en einde), maar ook industrietak en aantal stakers. Door een koppeling aan de KB database, wordt het mogelijk om precies te zien wat er voorafgaande, tijdens of na de staking over is geschreven in de diverse kranten. Het leverde 16.000 matches op. Bij tekstanalyse blijken bepaalde begrippen steeds terug te komen. Zoals de (Limburgse) mijnen en de textielindustrie, maar ook de Regeringsbemiddelaar. Deze Regeringsbemiddelaar was in het verleden een functionaris die een staking moest zien te voorkomen (In Belgie bestaat dit nog!). Dit eenmaal vastgesteld hebbende, kunnen dergelijke begrippen ook worden ingevoerd om na te gaan of stakingen zijn voorbereid, maar uiteindelijk niet doorgegaan. Bij het laatste komt natuurlijk ook de Regeringsbemiddelaar weer om de hoek kijken.

Regeringsbemiddelaar

Second Screen

Maar er is veel meer te horen en zien tijdens de workshop.  Zoals ‘feeding the second screen’, waarbij tijdens televisie-uitzendingen via een tablet door kijkers live commentaar wordt gegeven. Dat commentaar kent soms tamelijk voorspelbare patronen. Daarmee is soms al een voorspelling te doen over de winnaar van een competitie of spel. Zo zijn dit wat voorbeelden van een zich snel ontwikkelend onderzoeksterrein. Het is zeker de moeite waard om te kijken naar een liaison tussen de onderzoeksjournalistiek en deze tak van sport!