Het oogsten van gemeenschappelijke kennis: van webteksten tot theoriegestuurd onderzoek (Harvesting the Wisdom, S/113012) Lambooij, dr. M.S. (Mattijs)
Inleiding en motivatie
Patiënten posten teksten op internet over hun ervaringen met gezondheid, zorg en milieu. Al deze teksten vormen een enorme database van ervaringen van patiënt en burgers over onderwerpen die gerelateerd zijn aan de gezondheid, zorg en milieu. Al deze teksten zijn mogelijk een waardevolle bron voor onderzoek naar beleidsrelevante vragen. Daarnaast zien we dat de response van surveys afneemt en het combineren van registratiebestanden steeds lastiger wordt. Wanneer het mogelijk is om de data op internet geschikt te maken voor grootschalig onderzoek, kan dit een belangrijke en waardevolle nieuwe bron van gegevens zijn, waardoor het RIVM zijn onderzoekscapaciteit in de toekomst kan waarborgen.
Doel(en)
De algemene doelstelling van dit project is om instrumenten en vaardigheden in het RIVM te implementeren waarmee het RIVM in staat is om de informatie van internet als een nieuwe gegevensbron voor onderzoek te gebruiken. Wij streven ernaar om een infrastructuur te bouwen die flexibel genoeg is voor alle RIVM onderzoekers om deze dienst te gebruiken. We maken gebruik van beschikbare hardware en open source software om textminingtechnieken op basis van kunstmatige intelligentie toe te passen op vraagstukken die voor het RIVM relevant zijn.
Een tweede doelstelling is het verkennen van juridische en ethische randvoorwaarden. De wetgever loopt achter op de nieuwe mogelijkheden, waardoor er grijs gebied is ontstaan over welke technische mogelijkheden juridisch mogen en ethisch wenselijk zijn.
Innovatieve aspecten
Het leren van textmining en inzetten van artificiële intelligentie is voor het RIVM een innovatie omdat ze nieuwe technieken zal toepassen in de organisatie. Op diverse plekken in Nederland en de wereld zijn kleinschalige onderzoeken gedaan met deze technieken. In onze gesprekken met universiteiten hebben we geleerd dat de meeste onderzoekers op dit gebied aan het pionieren zijn met de nieuwe mogelijkheden, waarbij soms theorie-gestuurd en soms meer data-driven onderzoek wordt gedaan. Als zodanig is het een innovatieve manier van onderzoek doen en is het van belang voor het RIVM om in de toekomst de rol van kennisinstituut te kunnen borgen. Het beheersen van deze technieken is een voorwaarde voor succesvolle opschaling naar nuttige Big data analyses in een eventueel later stadium.
Aanpak, externe partners, geplande resultaten en producten en verdienmodel
Om richting te bepalen van de ontwikkeling en toepassing van de IT-tools en kunstmatige intelligentietechnieken, zijn vier onderzoeksvragen geformuleerd vanuit verschillende expertise-gebieden van het RIVM. De vier onderzoeksvragen zijn uitgewerkt in vier onderzoekscasus. De vier casus hebben gemeen dat zij dezelfde infrastructuur nodig hebben om gegevens van het internet genereren. De casus hebben verschillende onderwerpen (besmettelijke ziekten, voedselveiligheid, empowerment van patiënten en zorgkwaliteit) en gebruiken verschillende validatietechnieken om te onderzoeken of de data die met de nieuwe algoritmen (nieuwe methoden) worden gevonden overeenkomen met de werkelijkheid. De Radboud Universiteit, de VU (Vrije Universiteit) en het NFI (Nederlands Forensisch Instituut) worden betrokken in de adviescommissie van het project. De Universiteit van Tilburg (TILT) is betrokken bij alle fasen van het onderzoek.
(1) Een eerste resultaat is ervaring in interdisciplinaire samenwerking binnen het RIVM van IT-ers, statici, onderzoekers en communicatie-experts, (2) daarnaast verkrijgen we kennis en infrastructuur om dit soort onderzoek mogelijk te maken. (3) Als alles gaat zoals gepland, zullen er vier artikelen (1 per deelproject) worden gemaakt en aangeboden aan internationale peer-reviewed tijdschriften voor publicatie. (4) de bevindingen over de juridische en ethische randvoorwaarden zullen in een intern RIVM beleidsstuk worden gepresenteerd, als richtlijn voor hoe het RIVM in de toekomst met dit soort onderzoek om zal gaan.
Beoogd vervolg
Als blijkt dat de nieuwe dataverwervingsmethode valide resultaten oplevert, kan deze techniek worden ingezet door alle RIVM-ers. Het wordt mogelijk om monitoren van sentimenten op internet van een breed scala van onderwerpen in te richten en om theorie-gestuurd op zoek te gaan naar belevingen van burgers en patiënten bij alle onderwerpen die het RIVM onderzoekt en regisseert.