Na de opening door Rob Riesmeijer, wordt de presentatie in twee onderdelen verzorgd. Eerst gaat Chintan Amrit (‘de techneut’) in op de kenmerken van big data in het algemeen. Daarna geeft Miha Lavric (‘de bioloog’) enkele toepassingen van deze technologie in het domein van de gezondheidszorg.
Er wordt aangegeven wat de karakteristieken zijn van big data: volume (het gaat om zeer grote hoeveelheden), velocity (de data verandert/groeit continu), variety (het gaat om verschillende typen, zoals gestructureerd, maar ook beelden, audio en video) en veracity (het is niet bekend hoe waarheidsgetrouw de data is: bijv. een thuismeetsensor kan stuk zijn).Benoemd wordt dat traditionele modelleringen / analyses gericht zijn op het verklaren van de uitkomsten, terwijl machine learning in combinatie met big data typisch gaat om het voorspellen van uitkomsten.
Bij machine learning wordt het gezocht naar patronen in data en dit gaat verder dan de gebruikelijke regressie. De helft van je data gebruik je voor het creëren van een decision tree(s), de andere helft voor het testen ervan. Vervolgens wordt ingegaan op verschillende typen neural networks.
De belangrijkste 4 big data trends voor 2018 in de gezondheidszorg zijn: (1) een tekort aan analyse deskundigheid, (2) privacy, (3) toegankelijkheid en (4) allerlei devices als wearables.
Als mogelijkheid wordt kunstmatige intelligentie bij de mede-beoordeling van SEO (Structureel Echoscopisch Onderzoek)’s genoemd. Ook bij de hielprik gaat het al gauw over big data.
Privacy (AVG (algemene verordening gegevensbescherming)) wordt aangestipt, maar wat beperkt toegelicht – dit verdient verdieping. De afronding van dit deel van de presentatie kwam onder tijdsdruk te staan, waardoor de voorbeelden (waaronder een interessante case waar op basis van veel data van de JGZ (Jeugdgezondheidszorg)’s voorspellingen op kindermishandeling zijn gedaan) niet helemaal goed uit de verf kwamen.
Bekijk de presentatie via de link in de kolom 'Download'.