Big data analyseren leidt tot nieuwe kennis #snrd12

Barend Mons, Scientific Director van NBIC, heeft zich lange tijd een Don Quichotte en roepende in de woestijn gevoeld. Hij houdt zich al langer bezig met ‘Big Data’ op het gebied van life sciences. Hij werkt daarbij samen met zo’n zeventig organisaties. In een vrij technisch verhaal met een hoog Beta-gehalte liet hij tijdens de SURFnet Relatiedagen de betekenis hiervan zien.

Zij maken gebruik van technische faciliteiten die te kostbaar zijn om als instelling in je eentje in de lucht te houden. Hij vertelde dat bioinformatics data genereert en opslaat die vervolgens door de industrie gebruikt worden om bijvoorbeeld beter medicijnen te produceren. De hoeveelheid data op het gebied van DNA verdubbeld bijvoorbeeld elke 6-8 maanden. Deze data zijn enorm informatiedicht. Dat maakt data-opslag en -gebruik complex. Er wordt hier erg veel in geïnvesteerd. Mons vertelde dat men hierdoor op een andere manier gaat publiceren. Je kunt bijvoorbeeld niet meer over alle waardevolle data publiceren.

De wijze waarop we kennis op het gebied van life sciences ontdekken, is ook aan het veranderen (Bignorance). Om die reden gaat men nanopubliceren. Dat zijn kleine units van publiceerbare informatie die bestaat uit een bewering, de bron en het bewijsmateriaal. Als je allemaal dezelfde bewering hebt, dan kun je dat patroon van nanopublicaties erkennen en daaraan een bewijsfactor koppelen. Op deze manier worden er megaveel nanopublicaties ontwikkeld. Dankzij ICT kun je bijvoorbeeld verbanden tussen concepten analyseren. Bijvoorbeeld tussen een bepaald gen en een ziekte. Maar je kunt op deze manier ook ruis uitfilteren (cureren). Via deze manier van analyseren, kom je ook op het spoor van degenen die over het verband hebben gepubliceerd, en kun je contact opnemen met deze onderzoekers.

Nieuwe kennis wordt op deze manier vanuit een ogenschijnlijke chaos geboren.

This content is published under the Attribution 3.0 Unported license.

Delen

Geef een reactie

Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *