In de geneeskunde
[5] Artsen en wetenschappers trekken conclusies op basis van gegevens. Ze kijken bijvoorbeeld hoe zwaar mensen zijn, of die mensen roken en/of drinken en concluderen vervolgens op basis van die gegevens hoeveel levensjaren mensen inleveren als ze te zwaar zijn, roken en drinken. 'Zo werken onderzoekers al decennialang.' Maar altijd waren hun gegevens 'beperkt'. Big Data brengt daar verandering in. 'Nu weten we behalve het gewicht en of mensen roken of drinken misschien nog wel duizend andere variabelen en die gegevens weten we ook nog eens van een veel grotere groep mensen.' In theorie kunnen, op basis van die schat aan informatie, dus betrouwbaardere conclusies worden getrokken, maar in de praktijk is dat lastig. Want met meer dan duizend variabelen en misschien wel miljoenen mensen op wie die variabelen betrekking hebben, krijgen we tabellen met duizenden regels en duizenden kolommen. 'En dan zie je óf patronen die er helemaal niet zijn óf je ziet helemaal niets.'