In hetzelfde nummer van the Economist (25.7) ook nog twee interessante boeksignaleringen. Voor de big data fans is er Everybody Lies: big data, new data and what the internet can tell us about who we really are van Seth Stephens-Davidowitz. Alleen al een lijst met alle voorbeelden van big data vondsten zou het boek tot kostelijke lectuur maken zo stelt de reviewer. Als Hillary's team meer had gekeken naar de zoekterm Nigger, dan had ze geweten waar er op Trump gestemd zou worden (geen ander woord deed het in de voorverkiezingen al zo goed) en misschien de traditionele democratische fabriekssteden niet verloren hebben.
Moderne micro-economie, sociologie, bestuurskunde en kwantitatieve psychologie gaan volgens het boek een revolutie tegemoet die vergelijkbaar is met de uitvinding van de microscoop, om vier redenen:
1. er komen niet bronnen van informatie, dingen die je in enquetes lasting kunt vragen en wel in digitale sporen terugvindt
2. het is meer doegedrag dan zeggedrag: het gaat over wat mensen doen of denken, niet over wat ze menen aan interviewers te moeten vertellen
3. je kunt veel gemakkelijker demografische of geografische subsets bekijken
4. je kunt snelle randomized controlled trials opzetten die niet alleen correlatie maar ook causaliteit aantonen.
De tijd dat onderzoekers hun meeste tijd verdoen met het vinden van een groepje atypische studenten dat een enquete wil invullen heeft volgens dit boek zijn langste tijd gehad. Zolang we de gegenereerde big data conclusies maar niet meteen op een individue toepassen. Als veel motorrijders een laag IQ hebben, mag je niet concluderen dat je voor sommig werk iemand moet passeren die motor rijdt, zo stelt het boek.
Geen opmerkingen:
Een reactie posten