Laat Onze Data Vrij !

copyright: David Simonds/The EconomistBig Data. Data management. Lifestreams. (Data) Firehose.
Wat de woorden ook zijn, ze geven aan: data zijn steeds belangrijker in ons leven.
We produceren er meer van, websites combineren onze data met die van vrienden en kijken naar metadata om voor ons relevante trends te ontdekken.

Maar het merendeel van relevante data zitten vast. Tot nu toe werden deze data keurig netjes bewaard, zoals we al eeuwen doen: in opbergkasten of hun moderne versie: op servers of harde schijven. Waarom zou je veranderen? En bovendien: kennis (en data) is macht, nietwaar?

Data Are Relations

En dat is zonde, zegt bijvoorbeeld Sir Tim Berners-Lee. Hij is een voorstander van “Linked data” – een idee, waarbij data zelf (en niet de documenten of websites waar ze in zitten) met elkaar kunnen linken. Het is dan ook een afgeleid idee van het idee van het semantische web.
In 2009 kwam hij naar TED om het idee uit te leggen. Ik vind het lastig om hem te zien presenteren – het lijkt soms of hij de woorden eruit moet persen. Toch gooit hij er zoveel energie tegenaan, dat ik ook het vervolg van zijn presentatie kan aanbevelen – linkeddata: een jaar later. Hij geeft als voorbeeld http://www.openstreetmap.org, waar veel vrijwilligers in korte tijd de wereld in kaart brengen.

Hij vertelt verder dat we de ruwe data vrij moeten laten. En een mooie: “Data are relations” – data vertellen niet alleen wat ze zijn, maar ook waar ze aan gelinked zijn. En data bouwt verder op andere data en linkt met andere data. En die combinatie geeft vaak een nieuwe rijkdom aan inzicht, aan relevantie en belang. Kortom: ook hier een netwerk-effect, wat we ook van het normale internet hebben gezien.

De ladenkasten blijven dicht…

Voor internet liefhebbers zijn de toepassingen van zijn ideeën niet moeilijk om te zien: als je eenmaal een mashup hebt gezien, begrijp je dat onze wereld interessanter kan worden, als je meerdere lagen met data combineert tot een nieuw inzicht.

Dus, zou je zeggen: iedereen enthousiast en de ladenkasten van bedrijven, instanties en overheden vliegen open? Ehm….nee. Dat gaat nog even duren, denk ik. Veel van onze “brick”-instanties ontlenen nog erg veel prestige aan het feit dat zij de gegevens voor zich houden. En dus krijg je vrij bizarre situaties als het bestaan van de Kamer van Koophandel, waar je voor een paar euro informatie krijgt, die je sinds tijden gewoon kan opzoeken op Google Maps of Google.

…maar niet in de UK !

In de UK zijn ze gelukkig al wel goed bezig. Daar houdt o.a. de Guardian een blog bij over “Free Our Data”, waar je prachtige voorbeelden kan zien van de UK overheid, die meer en meer data sets openbaart en die binnen korte tijd gebruikt worden voor overzicht van waar openbaar geld heengaat. Kijk op het bijbehorende blog en je krijgt bijna het idee dat de Guardian een revolutie wil ontketenen: van gemeente data, fietspaden, busroutes en nog veel meer.
Het (eind-?) resultaat is vrij spectaculair: de vrijgave van COINS – kortgezegd: een gedetailleerd overzicht van alle overheidsuitgaven van den UK. Met als gevolg dat lezers van the Guardian de kostendeclaraties van parlementsleden konden checken – met pijnlijke gevolgen.

Wow.

Hebben wij dan zoiets niet in Nederland? Toch wel: Opendatanederland.nl, maar hier zit nog niet dezelfde hoeveelheid energie achter als in de UK. Misdaadkaart.nl combineert locatie met persberichten van Nederlandse politiekorpsen. Maar daar blijft het wel bij.

Marketing en Open Data

Voor marketeers is het niet moeilijk om te zien wat er zou gebeuren als onze overheid hetzelfde zou doen: de data van een partij, die zo’n deel heeft in onze economie, moet wel interessante info opleveren, zeker als die overheid verantwoordelijk is voor het in stand houden van hele branches, zoals: Cultuur, onderwijs, verkeer & waterstaat, defensie om maar een paar te noemen.

Ook alle subsidies lijken mij boeiend voor bedrijven: je maakt duidelijker of een bedrijf in aanmerking komt voor een subsidie – of dat zijn concurrent er al mee vandoor is gegaan. (dan krijg je direct een beter idee van subsidie-misbruik)

Maar ook de overheid als data verzamelaar boeit mij:
– data van verkeersongelukken door de jaren heen en een verzekeraar kan een app bouwen, die je waarschuwt bij een gevaarlijk verkeerspunt.
– data van alle files, waardoor je file voorspellingen kan geven – waardoor je spreiding van verkeer bevordert (handig voor de transport sector)
– geef de data van hoeveelheid regen, stof, gevaarlijke stoffen op een locatie (voor de milieuconsultants)
– alle nieuwbouwprojecten (voor winkeliers en Ikeas), verbouwingsaanvragen (hypotheekverstrekkers en milieudiensten), visvergunningen, jachtvergunningen, rioolrechten, WOZ-niveaus; volgens mij zijn zelfs de hoeveelheden weggepompt water door de waterschappen boeiend voor bedrijven!

Het meest gebruikte heb ik nog niet eens genoemd: denk aan al die miljoenen euro’s, die nu uitgegeven worden door marketeers, om meer kennis te krijgen over hun klanten en hun omgeving.

Alleen daarom al zouden marketeers moeten mee schreeuwen: Laat Onze Data Vrij !

iButterfly

Ik blijf een sucker voor augmented reality. Deze video is een voorbeeld van een prachtige combinatie van eenvoudig leuke beleving (wie houdt er niet van vlinders?), actie (vang ze met je mobiel), samen genieten (elkaar laten zien, ruilen) en location based (vlinders zijn anders van kleur en vorm, afhankelijk van de locatie) en sales (vlinders geven recht op bonussen/kortingen).

Een prachtig voorbeeld. Wat kan het betekenen voor andere branches dan de fantasy/entertainment/game-branche ?

Journalistiek in tijden van datavisualisatie

We worden dus overstelpt met data. Big Data. En na het verzamelen van data komt “curation” – het filteren en uitkiezen. En dan komt het lastigste: probeer al die datapuntjes maar eens om te zetten in een duidelijk verhaal. Wat zelfs een kind met een korte attentiespanne begrijpt. Daarom is datavisualisatie niet alleen visueel prachtig, maar ook steeds meer geschikt om een boodschap duidelijk te maken.

Bijgaand vind je een documentaire van 54 minuten over de mensen die uit grijze massa’s data fascinerende boodschappen weten te maken.

Journalism in the Age of Data from geoff mcghee on Vimeo.

The Next Big Thing

Ik heb af en toe het idee dat bloggers en zeker marketing bloggers erg druk bezig zijn met het vinden van “The Next Big Thing”. Daarom is het handig om te weten dat de Wall Street Journal hiervoor een handig overzicht heeft gemaakt : een top 50 van startups met venture capital ondersteuning.

Van Zinga, Etsy tot Fus.io – allemaal namen waar je wel eens van hebt gehoord, of gaat horen. Wees dus voorbereid op alle conferences, YouTube filmpjes en PR-berichten en neem deze lijst even rustig door. Veel DNA-sequencing, hier en daar wat open source verhalen, smart meters en green energy. Kortom: voor iedereen wat.