15 februari 2016

DA 2.0 deel 1

DA, huh? DataAnarchie. Juist!

Ergens eind tachtiger jaren viel het me op hoe vaak je gegevens moest invullen die totaal niets maar dan ook niets met het aanvragen van bijvoorbeeld documentatie van een waterpomp, het aanvragen van een reisverslag of het opvragen van je gegevens bij de gemeente te maken hadden. Daarom dook ik daar eens dieper in en omdat ik toen toch al bij een bedrijf werkte dat veel gegevens verzamelde. Waardoor ik ook achter de schermen kon kijken wat daarmee zoal gebeurde. Het was 1989. Uw gegevens rolden toen naar schatting 300 keer per dag over het scherm voor of om uiteenlopende onderzoeken en redenen. Dat gebeurde uiteraard allemaal lokaal met door dat bedrijf goeddeels zelf gegenereerde data. Vandaar al die idiote vragen. Denk je, maar internet dan? Google bestond toen nog niet, die kwam pas in 1998 uit de start blokken. Internet stond in zijn kinderschoenen en kwam voor het grote publiek pas in begin negentiger jaren beschikbaar. Je had toen Archie - de grootmoeder van alle zoekmachines - daar zocht je voornamelijk documenten of programmaatjes mee. Daarnaast had je nog een keur aan BBS-en, voornamelijk bedoeld voor uitwisseling van nieuws en weetjes. Uiteraard werd daar ook naar bestanden gezocht en gedownload.
Op internet en BBS-en stond in begin 90er jaren bijna niets. Profielen kreeg je alleen te zien als je lid was van een groep op het wereldwijde Fido netwerk bijvoorbeeld. Op internet was het nog een woestijn voor profielen. Het project ECHELON bestaat al sinds 1948, voor veel meer dan bedrijfsspionage en afluisteren van ambassades en overheids gebouwen was het eigenlijk nog niet.
Laat staan dat ze (US & UK - later kwamen er meer stations en partners bij) in die begin jaren al die gegevens snel en makkelijk toegankelijk konden maken. Het zal niet tot verbazing wekken dat het vooral de UK was die dit verhaal aanzwengelde en een sterke partner zocht in de US. Het zal wel nooit bekend worden wie werkelijk de initiator hiertoe was. De Britten zijn niet geheel onterecht in of vlak na de WOI oorlog met grote afluisterstations begonnen maar er nooit meer mee opgehouden. Tot de jaren 80 werden de kern-gegevens voornamelijk op tape en op ponskaarten bijgehouden of op de good old archiefkaartjes in de kaarten bakken.
Vanaf het moment dat grote zalen ontstonden met talloze gillende schijven-pakketten, waarbij de kosten van opslag eigenlijk per dag omlaag gingen en daarom ondergeschikt werden, gingen de info boeren pas werkelijk los. Bij iedere volgende generatie van  informatiesystemen werden meer en meer meta gegevens van personen, bedrijven en landen opgeslagen. Anno nu passeert jouw naam per dag meer dan 30 duizend keer een filter, geen mens die het meer ziet. Wordt je mail bekeken, je snailmail gescanned, je telefoon en internet afgetapt en tot in je huiskamer aan toe wordt je gewoon afgeluisterd.
Aan de dinertafel, alles wat je zegt wordt vastgelegd. Alhoewel dat van de dinertafel minder frequent voorkomt. Een lamp die eigenlijk onzichtbaar meeflikkert met de frequentie van je stem moet je aansporen om meteen een andere ruimte op te zoeken als je niet wil worden afgeluisterd. De ruis die dergelijke lampen op het elektriciteitsnet geeft kan worden omgewerkt tot verstaanbare spraak. Trillingen op ramen, toetsenborden hebben ieder ook zo'n karakteristiek, net zoals monitoren, geluidsinstallaties kortom alles wat met electromagnetische golven, in de breedste zin, werkt kan meehelpen je af te luisteren. De hele dag rijden wagentjes rond tjokvol met apparatuur om mensen af te luisteren. Elke dag worden er bij iemand thuis apparaatjes geïnstalleerd om dingen te weten te komen waar niemand eigenlijk iets mee te maken heeft. Op afstand installeren de niet eens zo geheime diensten dingen op je machines waarmee alles wat je doet vastgelegd kan worden. Of ben je, meestal zonder dat je het weet of merkt, deel van een bot net waarmee een deel van het rekenwerk voor dergelijke praktijken wordt gedaan.
Onder het mom van uw veiligheid worden tegenwoordig wetten aangenomen die de dagelijkse praktijken van tientallen jaren voordien legitimeren. Wetten die 15 jaar geleden onmogelijk zelfs maar ter sprake gesteld konden worden. Steeds openlijker en niet meer als ondergeschoffeld onderdeel van een "zeer noodzakelijke" aanpassingswet. Met grote interesse wordt door alle overheden naar andere overheden gekeken hoe die aanpassingen maken in wetten om voordien illegale praktijken af te dekken. Illegaal is door deze trend natuurlijk redelijk rekbaar geworden. De snoepreisjes van hele roedels ambtenaren moet je dan ook een beetje in dit licht zien. Informatie uitwisseling heet dat. Nou dan gieren bij mij meteen alle alarmklokken. Wat zullen ze nu weer bekokstoofd hebben. Ach weet je, ze hoeven het ook echt niet te vertellen. Wie zei dat ook al weer? Je kunt het licht misschien niet zien, maar diens schaduw wel. Een enkele opmerking over een nieuw data centrum gecombineerd met een opruiming nieuws-item van een paar luister oren bij Scheveningen was voldoende om te weten dat er weer een extra data-vergaar-kanaaltje gereed was. Ineens was ook een stukje gebied in het noorden van NL grijsgemaakt door Google. Goeie morgen, waarom zou dat nu wezen. Andere satelliet foto's en kaartprogrammaatjes lieten dat gebiedje nog steeds in volle glorie zien. Het voor publiek toegankelijk materiaal is gewoon erg verouderd, geen enkel gevaar voor "ontdekking". Waarom dan zo geheimzinnig doen als je net zo makkelijk een stukje oude info daarvoor in de plaats kan zetten?

DataAnarchie
Daarmee heb ik een bruggetje naar DataAnarchie gevonden. DataAnarchie staat voor het  opbergen van gegevens in een bos riet vol met kluiten. Gegevens in alle openheid opbergen is vaak de beste manier om die te verstoppen. (naar Arthus Conan Doyle de bedenker van Sherlock Holmes) Alleen gaat het hier om de zogenaamde kwaliteit van de gegevens. En daar wil ik het vandaag over hebben. Hoewel de programmatuur die je voor het veredelde data-mining (het graven naar jouw gegevens) hebt steeds meer leert uit patronen die je in de gegevens verborgen hebt zitten. De mens is zo'n gewoonte beest, niet te geloven.
Zoals je weet peurt Facebook allerlei dingen uit je postings. Bijvoorbeeld met wie je allemaal vriendjes bent. Facebook analyseert de knooppunten in je netwerk, kijkt hoe vaak je met deze of gene contact hebt en rijgt dan het een en ander aan elkaar. Dat noemen ze het wegen van knooppunten. Zo is Pietje een vriend van Jantje + Mies + Joost. Als die drie in Kalpdorp wonen, vaak afspraakjes hebben IRL en net zo intensief met Piet moet welhaast Piet ook in Kalpdorp wonen. Dat gaat ook blijken uit de gegevens die je browser bij het Smoelenboek achterlaat. Zoals je IP nummer (soort adres waar je zit te computeren), welke browser, welke programma's je op je hardeschijf hebt staan enz enz. Een paar koekjes (kleine bestandjes en of programmaatjes die dingen vastleggen en of opsturen naar SB)  zorgen ervoor dat er ook nog gekeken wordt van welke site je vandaan kwam en wat je nadat je het SmoelenBoek hebt verlaten, daarna doet. Lees je de krant, welke, ga je bankieren (bingo!), mailen met wie mail je het meest. Hola! Als je webmail gebruikt ben je natuurlijk he-le-maal transparant voor broeders als SB. Etc. etc. etcétéra. Het zou me niets verbazen als SmoelenBoek ook nog je adressenlijst pikt. Afijn. Stel je voor dat volgens het standaard profiel er een aantal gegevens ontbreken. Zeg het telefoonnummer. Dan gaat eerst het programmaatje van SB aan het werk. Wordt vervolgens iedereen die Pietje heet en in Klapdorp woont door een telefoonklapper gehaald. Leggen we daar een telefoonboek, geboortedagen (felicitaties) of zo naast en voilá. Piet is geïdentificeerd. Callcenters doen dat ook zo, geboortedatum + postcode huisno. + rekeningnummer wordt in het algemeen geaccepteerd als positieve ID.
Vul daarom altijd maar wat in, bij voorkeur een verkeerde geboortedag. Als mensen dan alsnog op die foute dagen reageren is dat voor FB een vorm van bevestiging en voila 100% DA. Reageren mensen op verschillende data, tja, wat moet SB daar nu van denken. Opnieuw pure DataAnarchie ;=) Uiteraard reageer je wel op de felicitaties met de verkeerde dag om een flinke volgende kluit in het riet te werpen.

Hoe gaat dat in de praktijk?
Als zo'n telefoon terreur dame belt, blijf dan vriendelijk, zij kan het ook niet helpen dat ze  van haar baas de database moet vullen. Besef tegelijkertijd dat het een geweldige kans is om met «het systeem»  een prima mind f*ck te doen. Als je vriendelijk bent heb je ook meer kans dat ze dingen die je zegt rechtstreeks in die database nagelt. Overdrijf niet, hetgeen je vertelt moet aannemelijk zijn. Zo is het een uitzondering dat je op 30 jarige leeftijd 5 kinderen hebt. Dat je directeur van een multinational bent of met een perfect Rotterdams accent een Bulgaar schijnt te zijn. Hou het bij het onware plausibele. Dat werkt beter. Vragen ze of je een lening hebt uitstaan zeg dan ja (of dat nu waar is of niet) daarmee beantwoord je aan de verwachting omdat iedereen wel een soort van leninkje hebt. De bedragen is voor hen gissen, volgende vraag: hoeveel ongeveer? Kijk dan bijvoorbeeld naar de klok en verzin wat. Het kijken naar de klok heeft als effect dat je even een hele kleine pauze inlast en dat geeft de telefoonterroriste een gevoel van oh dat klopt, iedereen aarzelt iets bij het ophoesten van dat soort getallen. Ook al ben je je daarvan vaak niet bewust.

Kortom DA berust voor een groot deel op een omgekeerde vorm van social engineering. In plaats van gegevens te willen achterhalen voedt je het systeem met valse. Of, volgens het tweede axioma van DA: geef ze als ze erom vragen veel, voornamelijk rommel-data.

Bedenk wel dat het een spel is waar je alleen wint als je van tijd tot tijd je strategie aanpast. Je weet wel, patronen worden alleen zichtbaar als er regelmaat is. Hoewel, de steeds beter wordende software herkennen ook het zogenaamde «erratic path». Ook al is er ogenschijnlijk sprake van chaos, toch is er bijna altijd regelmaat te zien. De afwijking op zich vormt ook een patroon.
Taal analyse vormt draagt ook bij aan het vullen van je profiel. Altijd zijn er wel van die signaaltjes die je weggeven. Bijvoorbeeld. Schrijf je: we gaan een bakkie doen of we gaan koffie drinken. In het eerste geval kom je uit west Nederland. In het tweede geval schrijf je correct Nederlands. Heb je het over kassie of kastje, idem.

Er is vooral in het laatste decennium een waanzinnig omvangrijke handel ontstaan met je persoonlijke gegevens. Want gegevens = weten wie je aanspreekt = gerichte beïnvloeding = verkopen. Daar halen bedrijven als Facebook, Google, Yahoo, Lycos, KPN, Lloyds, First Manhattan, Aegon, BNP, Alianz, ING, Volvo, ... een geheel of deel van hun winsten uit.

Daar laat ik het maar eventjes bij.

deel 1 | 2 | 3 | 4

Geen opmerkingen: