Waar vandaan: SeniorenNet Research Department

Technisch over het SNRD

Het verzamelen van de gegevens gaat hoofdzakelijk via Internet. Bij vele mensen komt dan de vraag of deze gegevens dan wel betrouwbaar zijn. Het antwoord is hierop promt JA. Om hierop "ja" te kunnen antwoorden heeft het SNRD veel procedures en beveiligingen moeten inbouwen om dit te kunnen garanderen. Een kort overzicht wordt hieronder gegeven, er wordt niet te technisch op ingegaan omdat dit zou kunnen leiden dat mensen toch het beveiligingssysteem kunnen doorbreken.

Het SNRD werkt via Internet. Dit zorgt ervoor dat we een server nodig hebben die goed beveiligd is. De server wordt dagelijks onderhouden en bijgewerkt voor de laatste nieuwe beveiligingen. Hackpogingen worden onmiddellijk herkend en wordt in eerste instantie door de software tegengehouden dankzij onder andere een firewall, bij een serieuze poging wordt het technische team verwittigd zodat zij handmatig kunnen ingrijpen.

Het SNRD heeft gekozen voor servers die werken op een Linux gebaseerd systeem met een Apache server omdat deze het meest stabiele, betrouwbare en minst gevoelige zijn voor hackpogingen.

Meermaals per dag maakt het SNRD veiligheidskopieën van de resultaten. Indien er toch een hackpoging moest slagen, worden de veiligheidskopieën gebruikt en zullen de mogelijk aangepaste gegevens door de hacker worden verwijderd. Hierdoor is het niet meer mogelijk dat gegevens kunnen worden gewijzigd achteraf.

De resultaten zijn niet berust op het antwoord van enkele tientallen of een paar honderd mensen, zoals de meeste rondvragingen. Het SNRD gebruikt enkel antwoorden van gemiddeld 1.000 of zelfs van meerdere duizenden mensen om de betrouwbaarheid en de correctheid te kunnen garanderen.

Het ondervragingssysteem heeft een hele reeks van procedures die het mogelijk maakt om een persoon te herkennen, maar toch anoniem. De combinatie van browser, besturingssysteem, IP adres, hostadres, cookies, session-id's, configuratie computer, configuratie browser, kleurinstellingen, aanwezige plugins, schermresolutie, beveiligingsinstellingen, enz. zorgt ervoor dat een computer geheel uniek wordt bepaald op de wereld, ondanks de identiteit van de persoon 100% anoniem is. In combinatie met een hash-functie worden deze gegevens opgeslagen bij elk doorsturen van een antwoord.

Antwoorden die mogelijk door fraude werden ingegeven, worden gewoon aanvaard op het ogenblik zelf. Hierdoor kan een fraudeur niet achterhalen of zijn fraude werkt of niet, het lijkt van wel. Het is echter pas achteraf dat de gegevens opnieuw worden herzien en door speciale software worden alle fraude antwoorden eruit gefilterd en blijven de correcte resultaten over.

Een veiligheid die recent werd ingebouwd is het weren van insturen van antwoorden via zogenaamde "anonieme proxy servers". Deze worden gebruikt door mensen om geheel anoniem te surfen. Op zich hebben wij niets tegen deze mensen, dit is hun recht, hun antwoorden worden echter verwijderd van de definitieve resultaten. De reden hiervoor is dat de antwoorden hiervan niet te controleren vallen op fraude. Door systematisch alle anonieme proxies te verwijderen, blijven we een correct beeld behouden van de verkregen statistieken. Het aantal mensen dat deze anonieme proxies gebruikt ligt echter onder de 0,01% op SeniorenNet.

Een volgende stap is het verwijderen van alle verdacht lijkende HTTP headers. Headers die onvolledig zijn, foutief samengesteld zijn of die een poging doen tot fraude worden verwijderd. Deze headers zijn in zo goed als 100% van de gevallen gemaakt door mensen die poging doen tot fraude.

De resterende antwoorden worden extra nagekeken door een speciaal ontwikkeld systeem dat nagaat of de antwoorden wel mogelijk zijn. De serverlogs worden vergeleken met de opgegeven gegevens en de hostadressen en IP adressen worden vergeleken. Indien er onregelmatigheden worden vastgesteld worden ook deze beschouwd als fraude. Hierdoor kunnen we via een zeer ingewikkelde procedure alle fraude die via het vorige systeem is kunnen doorglippen, eruit gehaald worden.
Dit systeem wordt vervolgens een tweede maal doorlopen, via een controle telling. Er worden namelijk op de website ook gegevens verzameld over de bezoekersgegevens via een ander kanaal dan de serverlogs, de volledig anoniem verstrekte gegevens worden op hun beurt ook vergeleken met de resultaten en mogelijke onregelmatigheden verwijderd. De controlegegevens zijn zeer moeilijk of bijna onmogelijk te frauderen via automatische programma's die de resultaten zouden willen beïnvloeden.

Een volgend veiligheidssysteem gaat de antwoorden en de datum/tijdstempels vergelijken en bepaalde patronen proberen te herkennen. Indien iemand bvb. 5 minuten nodig heeft om te frauderen en zo om de 5 min. een bepaald zelfde antwoord doorgeeft en bovendien de antwoorden door voorgaande veiligheidssystemen zijn doorgeglipt, dan vangt deze software deze op. Via allerlei algoritmen worden patronen herkend en beschouwd als fraude.

Een extra veiligheid is het gebruik van een vast controlepanel van mensen die antwoorden op de polls. Dit zijn vijftigplussers die de doorsnede van de bevolking vertegenwoordigen: uit elke provincie, zowel hoog als laaggeschoolden, zowel hoge als lage inkomens, van de verschillende leeftijdscategoriën (50-55, 55-60, 60-65, 65-70, 70-75, 80+ jaar), zowel mannen als vrouwen, zowel werkenden/brugpensioen/werkzoekend/pensioen. Dit is het niet-anonieme panel en het is enkel mogelijk via een paswoord en unieke ID dat elke persoon van het panel maar 1 keer kan antworoden. Deze mensen zijn bij ons bekend en antwoorden op elke vraag. De gegevens van deze rondvraag worden niét mee gebruikt in het eindresultaat en deze gegevens worden achteraf geheel verwijderd zodat het controlepanel gerust kan zijn dat achteraf niemand nog kan achterhalen wat zij hebben geantwoord en dus anoniem blijven. De verkregen gegevens worden echter vergeleken met de gegevens verkregen van de anonieme rondvraag. Indien de gegevens van de anonieme rondvraag en van het controlepanel teveel van elkaar afwijken, worden de gegevens als onbetrouwbaar beschoud en niet verder gebruikt. Meestal wordt enkele weken later opnieuw dezelfde rondvraag gedaan en wordt de gehele procedure opnieuw doorlopen indien de gegevens als onbetrouwbaar beschouwd werden.

De cijfergegevens die overblijven na onder andere bovenstaande technieken kunnen we garanderen dat de gegevens die het SNRD beschikbaar stelt betrouwbaar zijn. Ze representeren de "gemiddelde actieve 50-plusser". Het SNRD is bovendien zeker dat haar cijfers een veel hogere betrouwbaarheid bieden dan cijfers verkegen van andere enquêtebureaus die dit doen via brief, telefoon, op straat of via internet.