Presentatie Melchior Mattens

Page 1

Big data, voorspellen en privacy De grote uitdagingen voor Actuarissen & Econometristen

4 maart 2019 Melchior Mattens Angela van Heerwaarden


Welkom • Arcturus – Actuarieel adviesbureau – Ontstaan vanuit de specialisatie schade – Onze klanten: vaak met hun eigen specifieke niche markten of producten.

• Sprekers – Melchior Mattens – Angela van Heerwaarden

Uw partner in actuarieel maatwerk 2


Privacy? • De persoonlijke levenssfeer die onszelf en ons handelen, eigenschappen en informatie onderscheidt en afschermt van anderen. • Waarom? – Controle en veiligheid – Bepalend voor sociale interactie – Vrijheid van denken en spreken

Niets teGrondrecht Anonimiteit verbergen toch? Zijn Wiens mijn data? gegevens MIJN data!! veilig? Persoonlijke keuze


Inhoud 1. Privacy regels 2. Big data en voorspellen – Databronnen – Machine learning

3. Methoden van omgang met data 4. Cases – DNA-analyse & verzekeren – WA+Casco-verzekeringen meting rijgedrag – Overstromingsschade in “versteende” buurten


1. Privacy regels - AVG Verwerking = • • • • • • • • • • • • • • • • 4 maart 2019

het verzamelen, vastleggen, ordenen, bewaren, bijwerken, wijzigen, opvragen, raadplegen, gebruiken, verstrekking door middel van doorzending, verspreiding of enige andere vorm van terbeschikkingstelling, samenbrengen, met elkaar in verband brengen, afschermen, uitwissen en vernietigen

Rechtsgrondslagen: 1. 2. 3. 4. 5. 6.

Toestemming Uitvoering overeenkomst Uitvoering wettelijke plicht Vitaal belang Publiekrechtelijke taak Gerechtvaardigd belang

Voorwaarden: • • • •

Op behoorlijke en zorgvuldige wijze Precieze doelomschrijving Toereikend, terzake dienend Niet bovenmatig

5


2. Big data en voorspellen • Verzamelen van allerlei gegevens is eenvoudig: – Uitvraag data aan verzekerde => verzekerde stemt in – Openbare bronbestanden o o

Publieke databases Databases samengesteld door dataminers (veelal koppeling van verschillende soorten openbare data)

– Waarneming: o

Verzamelen van data o.b.v. waarnemingen tijdens contractduur (bijvoorbeeld schadeclaims tijdens duur van verzekering)

• Kan een verzekeraar zomaar elke vraag stellen? – Is het ethisch om naar iemands inkomen te vragen als dit relevant is voor schadestatistiek?


Big data en voorspellen (2) • Machine learning technieken – – – –

Neurale netwerken Random forests K-nearest neighbours Exhaustive fitting

• Veel technieken bestaan al vele decennia • De capaciteit aan dataopslag maakt nieuwe toepassingen mogelijk • Toepassen kan aanzienlijke verbetering in voorspelkracht opleveren


Big data en voorspellen (3)

• Data anoniem? – Ankie verdient 2,1 keer modaal – Huis op postcode (zonder huisnummer), – Maar zonnepanelen zijn meeverzekerd

• Ethisch gebruik van data? – CBS publiceert aantal allochtonen en gemiddeld inkomen per buurt met koppeling aan postcodegebieden. – Is het differentiëren van de premie op CCCC LL niveau (straatniveau) mogelijk discriminerend?


3. Methoden van omgang met data • Pseudonimiseren – Identificatiesleutel => Toepassen om een AOV voorziening door Arcturus te kunnen laten berekenen

• Anonimiseren – Aggregeren – Randomisatie (ruis toevoegen) – L-diversiteit


3. Methoden van omgang met data (2)

• Anonimiseren van data: – Verwijderen van naar personen herleidbare data – Indien noodzakelijk én mogelijk, controleerbare random noise toevoegen aan observaties o

Laplace Noise

• Discussie over “de grenzen van privacy”


CASES


Intro beslisboom

Toestemming?

Wettelijke verplichting?

Vitaal of gerechtvaardigd belang?

Pseudonimiseren

Anonimiseren

Niet gebruiken

12



Case 1: DNA-analyse • Biologie en statistiek • Het menselijk genoom bestaat uit chromosomen die weer worden opgebouwd uit DNA en RNA. • Nucleotiden: Nucleotiden zijn de bouwstenen waaruit DNA- en RNA-moleculen zijn opgebouwd. De erfelijke informatie ligt besloten in de volgorde, oftewel sequentie, van de nucleotiden in die moleculen. Een nucleotide bestaat uit drie onderdelen: een stikstofbase, een suikergroep en een of meer fosfaatgroepen. De stikstofbasen zijn de spil in de genetische code. • Stikstofbasen: Er zijn vijf stikstofbasen die in nucleotiden kunnen voorkomen: adenine (A), cytosine (C), guanine (G), thymine (T) en uracil (U). DNA-nucleotiden komen alleen A, C, G en T voor. RNA bevat U in plaats van T.


• Crispr Cas9: knippen en plakken van DNA


Case 1: DNA-analyse (2) • IGem team TU Delft 2018: – DNA doping, hoe te detecteren? – Statistiek! – DNA heeft natuurlijke mutatierate van 8% (een standaard sequentie als ACGTAAG…GTTAC kan op elke een natuurlijke afwijking hebben). – Afgenomen DNA kan middels “alignement-scores” uit de biostatistiek worden vergeleken met het natuurlijke DNA. – Als een score van een afgenomen DNA streng statistisch te ver afwijkt van natuurlijk DNA, dan wordt deze ingedeeld in “fraude DNA” – Gebruik van K-nearest neighbours om automatisch te classificeren


Case 1: DNA-analyse (3)

• Database met menselijk nondoping DNA en menselijk doping DNA • Doping DNA o.b.v. o.a. dierlijk DNA voor EPO productie • Relevant voor het Actuariaat?


Case 1: DNA-analyse (4) • Indeling DNA naar gevoeligheid voor allerlei ziekten middels biostatistiek • Relevant voor zorg- en levensverzekeraars – Dekking tandproblemen uitsluiten o.b.v. geautomatiseerde DNAanalyse – Familiaire hartkwaal verhoogt overlijdensverzekeringsrisico – “Gezond DNA” aanleiding tot verhoging pensioenpremie en/of aanpassing ervaringssterfte? – Klantenservice: de verzekeraar kan voor dokter spelen en verzekerden waarschuwen voor genetische defecten

• Echter: is het gebruik van DNA-data ethisch?


Is het gebruik van DNA-data ethisch?

Toestemming?

Wettelijke verplichting?

Vitaal of gerechtvaardigd belang?

Pseudonimiseren

Anonimiseren

Niet gebruiken

19


Case 2: meten rijgedrag

• Geïntroduceerd door de ANWB • Een kastje in de auto die o.a. snelheid en locatie bijhoudt • Korting op basis van gemeten rijgedrag • Vervanging van Bonus-malussysteem door nog persoonsgerichtere aanpak • Flinke kortingen (tot 30%) bij het doorgeven van jouw rijstijl via de ANWB-dongel


Case 2: meten rijgedrag (2) • Aangenomen dat de persoonlijke rijstijl een betere indicator is voor de kans op schade dan de huidige systemen • Spiraal: – De beste rijders worden als eerste door prijsprikkel (en het niet willen delen van risico met “aso-rijders”) weggetrokken uit de bonusmaluscollectieven – Hierdoor gaan gemiddelde premies omhoog voor de achterblijvende verzekerden – Gevolg: nog meer mensen zullen overstappen – Uiteindelijk blijven alleen de aller slechtste rijders én mensen die hun data niet willen delen over in het huidige colectief

• Is de uitkomst van deze spiraal eerlijk?


4 maart 2019

22


Is de uitkomst van deze spiraal eerlijk?

Toestemming?

Wettelijke verplichting?

Vitaal of gerechtvaardigd belang?

Pseudonimiseren

Anonimiseren

Niet gebruiken

23


2 4

Case 3: Geografische portefeuilleanalyse •

Waar zit verzekerde waarde geconcentreerd? –

A.d.h.v. adresgegevens kunnen de verzekeringsconcentraties worden vastgesteld

4 maart 2019


Case 3: Geografische portefeuilleanalyse (2) • Benodigde gegevens: inschatting/opgave van (verzekerde)waarde op elk adres • Koppeling met de basis administratie gebouwen (BAG) levert lengte- en breedtegraden op • Mag de verzekeraar hiervoor de adressen van de verzekerden gebruiken?

4 maart 2019

25


Mag de verzekeraar mijn adres hiervoor gebruiken?

Toestemming?

Wettelijke verplichting?

Vitaal of gerechtvaardigd belang?

Pseudonimiseren

Anonimiseren

Niet gebruiken

26


Case 4: versteende tuinen

• Satellietdataportaal voor iedereen vrij toegankelijk • Gebruik satellietdata voor: – Ruimtelijke ordening – Oogstoptimalisatie – Lucht- en waterkwaliteit – Bodembeweging


• Droogtegraad Nederlandse gebieden


Case 4: versteende tuinen (2) • Image recognition: – Middels neurale netwerken objecten leren herkennen in figuren – Pixels (kleurcode) leidend voor de vormen – Verzekeraars kunnen met satellietbeelden exacter risicokarakteristieken bepalen van verzekerde objecten: Liggen er zonnepanelen op het dak (al dan niet onverzekerd)? o Is de tuin geheel betegeld of juist groen (i.v.m. waterafvoer bij sterke regenbuien)? o

• Wordt de privacy van de verzekerde geschonden doordat de verzekeraar bij iedereen met satellieten in de tuin kijkt?


Wordt mijn privacy geschonden doordat de verzekeraar met satellieten in de tuin kijkt?

Toestemming?

Wettelijke verplichting?

Vitaal of gerechtvaardigd belang?

Pseudonimiseren

Anonimiseren

Niet gebruiken

30


Case 4: versteende tuinen (4)

Is het rechtvaardig als jouw buurman zijn tuin betegelt en jij meer premie moet gaan betalen omdat de verzekeraar dit “ziet�?

4 maart 2019

31


Case 5: Verzuimverzekering • De verzekerde is de werkgever: loondoorbetaling bij ziekteverzuim is verzekerd • Verzekeraar heeft behoefte aan informatie over schadeoorzaken • Verzekeraar en reïntegratiebedrijf werken samen Welke gegevens mogen gedeeld worden met wie: A. Procesgegevens B. Gezondheidsgegevens C. Medische gegevens


Case 5: Verzuimverzekering (2) Werknemer

Bedrijfsarts

ReĂŻntegratiebedrijf / Arbodienst

Werkgever

Verzekeraar


Mag de verzuimverzekeraar de gegevens van zijn eigen reĂŻntegratiedienst gebruikten?

Toestemming?

Wettelijke verplichting?

Vitaal of gerechtvaardigd belang?

Pseudonimiseren

Anonimiseren

Niet gebruiken

34


Casus conclusies • Technologische vooruitgang stelt ons in staat van micro tot macro niveau steeds gedetailleerdere analyses te maken • Belangrijke vragen als “willen we wel ons DNA geven aan service verlenende bedrijven?” en “mag een verzekeraar wel bij je in de achtertuin kijken zonder dat je het beseft?” • Waar raken mensen de controle kwijt over wat er met hun persoonsdata gebeuren kan? • Waar handelt de verzekeraar in het belang van de verzekerden en waar gaat hij over de grens?


Conclusies • Data kan geanonimiseerd worden, maar dat kan niet in alle gevallen en is soms erg gecompliceerd én foutgevoelig • Het delen van data hoeft niet alleen een bedreiging te zijn voor de privacy, maar kan bijvoorbeeld ook levens redden! • De actuaris en econometrist moet aanvoelen of dataanalyseprojecten wel of niet ethisch zijn • Moet de klant voldoende op de hoogte zijn van de data die de verzekeraar ter beschikking heeft van hem/haar? Of is de premie-black box te concurrentiegevoelig voor het delen van deze informatie?


Einde

37


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.