Issuu on Google+

Analyse sozialer Bindungen Ăœber Netzwerkdaten zu mehr Kundenwissen

mayato White Paper von Peter Gerngross


Analyse sozialer Bindungen: Ăœber Netzwerkdaten zu mehr Kundenwissen

Notizen

Seite 20


Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen von Peter Gerngross

Kurzzusammenfassung Durch Web-Communities wie Facebook oder Xing sind soziale Netzwerke in aller Munde. Die Methoden zur Analyse der Netzwerkdaten („Social Network Analysis“, kurz SNA) werden immer ausgereifter. Auch große Software-Häuser bieten inzwischen entsprechende Lösungen an. Unternehmen können von dieser Entwicklung profitieren, indem sie soziale Verbindungen ihrer Kunden gezielt analysieren. Die durch SNA gewonnenen Informationen können in vielen Bereichen genutzt werden: Im Marketing können mit SNA-Methoden beispielsweise Multiplikatoren im Kundenbestand identifiziert werden. Die zentrale Steuerungsgröße Kundenwert kann mit Hilfe von Netzwerk-Analysen genauer bestimmt werden. Bei der Risikosteuerung und im Betrugsmanagement kann die SNA ebenfalls einen wichtigen Beitrag leisten. So können z.B. Ausfallrisiken im Großkundenbereich oder Betrugsringe mit SNA neu evaluiert bzw. ermittelt werden. Bei der Entwicklung von Data-Mining-Modellen tragen durch SNA gewonnene Kennzahlen zur Modellqualität und somit zur Vorhersage-Genauigkeit der Modelle bei. Das Whitepaper geht nach einer kurzen Einführung in die Analyse sozialer Netzwerke auf konkrete Anwendungsmöglichkeiten im Unternehmen ein und zeigt auf, welche bereits vorhandenen Datenquellen für diesen Zweck genutzt werden können. In den zwei abschließenden Kapiteln werden die IT-technische Umsetzung der SNA sowie einige Methoden und Kennzahlen im Detail erläutert.

© mayato® GmbH. Alle Rechte vorbehalten.

Seite 1


Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

1 Einführung Durch Web-Communities wie Facebook oder Xing sind (virtuelle) soziale Netzwerke in aller Munde. Die Methoden zur Analyse der Netzwerkdaten, die seit den 1950er Jahren entwickelt worden waren, werden immer ausgereifter. Wie können sich Unternehmen diese Entwicklungen zunutze machen, auch wenn sie keine großen Internet-Communities unterhalten? Unternehmen betrachten ihre Kunden heute zumeist als Individuen, sei es im Privat- oder im Firmenkundengeschäft. Der einzelne Kunde wird isoliert gesehen, während seine Interaktionen und Kommunikation mit anderen Kunden weder im Marketing noch in der Kundenbetreuung oder im Risikomanagement berücksichtigt werden. In den Kundenbeständen größerer Unternehmen sind jedoch Netzwerke vorhanden. Kunden kennen sich, sind verwandt oder befreundet und kommunizieren miteinander. Sie sprechen auch über die Erfahrungen, die sie als Kunden mit dem Unternehmen machen, über Werbung, die sie erhalten, über neue Produkte und Angebote. Firmenkunden können wirtschaftlich verbunden sein, z.B. über Konzernverflechtungen und Beteiligungen, aber auch durch Geschäftsbeziehungen. Diese Netzwerke gilt es zu identifizieren und zu nutzen. Die identifizierten Strukturen können beispielsweise genutzt werden, um das Potential einzelner

Seite 2

Kunden als Multiplikatoren für das Marketing zu nutzen. Multiplikatoren sind Personen, die aufgrund ihres großen Netzwerks oder ihres Einflusses auf Bekannte und Freunde geeignet sind, Informationen und Angebote zu verbreiten. Weitere Anwendungen von Netzwerken ergeben sich im Risikomanagement – Microcredits sind ein Beispiel dafür, wie Netzwerke zur Risikoreduzierung genutzt werden – sowie bei der Kundenwertsteuerung. Es gibt viele Möglichkeiten, Verbindungen zwischen Kunden festzustellen. Im Privatkundenbestand einer Bank etwa kann man Netzwerke identifizieren, indem man Gemeinschaftskonten, Bevollmächtigungen und Freistellungsauftragspartner betrachtet. Bei Telekommunikationsunternehmen können Telefon- und SMS-Verbindungsdaten genutzt werden. Über Namens- und Adressanalysen werden Familienverbünde und Hausgemeinschaften identifiziert. Kundenempfehlungsprogramme liefern gute Hinweise auf persönliche Bekanntschaften. In diesem White Paper wird beschrieben, auf welche Weise die Analyse von Netzwerken für das Unternehmen Nutzen stiften kann. Es wird aufgezeigt, welche Arten von Beziehungen zwischen Kunden es geben kann und aus welchen Datenquellen diese ermittelt werden können. Nach der Beschreibung eines möglichen Datenmodells zur Speicherung von Netzwerken anhand eines einfachen Beispiels werden dann noch verschiedene Analysemethoden und Visualisierungstechniken beleuchtet.

© mayato® GmbH. Alle Rechte vorbehalten.


Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

2 Anwendung und Nutzen von Netzwerken 2.1 Kunden als Multiplikatoren Die Kenntnis von Netzwerken innerhalb des Privatkundenbestandes kann vor allem im Marketing, aber auch in anderen Bereichen des Unternehmens genutzt werden. Manche Kunden sind sehr wichtig für das Unternehmen, und zwar nicht (nur), weil sie besonders viel zum Umsatz beitragen, sondern wegen ihrer sozialen Kontakte zu anderen Kunden. Im seinem Buch „The Tipping Point“ [1] unterscheidet Malcolm Gladwell drei Typen von Netzwerkteilnehmern, die besonders wichtig bei der Verbreitung von Nachrichten sind:

› „Konnektoren“, die sehr viele Verbindungen zu anderen Individuen haben, › „Experten“, die das Netzwerk mit neuen Informationen versorgen, und › „Verkäufer“, die andere von einer Sache überzeugen können. Speziell Konnektoren und Verkäufer fungieren dann als Multiplikatoren, um die gewünschte Botschaft weiter im Kundenbestand zu kommunizieren. Hat man diese Schlüsselfiguren in seinem Netzwerk identifiziert, so ist man in der Lage, mit relativ wenig Aufwand einen großen Teil seiner Kunden zu erreichen. Ein wichtiger Aspekt dabei ist, dass durch diese Form der Kommunikation die Information glaubwürdiger vermittelt wird, als dies durch Massenkommunikation des Unternehmens jemals möglich wäre. Einem guten Bekannten oder Freund glaubt man im Normalfall eher als einem anonym bleibenden Unternehmen — selbst bei noch so persönlich gestalteter Werbung. Informationen, die durch das Netzwerk weitergegeben werden, bleiben dem Informationsempfänger außerdem oft besser und länger im Gedächtnis, als dies z.B. bei einem Brief des Unternehmens der Fall wäre (falls der Brief überhaupt gelesen wird). Im Umgang mit diesen Schlüsselfiguren im Netzwerk ist es besonders wichtig, im Voraus die Wirkung einer Marketing-Maßnahme oder Kommunikation richtig einzuschätzen. Ein Negativ-Beispiel in diesem Zusammenhang ist ein großes Software-

© mayato® GmbH. Alle Rechte vorbehalten.

Unternehmen, das bekannten Bloggern Laptops schenkte, auf denen die neueste Software des Unternehmens installiert war. Diese Aktion wurde in den angesprochenen Kreisen vielfach als Bestechungsversuch ausgelegt, was in den einschlägigen Blogs und Foren auch prominent diskutiert wurde. Der Plan des Unternehmens, die Blogger als Multiplikatoren einzusetzen, war damit zwar aufgegangen, jedoch war die multiplizierte Botschaft der beabsichtigten Botschaft genau entgegengesetzt. Wie man es besser macht, zeigt ein klassisches Beispiel: Das Unternehmen Tupperware baut seinen Vertrieb fast ausschließlich auf Multiplikatoren auf. Kunden laden Freunde und Bekannte zu „Tupperparties“ zu sich nach Hause ein. Dort werden von einem Tupperware-Mitarbeiter neue und bewährte Produkte vorgestellt, die direkt vor Ort bestellt werden können. Der Ausrichter der Party (der „Multiplikator“) erhält - abhängig vom Gesamtumsatz der Party - einen Warengutschein von Tupperware. Der Gastgeber bekommt eine zusätzliche Prämie für jeden Gast, der seinerseits eine Party ausrichtet. Durch dieses Anreizsystem werden systematisch über die Netzwerke zufriedener Kunden neue Kunden gewonnen. Manchmal sollen besondere Angebote nicht im gesamten Kundenbestand kommuniziert werden, sondern nur selektiv in bestimmten Kundensegmenten. Ebenso kommt es vor, dass unterschiedliche Ausgestaltungen eines Angebots in unterschiedlichen Kundensegmenten kommuniziert werden sollen. In beiden Fällen sind u.U. die Grenzen persönlicher Netzwerke zu beachten, da diese nicht in allen Fällen entlang der bisher verwendeten Segmentgrenzen laufen. Ein für eine Zielgruppe bestimmtes Sonderangebot (z.B. besonders günstige Zinskonditionen) könnte unbeabsichtigt auch Personen außerhalb dieser Zielgruppe erreichen und so schlimmstenfalls den Profit in anderen Kundensegmenten reduzieren. Ist die Netzwerkstruktur des Kundenbestandes bekannt, so kann und sollte darauf geachtet werden, dass die Mitglieder desselben Netzwerk-Clusters das gleiche Angebot erhalten bzw. dass, wenn ein Cluster-Mitglied das Angebot aus bestimmten Gründen nicht erhalten soll, auch die anderen Mitglieder das Angebot nicht erhalten.

Seite 3


Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

2.2 Kundenwert Für den Kundenwert und seine Bestimmung spielt das Netzwerk der Kunden ebenfalls eine wichtige Rolle. Bei der Bestimmung des Kundenwertes kann man grob zwischen zwei Arten unterscheiden (siehe auch [2]): › Direkte Beiträge entstehen aus der unmittelbaren Geschäftsbeziehung des Kunden mit dem Unternehmen. Dieses Ertragspotential berechnet sich aus den abgezinsten zukünftig erwarteten Deckungsbeiträgen des Kunden. Diese beinhalten – ausgehend vom derzeitigen Geschäftsvolumen – erwartete Preiserhöhungen sowie ggfs. eine Steigerung der Kauffrequenz oder des Kaufvolumens. › Indirekte Beiträge entstehen durch Aktivitäten des Kunden, die sich nicht direkt als Deckungsbeitrag beziffern lassen, jedoch auf mittelbare Weise Wert für das Unternehmen schaffen. Beispiele für indirekte Beiträge umfassen das Informationspotenzial (Produktideen, Verbesserungsvorschläge, Beschwerden), das Kooperationspotenzial (bspw. können Kunden an der Produktentwicklung beteiligt werden) und – im Zusammenhang mit Netzwerken besonders wichtig – das Weiterempfehlungspotenzial.

Das Weiterempfehlungspotenzial eines Kunden wird im Wesentlichen von zwei Einflussgrößen getrieben. Zum einen – dies ist die Grundvoraussetzung – muss der Kunde bereit sein, das Unternehmen weiterzuempfehlen. Dies setzt eine hohe Kundenzufriedenheit bzw. –loyalität voraus. Zum zweiten aber ist das persönliche Netzwerk des Kunden und die Rolle, die er darin einnimmt, entscheidend für die Höhe seines Weiterempfehlungspotenzials. Je größer das Netzwerk, desto höher ist auch das Empfehlungspotenzial – vorausgesetzt, die Empfehlungsbereitschaft ist vorhanden. Für den Kundenwert wird das Weiterempfehlungspotenzial immer wichtiger, was Beispiele aus unterschiedlichen Branchen belegen. Die comdirect bank AG etwa schreibt in ihrem Geschäftsbericht für 2007: „Immer bedeutender wird zudem die Empfehlungsbereitschaft unserer Kunden. Über das Programm ‚Kunden werben Kunden‘ haben wir im Jahr 2007 etwa doppelt so viele Neukunden gewonnen wie im Vorjahr.“ Eine Studie der Eismann Tiefkühl-Heimservice GmbH zeigte, dass 100 zufriedene Kunden durchschnittlich 30 neue Kunden anwerben [3].

[Abbildung 1: Komponenten des Kundenwertes]

Seite 4

© mayato® GmbH. Alle Rechte vorbehalten.


Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

Der Kundenwert ist die zentrale Steuerungsgröße des CRM – dessen umfassende und stimmige Berechnung ist somit von essenzieller Bedeutung, um die Kundenbeziehungen eines Unternehmens effizient lenken und gestalten zu können. Nur so kann eine sinnvolle Allokation der kundenbezogenen Marketingausgaben sichergestellt werden. Fehleinschätzungen des Kundenwertes können die Marketing-Effizienz erheblich reduzieren. Daher gilt es, den Kundenwert vollständig zu erfassen. Wie oben gezeigt, ist das Weiterempfehlungspotenzial eine wichtige Komponente des Kundenwerts und darf bei dessen Bestimmung nicht vernachlässigt werden. Der Analyse des KundenNetzwerkes kommt also auch für die MarketingSteuerung eine wichtige Bedeutung zu.

2.3 Risikosteuerung Soziale Verbindungen und insbesondere Familienverbünde sind geeignet, die Risikosteuerung in einem Unternehmen zu verfeinern. Offensichtlich ist, dass Dubletten im Privatkundenbestand, also mehrere Kundenbeziehungen, hinter denen eine einzige Person steht, besonders aus Risikogesichtspunkten zusammengefasst und im ganzen gesehen werden müssen. Das Unternehmen sollte immer das gesamte Kreditengagement einer Person betrachten. Dieses Konzept des Gesamtengagements lässt sich erweitern auf Familienverbünde. Da Familien oft eine wirtschaftliche Einheit bilden, muss das Kreditengagement bzw. das daraus resultierende Risiko im Gesamten betrachtet werden. Familiäre oder andere Verbindungen können sowohl negative wie auch positive Einflüsse auf die erwartete Bonität eines Kunden haben. Wenn für einen Kunden in der Vergangenheit schon ein Mahnverfahren oder sogar ein Zahlungsausfall zu verzeichnen war, so wird eine Bank zögern, einem Familienangehörigen Kredit einzuräumen – sofern die Familienzugehörigkeit erkannt wird. Auf der anderen Seite kann sich eine gute Kredithistorie auch positiv auf Kreditentscheidungen von Familienangehörigen auswirken. Bei größeren Krediten würde man dies zwar mittels einer Bürgschaft vertraglich absichern, bei Kleinkrediten jedoch wäre die Berücksichtigung der Kredithistorie im Netzwerk des Kunden sicherlich eine kostengünstige Alternative.

© mayato® GmbH. Alle Rechte vorbehalten.

Nicht nur Familienverbünde, sondern auch andere soziale Bindungen können die Bonität fördern und die Zahlungsmoral steigern. Dies zeigt ein Konzept aus der Dritten Welt, das derzeit auch in Industrienationen Fuß fasst: Microcredits. In der ursprünglichen Ausprägung handelt es sich dabei um Kredite etwa in der Größenordnung 100 bis 1.000€, die von einer Bank an Kleinstgewerbetreibende vergeben werden. Die Kreditnehmer sind sehr oft in Dorfgemeinschaften eingebunden; die Koordination vor Ort übernimmt eine Person aus demselben Dorf, die auch die pünktliche Rückzahlung überwacht. Dieses enge soziale Netz bewirkt eine erhebliche Reduzierung des Risikos. Dieses Beispiel zeigt, dass soziale Bindungen nicht nur als Bonitätsindikator geeignet sind, sondern sogar die Bonität steigern können.

2.4 Risikosteuerung im Firmenkundenbereich Abhängigkeiten zwischen Unternehmen können unterschiedliche Ursachen haben. Zum einen gibt es natürlich Kapitalbeteiligungen und Konzernverflechtungen. Aber auch Kunden-LieferantenBeziehungen können zu Abhängigkeiten führen. Diese sind umso stärker, je weniger Kunden bzw. Lieferanten ein Unternehmen hat bzw. je größer der Umsatzanteil einzelner Kunden ist. Man denke z.B. an Zulieferer der Automobilindustrie, die oft nur einen Abnehmer für ihre Produkte haben. Finanzielle Beziehungen und Abhängigkeiten zwischen Unternehmen führen zu Abhängigkeiten der Kreditrisiken. Ist beispielsweise der Erfolg von Unternehmen A von Unternehmen B ganz oder teilweise abhängig, so erhöht sich das Kreditausfallrisiko von A dramatisch, wenn B in wirtschaftliche Schwierigkeiten gerät. Das wirtschaftliche Netzwerk eines Unternehmens ist also ein nicht zu unterschätzender Faktor bei der Bestimmung des Risikos. Die Struktur des Netzwerks eines Unternehmens spielt eine große Rolle für die Anfälligkeit für extern verursachte Risiken. Im Extremfall kann bei hochvernetzten Unternehmen das ganze Netzwerk zusammenbrechen, wenn nur ein Unternehmen in Schwierigkeiten gerät. Man spricht dabei auch von „credit contagion“, also der „Ansteckung“ von Krediten.

Seite 5


Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

In diesem Zusammenhang sind auch Verflechtungen von Unternehmen und Privatpersonen erwähnenswert. Hat der Geschäftsführer eines mittelständischen Familienunternehmens privat ein Hypothekendarlehen bei der Hausbank seiner Firma, so sind die Ausfallrisiken der beiden Engagements hochgradig verknüpft. Dies gilt besonders für Personengesellschaften und deren persönlich haftende Gesellschafter. Auch solche Verbindungen sollten deshalb bei der Risikosteuerung betrachtet werden. Aus den genannten Gründen ist es wichtig, nicht nur das Netzwerk, in das ein Kunde eingebunden ist, zu identifizieren, sondern auch die Struktur des Netzwerks und die Rolle, die der Kunde darin spielt, zu analysieren. Wie später noch im Detail gezeigt wird, stehen dafür moderne Methoden zur Verfügung, die von der Visualisierung bis zur Ermittlung von Kenngrößen reichen. Die Erfassung der Risiken, die aus der wirtschaftlichen Verknüpfung von Unternehmen entstehen, ist für Banken nicht nur ein Gebot der Ökonomie, sondern auch aufsichtsrechtlich verpflichtend. Derartige Risiken stellen nach den von der Bundesanstalt für Finanzdienstleistungsaufsicht vorgegebenen „Mindestanforderungen an das Risikomanagement“ (MaRisk) Konzentrationsrisiken dar, die bei der Risikoermittlung zu berücksichtigen sind.

2.5 Betrugserkennung und -bekämpfung Das Problem krimineller Handlungen von Kunden, aber auch von Mitarbeitern und Geschäftspartnern wird gerade in wirtschaftlich schwierigen Zeiten immer bedeutender [4]. Auch in diesem Bereich lassen sich über die Identifikation von Kundennetzwerken Risiken reduzieren. Bei der Betrugserkennung (siehe Abb. 2) verlassen sich Unternehmen bisher häufig auf das Fachwissen und die Intuition erfahrener Mitarbeiter. Ein großer Teil des Aufwands entfällt dabei auf die passive Überprüfung von externen (z.B. Polizei/ Staatsanwaltschaften) oder internen (z.B. Inkassoabteilung) Hinweisen auf Unregelmäßigkeiten. Die aktive, präventive Untersuchung kann nur für einen kleinen Teil der Verträge, z.B. für die besonders hochvolumigen Fälle, vorgenommen werden.

Seite 6

Deshalb ist eine automatisierte, computergestützte Betrugserkennung unabdingbar. Herkömmliche hypothesengetriebene Verfahren umfassen zum einen die regelmäßige Erstellung beschreibender Reports, die auf Auffälligkeiten untersucht werden. Zum anderen kann die Erfahrung der Betrugsexperten in Regeln übersetzt werden, aus denen dann Verdachtsfälle abgeleitet werden. Betrugstypische Verhaltensmuster sind sehr komplex, deshalb sind Expertenregeln oft zu grob. Klassische Data-Mining-Techniken können diese komplexen Muster aufdecken und sind sehr gut geeignet, potenzielle Betrugsfälle zu identifizieren. So kann maschinell eine große Anzahl von Fällen auf diese typischen Muster untersucht werden. Die auf diese Weise gefundenen Verdachtsfälle können dann einer manuellen Prüfung durch Experten unterzogen werden. Mit dieser Methode findet man allerdings nur den Teil der Betrugsfälle, bei denen sich der Betrüger „typisch“ verhält. Weitere Fälle, bei denen dies nicht zutrifft, können durch den Einsatz von SNATechniken aufgedeckt werden. Ausgehend von einem erkannten Betrugsfall kann man etwa das lokale Netzwerk des entlarvten Betrügers nach weiteren Auffälligkeiten durchsuchen. So wird der Suchraum erheblich eingeschränkt und die Chancen, bislang unentdeckte Fälle zu finden, steigen erheblich. Neben der Untersuchung des Netzwerkes in einem konkreten Betrugsfall kann auch die Mustererkennung in Netzwerken („Graph Mining“) zu wertvollen Erkenntnissen führen. Im Gegensatz zum Data Mining werden hier nicht Muster im Verhalten von Kunden untersucht, sondern Muster in der Struktur des Netzwerkes bestimmter Kunden - nämlich der bekannten Betrüger. Die Fragestellung ist also: Wie ist typischerweise ein Betrügernetzwerk strukturiert? Basis solcher Analysen sind also immer erkannte Betrugsfälle. Die identifizierten Muster können dann wiederum genutzt werden, um weitere kriminelle Handlungen schon frühzeitig zu erkennen und damit Schaden zu vermeiden.

© mayato® GmbH. Alle Rechte vorbehalten.


Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

[Abbildung 2: Methoden der Betrugserkennung]

2.6 Data Mining In Vorhersagemodellen wird versucht, ein Ereignis (z.B. einen Kreditausfall) durch Informationen, die schon vor dem Eintritt des Ereignisses bekannt waren, statistisch zu erklären. Das resultierende DataMining-Modell wird dann benutzt, um aufgrund der erklärenden Merkmale das Eintreten des modellierten Ereignisses für neue Fälle (z.B. noch laufende Kredite) zu prognostizieren. In herkömmlichen Data-Mining-Modellen umfassen die erklärenden Merkmale demographische Informationen (z.B. Alter, Geschlecht) sowie Merkmale, die aus dem Geschäftsverhältnis mit dem Kunden abgeleitet werden (z.B. Entwicklung des Kontosaldos, Anzahl Kontotransaktionen, Anzahl Kundenkontakte, Produktnutzung). Die Position eines Kunden in seinem Netzwerk ist ein Spiegel seines (Kommunikations-) Verhaltens. Kundenkennzahlen und -merkmale, die aus dem Netzwerk abgeleitet werden, können also Informationen enthalten, die in herkömmlichen Kundenmerkmalen nicht enthalten sind und deshalb im Rahmen eines Data-Mining-Modells wertvolle Beiträge liefern. Einige Beispiele für solche netzwerkbasierten Merkmale werden in Kapitel 5 dieses Whitepapers erläutert.

© mayato® GmbH. Alle Rechte vorbehalten.

3 Analyse von Beziehungen zwischen Kunden Um Informationen über Kundennetzwerke nutzen zu können, müssen diese Informationen zunächst datentechnisch erschlossen werden. In vielen Fällen liegen Daten über Kundenverbindungen schon vor oder können mit wenig Aufwand aus vorliegenden Daten abgeleitet werden. In diesem Kapitel werden einige Möglichkeiten aufgezeigt, wie Verbindungsdaten erschlossen werden können. Eine Auflistung zusätzlicher Datenquellen für einige weitere Branchen ist in Tabelle 4 (Anhang) zu finden.

3.1 Identische Personen Die engste Form der Beziehung zwischen Kunden ist die Identität vermeintlich unterschiedlicher Personen oder Organisationen. Die Ursachen für Dubletten sind vielfältig, liegen aber praktisch immer in der unzureichenden Behandlung von Kundendaten in den erfassenden Prozessen. Viele Freitextfelder, aber auch mangelhafte Anweisungen für Sachbearbeiter und das Fehlen eines Datenqualitätsmanagements führen dazu, dass derselbe Kunde mehrfach erfasst wird, in der Regel mit leichten Abweichungen in Schreibweisen von Namen oder Adressen oder auch mit unterschiedlichen Kontaktdaten (z.B. mit unterschiedlichen Emailadressen oder im Feld „Telefon“ mal mit der Festnetz-, mal mit der Mobilnummer).

Seite 7


Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

Vorname

Nachname

PLZ

Ort

Straße

Hausnummer

Johann

Muster

13507

Berlin

Marktstr.

35a

Johan

Mutter

13507

Berlin

Marktstraße

35a

[Tabelle 1: Dublette]

Gute CRM-Systeme helfen, solche Probleme schon bei der Eingabe zu erkennen und zu vermeiden. Namensänderungen (durch Heirat oder Scheidung), Umzüge, wechselnde Telefonanbieter oder Kontonummern oder andere reale Veränderungen auf Kundenseite können es aber auch solchen Systemen schwer machen, die Identität eines vermeintlichen Neukunden mit einem vorhandenen Eintrag im Kundenstamm zu erkennen.

Bei der Analyse von Kundenbeziehungen besteht daher in jedem Fall der erste Schritt darin, den Kundenbestand auf die Existenz von Dubletten zu überprüfen. Da Dubletten nicht immer offensichtlich sind bzw. nicht immer durch einfachen StringVergleich ermittelt werden können (siehe Tabelle 1), sollte eine spezialisierte DublettenerkennungsSoftware eingesetzt werden, die Identitäten auf Basis von Ähnlichkeiten bzw. phonetischer Identität feststellt. Eine Liste mit Software-Anbietern für den Dublettenabgleich ist in Tabelle 5 im Anhang zu finden.

3.2 Familienverbünde Hat man Dubletten identifziert und ggf. eliminiert, so ist der denkbar engste soziale Kontakt derjenige mit den eigenen Haushalts- oder Familienangehörigen. In diesem Kreis ist die Kommunikationsdichte und das Vertrauen in die Richtigkeit der vermittelten Information im Allgemeinen sehr hoch. Gleichzeitig sind Familienangehörige auch finanziell und rechtlich eng verbunden, was insbesondere bei Potential- und Risikoanalysen eine große Rolle spielen kann. Deshalb ist es für ein Unternehmen wichtig, Familien- und Haushaltsverbünde im Kundenbestand zu erkennen.

sind schnell offensichtlich, wenn man sich die zunehmende Zahl von Sozialgemeinschaften ins Bewusstsein ruft, die nicht der traditionellen Familie mit einem einheitlichen Namen entsprechen. Weder unverheiratet zusammenlebende noch verheiratete Personen mit unterschiedlichem Namen werden durch diesen Ansatz erkannt. Auch Kinder aus früheren Ehen oder anderen Partnerschaften tragen oft abweichende Nachnamen und lassen sich so nicht ohne weiteres den Familien zuordnen, in denen sie leben. Das Beispiel in Tabelle 2 macht deutlich, was eine intelligente Dubletten-Software hier leisten muss: Johann und Monika sind verheiratet. Die Software muss die beiden auch als einer Familie zugehörig erkennen, da sie die gleiche Adresse und zumindest teilweise gleiche Nachnamen haben. Marie, die Tochter von Monika aus einer früheren Beziehung, muss über den zweiten Teil des Doppelnamens von Monika ebenfalls der Familie zugeordnet werden. Gibt Monika nur einen Teil ihres Nachnamens an, so ist eine vollständige Erkennung der Familie nicht möglich. Ein weiteres Problem besteht darin, dass häufige Namen (z.B. Müller oder Schmidt) in großen Wohnanlagen auch mehrfach vorkommen können, ohne dass eine familiäre Verbindung besteht. Auch erwachsene Kinder, die nicht mehr im Haus der Eltern leben, oder Ehepartner, die aus beruflichen Gründen zwei verschiedene Wohnungen haben, können nicht korrekt zugeordnet werden. Durch Einbeziehen zusätzlicher Kontaktinformationen (z.B. Mobilnummer, Faxnummer, Emailadresse) oder Personendaten (z.B. Geburtsdatum, Geburtsort) lassen sich nicht in allen Fällen die entgangenen Verbindungen herausfinden.

Zur Ermittlung von Familienverbünden kann als einfachster Ansatz ebenfalls DublettenerkennungsSoftware eingesetzt werden. Dabei führt man eine Dublettenprüfung auf Basis des Nachnamens und der Adresse durch. Die Grenzen dieses Ansatzes

Seite 8

© mayato® GmbH. Alle Rechte vorbehalten.


Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

Vorname

Nachname

PLZ

Ort

Straße

Hausnummer

Johann

Muster

13507

Berlin

Marktstr.

35a

Johan

Mutter

13507

Berlin

Marktstraße

35a

Monika

Muster-Mann

13507

Berlin

Marktstraße

35a

Marie

Mann

13507

Berlin

Marktstraße

35a

[Tabelle 2: Familienverbund]

Banken haben glücklicherweise weitergehende Möglichkeiten, Familienverbünde zu erkennen: › Minderjährigenkonten: Ist der Kontoinhaber minderjährig, so müssen die Eltern ihre Zustimmung zur Kontoeröffnung geben. Oft sind die Eltern auch handlungsbevollmächtigt für das Minderjährigenkonto. So hat die Bank einen sicheren Hinweis auf den Familienverbund. › Freistellungsaufträge: Bei gemeinsamer steuerlicher Veranlagung von Ehepartnern kann ein gemeinsamer Auftrag zur Freistellung von der Abgeltungssteuer erteilt werden. Die beiden beteiligten Personen sind also mit Sicherheit verheiratet. › Gemeinschaftskonten (Konten mit mehreren gleichberechtigten Inhabern): Häufig sind die Inhaber Ehepartner oder familiär verbunden, z.B. Eltern und deren (volljährige) Kinder. Da dies jedoch nicht zwingend der Fall sein muss, kann hier ein Abgleich über Nachnamen bzw. über Nachnamen und Adresse Klarheit bringen. › Gemeinsame Referenzkonten: Depots, Tagesgeldkonten etc. benötigen in vielen Fällen ein Girokonto als Referenzkonto.

Ein gemeinsames Referenzkonto weist auf eine familiäre Verbindung hin. Auch aus dem Kundenverhalten (d.h. einzelnen Transaktionen) und bestimmten vertraglichen Konstellationen (z.B. Bürgschaften) lassen sich Indizien für Familienverbünde – wiederum natürlich auch andere Beziehungen – ableiten. Allerdings sei an dieser Stelle darauf hingewiesen, dass Analysen dieser Art in vielen Ländern einen Verstoß gegen geltendes Datenschutzrecht darstellen können. So darf beispielsweise zu werblichen Zwecken eine Bank in Deutschland keine Transaktionsdaten auswerten. Ein weiteres Problem wird bei Hinzunahme solcher Arten von Informationen deutlich: Je mehr Faktoren in eine Analyse einbezogen werden sollen, desto größer wird das Volumen an Daten und desto umfangreicher der Raum an möglichen Hypothesen für eine konfirmative Datenanalyse. In vielen Fällen wird man nicht mehr ohne explorative Verfahren auskommen, die von sich aus in den vorhandenen Daten aktiv nach relevanten Mustern suchen und den Analysten auf interessante Konstellationen aufmerksam machen (Data Mining, Text Mining).

Vorname

Nachname

PLZ

Ort

Straße

Hausnummer

Johann

Muster

13507

Berlin

Marktstr.

35a

Johan

Mutter

13507

Berlin

Marktstraße

35a

Monika

Muster-Mann

13507

Berlin

Marktstraße

35a

Marie

Mann

13507

Berlin

Marktstraße

35a

Franz

Vogel

13507

Berlin

Marktstr.

35a

[Tabelle 3: Hausverbund]

© mayato® GmbH. Alle Rechte vorbehalten.

Seite 9


Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

3.3 Hausverbünde Zumindest in Wohnhäusern, die höchstens von zwei bis drei Parteien bewohnt werden, kennen sich die Hausbewohner untereinander. Um die zunehmenden Probleme bei der Ermittlung von Familienverbünden zu umgehen, werden Kunden oft als sozial verbunden eingestuft, wenn sie im selben Haus wohnen. Dafür wird eine Dublettenprüfung auf Hausebene durchgeführt, in der nur auf Identität von postalischen Adressen geprüft wird. Zum Beispiel werden alle Kunden aus Tabelle 3 demselben Hausverbund zugeordnet und damit als „sozial verbunden“ eingestuft. Dieses Vorgehen hat wiederum den Nachteil, dass u.U. Personen zusammengefasst werden, die sich gar nicht kennen, z.B. in großen Mehrfamilienhäusern. Als Mischform zwischen Familien- und Hausverbund bietet sich an, die Dublettenprüfung auf Hausebene nur für Häuser mit (z.B.) höchstens vier Wohneinheiten durchzuführen und nur bei größeren Mehrfamilienhäusern auf Familienverbünde zu prüfen. Spezialisierte Dienstleister (siehe Tabelle 6 im Anhang) bieten die dafür notwendigen Daten (Anzahl Wohneinheiten pro Haus) an.

3.4 Freunde und Bekannte Ende der 1960er Jahre untersuchte der Soziologe Mark Granovetter mittels einer Umfrage, wie Menschen zu ihren jeweiligen Jobs kommen [5]. Er kam zu dem überraschenden Ergebnis, dass die entscheidenden Informationen nicht von engen Freunden, sondern von entfernten oder flüchtigen Bekannten kommen. Dieses Beispiel zeigt, wie wichtig es ist, nicht nur enge soziale Kontakte, sondern alle erkennbaren Verbindungen zu identifizieren. Viele Unternehmen setzen zur Neukundengewinnung Empfehlungsprogramme ein. Der im Rahmen eines solchen Programms geworbene Kunde und der werbende Kunde kennen sich offensichtlich. Hier ergibt sich ein neuer Aspekt, der in den bisher behandelten Beziehungsarten nicht vorhanden war: die Beziehung ist nicht symmetrisch. Der Werber hat Einfluss auf den Geworbenen, der Geworbene vertraut der Empfehlung des Werbers. Diese Asymmetrie lässt sich z.B. ausnutzen, indem der Werber gezielt als Multiplikator eingesetzt wird.

Diese „Berufswerber“ sollten identifiziert und die entsprechenden Beziehungen nicht für die Netzwerk-Erkennung berücksichtigt werden. Das gleiche gilt für die Werbung im Familienkreis. Hier zieht man nicht die Kundenwerbung, sondern die Familienbeziehung als Verbindung heran. Unternehmenseigene Internet-Communities lassen sich ebenfalls als Informationsquelle für KundenBeziehungen nutzen. Beispielsweise betreiben große Online-Banken und Medienhäuser vielbesuchte Finanzseiten wie www.comdirect.de oder www. wallstreet-online.de, die auch eine Community bzw. Foren enthalten. Dort tauschen sich die Nutzer über Finanzthemen aus. Viele der Nutzer sind auch Kunden der entsprechenden Banken. Foren-Threads können zur Ermittlung von Beziehungen genutzt werden. Alle Autoren innerhalb eines Threads könnten als „miteinander bekannt“ definiert werden. Voraussetzung für die Nutzung der daraus entstehenden Daten für die Erkennung von Bekanntschaften ist, dass sich datentechnisch der Community-User der Person im Kundenbestand zuordnen lässt. Diese Art der Bekanntschaft ist jedoch weitaus schwächer als die vorher genannten Arten, aber – wie oben erwähnt – deshalb nicht weniger wichtig. Nicht wenige Firmen analysieren daher schon heute die firmeneigenen Blogs oder öffentliche Internetforen mit Hilfe automatisierter Verfahren wie Text Mining und können so nicht nur Aussagen über Multiplikatoren und deren Beziehungen treffen, sondern auch noch deren Relevanz ermitteln, also z.B. ob sich jemand kritisch oder lobend gegenüber einem bestimmten Produkt äußert. Der Vollständigkeit halber seien an dieser Stelle auch noch spezielle Beziehungen erwähnt, die schon immer eine besondere Rolle im Marketing gespielt haben: Berühmtheiten und Prominente haben definitionsgemäß große Netzwerke. Viele Menschen kennen sie (auch wenn diese Bekanntschaftsbeziehungen in den meisten Fällen einseitig sind). Deshalb empfiehlt es sich für Unternehmen, diese Berühmtheiten – seien es bekannte Sportler und Künstler, oder auch lokale Größen wie der Ortsbürgermeister oder der Wirt des Vereinsheims – systematisch zu erfassen, insbesondere wenn diese auch Kunden des Unternehmens sind.

In der Praxis kommt es manchmal vor, dass Kundenempfehlungsprogramme von findigen Personen nahezu gewerblich genutzt werden. Seite 10

© mayato® GmbH. Alle Rechte vorbehalten.


Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

Anders als bei den bisher genannten Beziehungen sind diese Beziehungen in den meisten Fällen nur vermutet, und nur einer der beiden „Beziehungspartner“ – nämlich der berühmte – ist dem Unternehmen bekannt.

3.5 Einschränkungen Nur ein kleiner Teil der tatsächlich vorhandenen Bekanntschaftsbeziehungen können von Unternehmen ermittelt und genutzt werden. Soziologen schätzen, dass jeder Mensch zwischen 200 und 5.000 Bekannte hat. Auch wenn man diese Bekanntschaften auf die für das Unternehmen relevanten Bekanntschaften reduziert, wird nur ein kleiner Teil erfasst werden können. Generell besteht das Problem, dass nur die positive Aussage „Die Kunden A und B kennen sich“ getroffen werden kann. Findet man in den Daten keine Hinweise auf eine Verbindung zwischen A und B, dann kann man sich nicht darauf verlassen, dass sich A und B nicht kennen. Es kann sein, dass sie sich kennen und dies aus den vorliegenden Daten nur nicht zu erkennen ist. Es darf also nur die positive Aussage genutzt werden; die Nutzung der negativen Aussage wäre ein Fehler. Wie bei jeder Form der Kundendatenverarbeitung spielt das Thema Datenschutz auch hier eine Rolle. Die datenschutzrechtliche Zulässigkeit sollte immer vor Nutzung des identifizierten Netzwerks geprüft werden. In jedem Fall sollte das Thema mit dem Datenschutzbeauftragten des Unternehmens besprochen und die grundsätzliche Nutzung der Daten sowie die geplanten Analysen von diesem freigegeben werden.

4 Ein Datenmodell für Netzwerke

Bspw. könnten Beziehungen zwischen Ehepartnern (gemeinsamer Freistellungsauftrag) das Gewicht 10 erhalten, während für Forums-Bekanntschaften das Gewicht 1 vergeben wird. Beispiel: In Abbildung 3 ist exemplarisch ein Kundenbeziehungsgeflecht dargestellt. Asymmetrische Beziehungen sind durch Pfeile dargestellt, die Stärke einer Beziehung ist als Liniengewicht vermerkt. Es sind verschiedene Beziehungsarten zu sehen:

› Kunde 1 hat den Kunden 2 geworben. › Die Kunden 4 und 7 sowie die Kunden 12 und 13 sind verheiratet (hohes Liniengewicht). › Kunde 13 hat im Forum einen Beitrag geschrieben; im selben Thread hat sich auch Kunde 10 beteiligt. › Kunde 20 wirbt viele Kunden, die aber untereinander nicht bekannt sind. Datentechnisch bietet sich eine Darstellung einer Linie als (geordnetes) Paar von Punkten an. Will man Liniengewichte einbeziehen, so werden diese als Attribut der Linie gespeichert. In einer relationalen Datenbank hat man also eine Tabelle, die die Punkte (Kunden) enthält, und eine zweite Tabelle, die die Linien (Beziehungen) in Form von jeweils zwei Punkten enthält. Eine dritte Tabelle enthält alle möglichen Verbindungsarten; dazu wird das Kantengewicht gespeichert, das die Stärke der Verbindung widerspiegelt. Beispiel: Kunde 4 ist mit dem Kunden 7 verbunden. Diese Verbindung ist in der Linientabelle (Abbildung 5) in der zweiten Zeile (line_id=2) gespeichert. Die linkType_id ist 1, was bedeutet, dass 4 und 7 Ehepartner sind, siehe Abbildung 6: Verbindungstyp-Tabelle. Dort ist auch zu sehen, dass das Gewicht für Ehe-Beziehungen 10 ist.

Kundennetzwerke können als mathematische Graphen verstanden werden. Jeder Kunde (Person) wird dabei als Punkt dargestellt. Besteht zwischen zwei Personen eine Beziehung, dann werden die jeweiligen Punkte durch eine Linie verbunden. Asymmetrische Beziehungen können durch Pfeile gekennzeichnet werden. Im Fall von Kundenwerbungen würde der Pfeil bspw. vom Werber zum Geworbenen zeigen. Die Stärke der Beziehung kann durch ein Liniengewicht angegeben werden. Je stärker die Beziehung, desto größer das Gewicht.

© mayato® GmbH. Alle Rechte vorbehalten.

Seite 11


Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

[Abbildung 3: Kundennetzwerk]

point_id

grad

cl_points

line_id

point1

point2

linkType_id

1

1

2

1

1

2

3

2

1

2

2

4

7

1

3

0

1

3

10

13

4

4

1

2

4

12

13

1

5

0

1

5

12

14

6

4

0

1

4

13

14

6

7

1

2

7

15

20

3

8

0

1

8

16

20

3

9

0

1

9

17

20

3

10

1

4

10

18

20

3

11

0

1

11

19

20

3

12

2

4

13

3

4

14

2

4

15

1

6

16

1

6

17

1

6

linkType_id

source_desc

18

1

6

1

Ehepartner

10

19

1

6

2

Familie

6

20

5

6

3

Kundenwerbung

4

21

0

1

4

Online

1

[Abbildung 4: Punktetabelle]

Seite 12

[Abbildung 5: Linientabelle]

weight

[Abbildung 6: Verbindungstyp-Tabelle]

© mayato® GmbH. Alle Rechte vorbehalten.


Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

5 Visualisierung und Kennzahlen Für die Anwendung der Netzwerkanalyse lassen sich drei Hauptrichtungen erkennen (siehe dazu auch [6]): › Die Analyse des Teilnetzwerkes eines Teilnehmers. Hier sind speziell Visualisierungstechniken gefragt, die dem Analysten schnell eine gute Übersicht über die Netzwerkstruktur gibt. › Die Berechnung von Kennzahlen und Merkmalen für jeden Netzwerkteilnehmer. Wichtig sind hier effiziente Berechnungsmethoden, da Netzwerke sehr groß sein können. › Die Bewertung der Interaktionsmöglichkeiten der Netzwerteilnehmern. Im Fokus stehen hier die Auswirkungen der Änderung von Eigenschaften eines Teilnehmers auf mit diesem verbundene Teilnehmer.

5.1 Kennzahlen und Merkmale von Netzwerkteilnehmern Nach dem Aufbau der im vorhergehenden Kapitel beschriebenen Netzwerk-Datenstruktur können jedem Kunden Kennzahlen zugewiesen werden, mit deren Hilfe seine Rolle im Netzwerk charakterisiert wird. Die wichtigste Kategorie von Kennzahlen bilden die Zentralitätskennzahlen. Diese sind Maße dafür, wie „wichtig“ einzelne Kunden im Netzwerk sind, sei es durch die Anzahl ihrer Verbindungen oder durch ihre strategische Rolle. Das einfachste Zentralitätsmaß ist die Kontaktanzahl. Sie gibt an, zu wie vielen anderen Kunden eine direkte Beziehung besteht. In Abbildung 3 ist die Kontaktanzahl als erste der beiden Kennzahlen bei den Punkten dargestellt.

Zu den Zentralitätsmaßen gehört weiterhin die „Betweenness“, ein Maß für die Bedeutung eines Kunden für die Weitergabe von Nachrichten. Um die Betweenness eines Kunden zu berechnen, wird ermittelt, an wie vielen Kommunikationswegen der betrachtete Kunde beteiligt ist - in Relation zu allen Kommunikationswegen. Eine Komponente ist eine Menge von durch Bekanntschaft verbundener Kunden. Dabei zählen nicht nur direkte Bekanntschaften, sondern auch Beziehungen über mehrere Stationen. Die Größe einer Komponente – als Kennzahl eines Kunden – ist also die Anzahl der anderen Kunden, mit denen er direkt oder indirekt verbunden ist (plus 1 für den Kunden selbst). Die Komponentengröße ist in Abb. 3 als zweite Kennzahl bei jedem Punkt angegeben. Beispiel: Im Netzwerk aus Abbildung 3 ist Kunde 13 direkt mit 3 anderen Kunden verbunden. Keiner dieser drei Kunden hat weitere Kontakte, so dass das Netzwerk, dem Kunde 13 angehört, aus vier Kunden besteht. Die Clustergröße des Kunden13 ist damit 4. Ist bei einem Kunden die Kontaktanzahl um 1 kleiner als die Clustergröße, dann kennt dieser alle Kunden in seinem Netzwerk. Dies ist z.B. für die Kunden 12 und 14 nicht der Fall, sie sind mit Kunde 10 nur indirekt über den Kunden 13 verbunden. Netzwerkteilnehmer mit einer Schnittstellenfunktion spielen in Netzwerken eine wichtige Rolle. Man sagt, ein Teilnehmer fungiert als Schnittstelle, wenn die Komponente des Teilnehmers ohne ihn in mehrere Teile zerfallen würde. Im Beispiel in Abbildung 7 fungieren die Kunden 4 und 5 als Schnittstellen.

Ist die Stärke der Verbindungen bekannt (Liniengewichte), so kann man, anstatt die Beziehungen zu zählen, die Summe der Liniengewichte bilden. Eine einfache Abwandlung der Kontaktanzahl misst nich nur direkte Kontakte, sondern zählt auch die Kontakte der Kontakte mit (Kontakte zweiten Grades).

[Abbildung 7: Schnittstelle]

© mayato® GmbH. Alle Rechte vorbehalten.

Seite 13


Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

Manche Netzwerke sind zwar zusammenhängend, d.h. jeder ist mit jedem durch eine Kette von Verbindungen verknüpft, es lassen sich aber dennoch Cluster identifizieren. Ein Cluster in diesem Sinne ist eine Gruppe von Punkten, die untereinander stark verbunden sind, die aber nur wenige Verbindungen nach „außen“ hat. Bezüglich dieser Cluster haben einzelne Punkte (Kunden) Rollen, die nun kurz beschrieben werden (Abb. 8): › Soziale Punkte haben viele Kontakte sowohl innerhalb als auch außerhalb ihres Clusters.

Sie sind wichtig für den Zusammenhalt des gesamten Netzwerks › Clusterpunkte haben viele Kontakte innerhalb ihres Clusters, aber nur wenige oder gar keine außerhalb. Sie sind bedeutend für den Zusammenhalt ihres Clusters. › Schnittstellenpunkte haben relativ viele Kontakte außerhalb ihres Clusters, aber relativ wenige innerhalb. Sie sind wichtig für die Kommunikation zwischen den Clustern. › Autistenpunkte haben überhaupt wenig Kontakte.

[Abbildung 8: Rollen in Netzwerken]

Seite 14

© mayato® GmbH. Alle Rechte vorbehalten.


Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

5.2 Visualisierung von Netzwerken Die graphische Darstellung von Netzwerken kann ein gutes Hilfsmittel sein, um seine Struktur zu verstehen. Das menschliche Auge ist daran gewöhnt, Muster zu erkennen und graphische Zusammenhänge zu erfassen. Allerdings sind ihm auch enge Grenzen gesetzt: Ab einer gewissen Größe wird jede Netzwerk-Darstellung so unübersichtlich, dass damit kein Erkenntnisgewinn mehr möglich ist. Sehr dichte Netzwerke, bei denen fast alle Punkte durch Linien verbunden sind, eignen sich nicht für die Visualisierung. Auch gilt es, bei der Darstellung bestimmte Regeln einzuhalten: Das menschliche Auge lässt sich auch leicht täuschen, wie jeder weiß, der schon einmal mit einem optischen Trick hereingelegt wurde. Regeln für das Zeichnen von Netzwerken sind z.B: › Die Entfernung zwischen zwei Punkten sollte die Stärke der Beziehung der beiden Punkte ausdrücken. Je stärker die Beziehung, desto näher liegen die Punkte beieinander. › Punkte sollten nicht auf der Linie zwischen zwei anderen Punkten liegen. › Linien sollten sich so selten wie möglich überschneiden. Nicht immer lassen sich diese Richtlinien befolgen, man sollte aber darauf achten, dass sie möglichst selten verletzt werden. In Softwarepaketen zur Analyse sozialer Netzwerke sind verschiedene Algorithmen zur automatischen Anordnung der Netzwerk-Punkte in der Ebene oder im dreidimensionalen Raum implementiert. Diese Algorithmen führen normalerweise nicht sofort zu einem zufriedenstellenden Ergebnis, mit etwas manueller Nacharbeit können jedoch oft sehr schnell brauchbare Graphiken erzeugt werden. Manchmal ist die zeitliche Entstehung von Netzwerken noch interessanter als die Struktur des aktuellen Netzwerks. Beispielsweise ist bei der Betrugserkennung die Entstehungsgeschichte eines Betrügerrings von Bedeutung. Auch dafür gibt es Visualisierungstechniken. Voraussetzung dafür ist allerdings, dass für die einzelnen Punkte und Linien Zeitstempel vorhanden sind, d.h. die Information, wann ein Punkt oder eine Verbindung zum Netzwerk hinzugefügt wurde.

© mayato® GmbH. Alle Rechte vorbehalten.

Ist dies der Fall, so kann man den Aufbau des Netzes quasi als Film darstellen.

6 Fazit Die Kenntnis sozialer Beziehungen gibt Unternehmen die Möglichkeit, mehr über ihre Kunden zu erfahren. Neben den klassischen im Data Warehouse gespeicherten Kundenmerkmalen wie Demographie oder Kauf- und Beziehungshistorie ergibt die Analyse dieser Netzwerke eine neue Art von Kundenwissen. Dieses zusätzliche Wissen kann in Marketing und CRM wichtige, bisher noch nicht bekannte Informationen liefern und so u.a. die Ressourcenallokation verbessern. Im Risikomanagement und bei der Betrugsbekämpfung wird die Berücksichtigung von Beziehungsdaten im Privat- sowie auch im Firmenkundengeschäft bald unumgänglich sein. Für die Ermittlung sozialer Beziehungen gibt es zahlreiche Datenquellen. Ein generell einsetzbares Verfahren ist die Dublettenprüfung auf Personen-, Haushalts- und Hausebene. Weitere Datenquellen sind je nach Branche mehr oder weniger zahlreich vorhanden, erfordern aber umfangreichere und komplexere Analysen bis hin zu Data Mining oder Text Mining. Die Entwicklung leistungsfähiger Tools für die Analyse sozialer Netzwerke schreitet schnell voran. Der Data-Mining-Spezialist KXEN stellte 2009 das Modul KSN für die Generierung von Netzwerk-Kennzahlen vor. Der weltweit führende Anbieter für Datenanalyse-Software SAS Institute stellte bei der letztjährigen Konferenz „SAS Forum Deutschland 2009“ eine SNA-Komponente vor, die im Rahmen des SAS Fraud Framework verfügbar sein wird. Weitere Lösungen für Marketing und CRM sind für 2010 angekündigt. Ausgehend von Web2.0-Anwendungen und der Telekommunikationswirtschaft hat sich eine neue Analyserichtung entwickelt, der sich moderne Unternehmen unterschiedlichster Branchen in Zukunft nicht verschließen dürfen. Trotz einiger Schwierigkeiten bei der Umsetzung des Konzepts – beispielsweise müssen Datenschutzaspekte im Einzelfall intensiv geprüft werden – wird sich die Nutzung vorhandener Kunden-Netzwerke in vielen Fällen auszahlen.

Seite 15


Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

7 Anhang

Telekommunikation

› Telefonverbindungen: Wer ruft wen an? Wie oft? Wie lange? › SMS- und MMS-Verbindungen › Familien-/Freunde-Tarife › Firmentarife: Mitarbeiter kleinerer Firmen kennen sich › Rechnung/Kontonummer: Personen, deren Rechnungsbetrag vom selben Konto abgebucht wird, kennen sich › Gutscheine/Guthabenübertragung › Kundenwerbung

Zeitungs- und Zeitschriftenverlage

› Leser werben Leser › Kontonummer/Rechnung: siehe „Telekommunikation“ › Geschenkabonnement › Blogs und Foren

Pharma

› Gemeinschaftspraxen, Apothekenverbände, Hausarztnetzwerke › Ärztehäuser: Dublettenabgleich Hausebene › Teilnahme an der selben Pharmakologischen Studie › Häufige Überweisung an denselbe Facharzt › Gemeinsame Mitgliedschaft in Organisationen z.B. Ethikkommissionen, Selbsthilfegruppen › Gemeinsame Teilnahme an Konferenzen, Fortbildungen, › Prüfarzttreffen

Reiseveranstalter

› Vergleich Ziel- und Heimadresse › Mietwagen/Zweitfahrer

Fluglinien

› Check-In-Informationen (Gemeinsamer Check-In) › Mehrmals benachbarte Sitzplätze › Flug von der selben Firma gebucht › Übertragung von Bonuspunkten › Kontonummer/Rechnung: siehe „Telekommunikation“

Energieversorger (Strom/Gas)

› Kundenwerbung › Dublettenabgleich: zusätzlich Wohnungsnummer bekannt › Kontonummer/Rechnung: siehe „Telekommunikation“

Versand-/Internethandel

› Gemeinschaftsbesteller › Kontonummer/Rechnung: siehe „Telekommunikation“ › Geschenkgutscheine › Wunschlisten › Kundenwerbung

[Tabelle 4: Möglichkeiten der Netzwerkidentifikation in verschiedenen Branchen]

Seite 16

© mayato® GmbH. Alle Rechte vorbehalten.


Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

Anbieter

Web

AZ Direkt GmbH

www.az-direct.com

Human Inference

www.humaninference.com

Nobody Software

www.nobodysoftware.de

Omikron Data Quality GmbH SAP AG

SAS DataFlux

www.omikron.net

www.sap.com

www.dataflux.com

Bemerkung AZ Direkt ist Spezialist für Zielgruppenadressen und bietet eine eigene Dublettenerkennungs-Software an. Human Inference bietet Software zur Optimierung der Datenqualität Das Produkt ist sehr preisgünstig und somit auch für kleinere und mittelständische Unternehmen interessant. Omikron ist Spezialist für DublettenerkennungsSoftware. Die Technologie der ehemaligen fuzzy! Informatik wurde in die BusinessObjects Lösungen integriert. DataFlux gehört zum SAS Konzern und bietet eine Reihe von Lösungen rund um Datenqualität und Data Governance

Harte-Hanks Trillium Software

www.trilliumsoftware.com

Trillium Software ist ein globaler Anbieter von Datenqualitäts- und Geocodierungs-Software

Uniserv GmbH

www.uniserv.com

Uniserv war in Deutschland der erste Anbieter von Dublettenerkennungs-Software. Die Produkte sind für viele Plattformen (u.a. Windows, UNIX) erhältlich.

[Tabelle 5: Anbieter von Dublettenabgleichs-Software]

© mayato® GmbH. Alle Rechte vorbehalten.

Seite 17


Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

Anbieter

Web

Bemerkung

Acxiom Deutschland GmbH

www.acxiom.de

Acxiom ist Spezialist für raumbezogene und mikrogeographische Daten sowie mikrogeographische Raumsegmentierungen.

AZ Direct GmbH

www.az-direkt.com

AZ Direct ist Spezialist für Zielgruppenadressen und bietet auch raumbezogene und mikrogeographische Daten an.

Deutsche Post Direkt GmbH

www.postdirekt.de

Die Tochtergesellschaft der Deutschen Post ist primär im Adressmanagement tätig, hat aber auch mikrogeographische Daten im Portfolio. Die Tochter des global tätigen Marktforschungskonzerns GfK Group vertreibt neben ihrer KartographieSoftware auch mikrogeographische Daten.

GfK Geomarketing GmbH

www.gfk-geomarketing.de

infas GEOdaten GmbH

infas GEOdaten war einer der ersten Anbierter für www.infas-geodaten. mikrogeographische Daten und gehört zur Schober de Information Group.

microm GmbH

www.microm-online. Die microm GmbH ist Dienstleister für Zielgruppen-, de Dialog- und Geomarketing

[Tabelle 6: Anbieter mikrogeographischer Daten für Deutschland]

8 Literatur [1] Malcolm Gladwell: The Tipping Point. ISBN 9780316679077 [2] Peter Neckel, Bernd Knobloch: Customer Relationship Analytics. ISBN 9783898643092 [3] Link/Brändli/Schleuning/Kehl (Hrsg.): Handbuch Database Marketing, S. 143-157. ISBN 9783930047215 [4] Christopher Westphal: Data Mining for Intelligence, Fraud & Criminal Detection: Advanced Analytics & Information Sharing Technologies. ISBN 9781420067231 [5] Mark Granovetter: The Strength of Weak Ties, American Journal of Sociology 78, S. 1360-1380 [6] De Nooy/Mrvar/Batagelj: Exploratory Social Network Analysis with Pajek. ISBN 9780521602624

Seite 18

© mayato® GmbH. Alle Rechte vorbehalten.


Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

9 Über den Autor Peter Gerngross ist Unternehmensberater und Experte für explorative Datenanalyse, Business Intelligence und Analytisches CRM bei mayato. Er beschäftigt sich seit vielen Jahren in zahlreichen Projekten mit komplexen Data-Mining-Analysen und deren effizienter Nutzung in der Praxis, insbesondere im Banken- und Versicherungsumfeld. Seine Spezialgebiete sind die Entwicklung und der Einsatz von Scoringmodellen, technologisches Betrugsmanagement sowie die Analyse sozialer Netzwerke.

10 Über mayato Das BI-Analysten- und Beratungshaus mayato wurde im April 2007 mit der Vision der „perfekten Entscheidung“ gegründet. mayato deckt in drei Bereichen das Thema Business Intelligence komplett ab: „Think“ untersucht aktuelle Trends, Märkte, Methoden, Produkte und Technologien. In „Act“ werden integrierte und flexible Infrastrukturen für Business Analytics konzipiert und realisiert. Darüber hinaus unterstützen im Bereich „Analyze“ Statistik- und Data-Mining-Experten Unternehmen in allen Bereichen der intelligenten Datenanalyse. Die Spezialgebiete der mayato-Berater umfassen Risiko- und Betrugsmanagement, CRM Analytics und die Analyse sozialer Netzwerke in Kundenbeständen. Als Partner mehrerer Softwareanbieter ist mayato grundsätzlich der Neutralität und in erster Linie der Qualität seiner eigenen Dienstleistungen verpflichtet. mayato berät vom Hauptsitz in Berlin sowie weiteren Standorten nationale und internationale Kunden vom Mittelständler bis zum Weltkonzern. Nähere Informationen unter www.mayato.com.

Kontakt:

Ansprechpartner:

mayato GmbH

Georg Heeren

Am Borsigturm 9

Tel. +49 30 4147.1667

D-13507 Berlin

georg.heeren@mayato.com

www.mayato.com

© mayato® GmbH. Alle Rechte vorbehalten.

Seite 19


Analyse sozialer Bindungen: Über Netzwerkdaten zu mehr Kundenwissen

mayato® GmbH | Am Borsigturm 9 | 13507 Berlin | T +49 30 4174.8657 | info@mayato.com | www.mayato.com ®

Seite 20

© mayato GmbH. Alle Rechte vorbehalten.


Analyse sozialer Bindungen - Über Netzwerkdaten zu mehr Kundenwissen