Umsetzung von Machine Learning im Financial Service Sektor

June 20, 2018

Umsetzung von Machine Learning im Financial Service Sektor

Bei Simon Kucher & Partners sind wir stets bestrebt innovative und vielversprechende Vorhaben zur Umsatzpotenzialsteigerung durch die Verwendung von Machine Learning Algorithmen umzusetzen. Dabei unterstützen wir unsere Kunden bei der Konzeptionierung und Umsetzung einer Vielzahl von Themen, wie der Steigerung des Cross-Selling- und Up-Selling-Potenzials, sowie bei der Reduktion der Kundenfluktuation und dem Dynamic Pricing.

Doch wie lässt sich nun Machine Learning effektiv einsetzen und zu einem Wettbewerbsvorteil entwickeln? Auf das Wesentliche hinuntergebrochen lässt sich die Durchführung eines erfolgreichen Machine Learning Unterfangen in vier Phasen einteilen:

  1. Ziel festlegen, Rahmen und Strategie definieren
  2. Daten selektieren und aufbereiten
  3. Machine Learning Methoden wählen
  4. Umsetzung der Erkenntnisse
     
Grafik_1

Abbildung 1: Workflow eines Machine Learning Unterfangens


Ziel festlegen, Rahmen und Strategie definieren
Zuerst muss ein spezifisches und messbares Ziel (Bei der Zieldefinition ist es empfehlenswert nach der SMART-Methode vorzugehen) definiert werden (z.B. Erhöhung der Cross-Selling Rate, Reduktion der Kundenfluktuation). Basierend auf dem Ziel lassen sich anschliessend der Rahmen einer Machine Learning Kampagne ableiten. Im Allgemeinen erweist sich das Abstecken des Rahmens ohne vorheriger Erfahrung als ein nicht triviales Unterfangen. Hier gilt als Faustregel zuerst ein Augenmerk auf die bestehenden Vertriebsprozesse zu legen. In diesen Prozessen müssen die Schritte identifiziert werden, welche geeignet sind, das Kundenverhalten zu steuern.
Je nach Vertriebsmethode entweder digital oder über einen Kundenbetreuer, muss die Einbettung der Machine Learning Algorithmen in den Fluss des Prozesses bzw. Arbeitsweise des Mitarbeiters passen. Im Bereich der digitalen Kanäle dürfen verhaltensbeeinflussende Hinweise nicht als aufdringlich empfunden werden. Wurde der Rahmen festgelegt, gilt es die Strategie zu definieren, welche aus erfolgversprechend Massnahmen zum Erreichen des gewünschten Ziels besteht. Es empfiehlt sich nach dem Divide-And-Conquere-Prinzip vorzugehen. Dabei wird die gesamte Problemstellung in Unterprobleme zerlegt, um die einzelnen Teilprobleme mit den adäquaten Machine-Learning-Methoden zu adressieren.
In dieser Phase treten häufig Qualitätsmängel bei der Ableitung der Rahmenbedingungen und dem Herunterbrechen auf Teilproblemen auf. Dadurch kommt es in den folgenden Phasen zu unbefriedigenden Ergebnissen, die im Endeffekt das ganze Vorhaben gefährden. Die Ursache dafür ist meist auf den Mangel von Machine Learning Methoden-Know-How in Kombination mit Branchenwissen aus der Finanzindustrie zurückzuführen.
Ein Team aus Fachabteilungsmitarbeiter und Data Scientist kann diesen Mangel etwas lindern, aber üblicherweise nicht beseitigen.

Daten selektieren & aufbereiten
Sind die Rahmenbedingungen festgelegt, kann in weiterer Folge der Datenbedarf definiert werden. Machine Learning Algorithmen versuchen Muster in den bereitgestellten Daten zu erkennen und diese zu nutzen. In der Regel entscheiden Algorithmen selbst, welchen Informationen sie mehr Gewichtung geben, bzw. welche relevant für die Problemlösung sind. Mit der Auswahl der Daten ist es aber meist nicht getan. Je nach Algorithmus müssen die Daten noch aufbereitet werden und eventuell quantifizierbar sein. Nicht strukturierte Daten wie Texte bspw. aus der E-Mail-Korrespondenz mit dem Kunden müssen zielorientiert aufbereitet werden, damit diese von Machine Learning Algorithmen verarbeitet werden können. Wenn die Aufbereitung nicht automatisierbar ist, wird sich der Mehrwert eines Machine Learning Unterfangen stark beschränken.

Machine Learning Methoden wählen
Die gesetzten Rahmenbedingungen und definierte Strategie führen bereits zu einer Vorselektion der möglichen Machine Learning Algorithmen, sowie deren Validierungsmetriken. Bei digitalen Kanälen, wo der Kunde autonom agiert, sind „supervised“ Methoden üblicherweise besser geeignet, da die Entkopplung von Anwendung und Training eine zügige Entscheidungsfindung durch den Algorithmus im Produktionsbetrieb erlaubt. Wurden die möglichen Algorithmen vorselektiert, müssen die Parameter geschätzt werden, um durch nachfolgendes Trainieren und Validieren die bestmögliche Kombination von Algorithmen für den Anwendungsfall zu bestimmen. Empfehlenswert ist es zuerst mit Algorithmen zu starten, welche keine oder eine geringe Anzahl an Parametern bedarf. Diese dienen dann als Baseline für die sophistischeren Algorithmen.  Für die Auswahl der Machine Learning Algorithmen ist das Zusammenspiel von Branchenwissen, Data Science Kenntnissen und Erfahrung entscheidend, um rasch und effektiv zu validen Resultaten zu kommen und Effekte wie Overfitting oder Data-Snooping zu vermeiden.

Umsetzung der Erkenntnisse
Wenn die modellierten Algorithmen zu vielversprechenden Ergebnissen führen, müssen die Erkenntnisse in die Produktion überführt werden, bevor ein Finanzinstitut davon profitieren kann. Diese Phase wird gewöhnlich im Rahmen eines Implementierungsprojektes durchgeführt. Der Workflow zur Entscheidungsfindung der Machine Learning Algorithmen wird für die Produktion etwas angepasst. Die Schritte aus der Datenaufbereitung werden mit der Validierung der Algorithmen verknüpft. Bei „supervised“ Methoden wird die Trainingsphase der Algorithmen zu einem Supportprozess, dies bedeutet, dass das Training von der Anwendung im Kernprozess entkoppelt abläuft.

Supportprozesse: Das Schmiermittel der Machine Learning Methoden
Nachdem die Machine Learning Methoden in die Kernprozesse integriert wurden, muss dafür Sorge getragen werden, dass diese Methoden auch in Zukunft zu validen Ergebnissen führen. Dabei ist es essentiell fortlaufend Daten zu sammeln, diese zielführend aufzubereiten und die Algorithmen regelmässig neu zu trainieren und gegebenenfalls zu rekalibrieren. (Übersicht Grafik 2).

Grafik_2

Abbildung 2: Supportprozesse eines Machine Learning Unterfangens

Daten sammeln
Daten sind essentiell für die Nutzung von Machine Learning Algorithmen. Fehlende oder mangelhafte Daten führen unweigerlich zu einer suboptimalen Performance bei der Anwendung der Machine Learning Algorithmen, weswegen in solchen Fällen auf jeden Fall eine Akquise von Daten durch Drittanbieter zu prüfen ist. Grundsätzlich gilt jedoch, dass die beste Quelle für Daten zu den eigenen Kunden das Finanzinstitut selbst ist.
Banken sammeln ihre Daten meist sehr strukturiert, um diese für spätere standardisierte Reports oder Audits zu Verfügung stellen zu können. Der Umfang und das Vorgehen gehen selten über das regulatorisch geforderte Mass hinaus. Die systematische Sammlung anderer im ersten Blick „unnötiger“ Daten wird vernachlässigt. Diese vermeintlich unnötigen Daten können sich jedoch als Game-Changer erweisen und die Anwendung richtig profitabel machen.


Optimierung der Datenaufbereitung
Die Datenstrukturen der gesammelten Daten sind nicht starr, weswegen auch laufend an der Aufarbeitung und Quantifizierung gearbeitet werden muss, sofern die neuen Datenquellen in die Berechnungen der Machine Learning Algorithmen einbezogen werden sollen. Darüber hinaus ist es notwendig bisherige Aufbereitungen zu überarbeiten, weil ggf. nun mehr Rechenleistung zur Verfügung steht, um bisher nicht implementierte Vorhaben zu realisieren. Weiters müssen die organisatorischen Voraussetzungen geschaffen werden, Daten möglichst unkompliziert zur Verfügung zu stellen und zu konsumieren. Hierfür bieten sich Data Lakes an, die Big Data Unterfangen in der Regel erst möglich machen.

Training & Rekalibrierung der Algorithmen
In diesem Schritt müssen in regelmässigen Abständen die Algorithmen in der Produktion neu trainiert werden, um auf neue Muster reagieren zu können. Die Regelmässigkeit des Trainings und Rekalibrierung hängen vom Anwendungsfall ab.

Schlussfolgerung
Eine erfolgreiche Umsetzung von Machine Learning Unterfangen hängt zum einen von der richtigen Strukturierung der Problemstellung ab und zum anderen aus der Kombination von Branchenwissen mit Machine Learning Expertise. Durch den letzten Punkt lassen sich schneller die richtigen Entscheidungen bei der Strategiefindung treffen, Daten adäquate selektiert und aufbereitet, sowie rasch valide Ergebnisse mit den richtigen Machine Learning Methoden erzielen. Ist die Lernkurve des Finanzinstitutes noch am Anfang und sollen trotzdem rasch Ergebnisse erzielt werden, ist ein hinzuziehen von Experten ratsam.