FUSION, ein vollständig adaptives und datengesteuertes System zur Erkennung von Kundenverhalten, das von seinem Aufbau her 100% Covid-sicher ist und den AML-Erkennungsprozess drastisch verbessert.
Der Hauptzweck von FUSION besteht darin, dem Nutzer eine vollständig datengesteuerte Methode zur Verfügung zu stellen, mit dem er Segmente von Kunden mit ähnlichem (Finanz-)Verhalten konstruieren kann.
Die Cluster werden mithilfe eines leistungsfähigen unbeaufsichtigten Lernalgorithmus, der jeden Kunden danach bewertet, wie „normal“ sein Verhalten innerhalb seines Segments ist, rekursiv gebildet.
FUSION mit seiner intuitiven Erklärungskraft, Vielseitigkeit und Rechenkapazität ist eine SaaS, die branchenübergreifend und für unterschiedliche Zwecke eingesetzt werden kann.
Der Algorithmus von FUSION wurde nach den folgenden Prinzipien konzipiert:
Die Nutzer von FUSION können ihren Datensatz auf die Plattform hochladen. Unserer Erfahrung nach besteht ein typischer Datensatz aus:
Clusterauswahl: Die Nutzer können die erste Dimension des Segmentierungsverfahrens definieren. Der Algorithmus kann jedoch die wichtigsten Merkmale auch selbst erkennen.
Kalibrierung des Clustermodells: Die Kunden werden von der unbeaufsichtigten Lernroutine Isolation Forest Clustern zugeordnet. Die Ausgabe enthält einen Normalitätswert und SHAP-Werte (SHapley Additive exPlanations) für jeden Kunden innerhalb eines Segments.
Iteration: Anhand der SHAP-Werte entscheidet der Algorithmus, welche Dimension für den Subclustering-Prozess verwendet wird. Der Prozess endet, sobald die endgültigen Cluster einen homogenen Zustand erreicht haben.
Der wichtigste Schritt besteht darin, einen Cluster einem Isolation-Forest-Modell zuzuordnen, das im Wesentlichen für jeden Kunden eine Ähnlichkeitsbewertung liefert, die die durchschnittliche Anzahl (über die Bäume hinweg) von Iterationen repräsentiert, die erforderlich sind, um einen Kunden von anderen zu isolieren.
Wie Sie den oben stehenden Grafiken entnehmen können, ist ein Kunde ganz intuitiv anderen Kunden im Cluster am ähnlichsten, je höher der Wert ist, desto mehr Iterationen also erforderlich sind.
Sobald der Normalitätswert zugewiesen ist, berechnet der Algorithmus die SHAP-Werte für jeden Kunden: Diese Werte bestimmen die Abgrenzungswirkung jedes Merkmals auf den Ähnlichkeitswert jedes Kunden und helfen so, die Struktur des Clusters zu verstehen. Anhand dieser Abgrenzungswerte zur Bewertung der Bedeutung der Merkmale innerhalb jedes Clusters führt der Algorithmus nun eine Subclusterung für jedes Segment durch, bis es einen homogenen Zustand erreicht.
Wir werden in Kürze in einem ausführlicheren Blogbeitrag auf die Funktionsweise des Algorithmus zurückkommen.
Wenn Sie ein Demo von FUSION buchen möchten, .