Telekommunikation.

Unser Kunde ist ein international agierender Telekommunikationsdienstleister.

Technologien und Methoden:

  • MTGen

  • Data Platform

  • Python

  • Spark

  • Machine Learning

Ausgangssituation und Projektziel

Datenlecks können Unternehmen teuer zu stehen kommen. Ein ungewollter Abgriff, etwa von Kundendaten, zieht schnell horrende Strafzahlungen nach sich – Stichwort Datenschutz. Ganz zu schweigen vom hohen Image- und Vertrauensverlust in der Öffentlichkeit. Zahlreiche Beispiele aus der jüngsten Vergangenheit zeigen die Wichtigkeit für Unternehmen, sich gegen Data Leaks zu wappnen. Interne Data Leaks können beispielsweise aufgrund von Betriebsspionage, internem Datendiebstahl oder durch gehackte Konten von Mitarbeiterinnen und Mitarbeitern entstehen. Laut Statista kostet ein Datenleck Unternehmen in Deutschland im Schnitt 4,5 Millionen Euro. Es zu schließen dauert circa 160 Tage. Eine frühzeitige Erkennung beschleunigt den Vorgang und vermindert die Kosten – im Idealfall kann der Datendiebstahl ganz vermieden werden.

Für einen international agierenden Mobilfunkanbieter haben wir ein Früherkennungssystem gegen Data Leaks entwickelt, das mithilfe von KI zuverlässig ungewöhnliche Verhaltensweisen bei SQL-Abfragen anzeigt. Ziel war es, mögliche ungewollte Datenabgriffe rechtzeitig zu erkennen, um schnell gegensteuern zu können.

Vorgehen im Projekt

Das Entwicklungsteam – bestehend aus Data Engineers und Data Scientists – entschied sich für ein Machine-Learning-Vorgehen, bei dem die statistische Verteilung bei SQL-Aktivitäten auf dem Datawarehouse analysiert wird und abweichendes Verhalten angezeigt wird. Die Daten-Analyse und der KI-Algorithmus bilden die Grundlage des Frühwarnsystems.

Für die Modellierung war eine Vorverarbeitung aller Daten notwendig – hier über 1,5 Milliarden Datensätze mit ca. 3 Terabyte Datenvolumen. Um diese große Menge an Informationen verarbeiten zu können wurde mit der Data Platform eine leistungsstarke Cloud-Plattform implementiert. Anschließend wurden die SQL-Aktivitäten klassifiziert, das Normalverhalten analysiert und verschiedene Kriterien für die Auswertung bestimmt. Mit den aufbereiteten Daten konnte die KI trainiert werden. Nach einem vorher festgelegten Punktesystem werden Abweichungen vom Normalverhalten angezeigt und bewertet.

Machine-Learning: Anomalien mit Statistik finden

Machine-Learning-Vorgehen: Anomalien mit Statistik finden.

Projektergebnis

Das Data-Leak-Früherkennungssystem wurde explizit auf die Bedürfnisse und Wünsche des Kunden angepasst. Auffälliges Verhalten bei SQL-Datenabfragen werden rechtzeitig angezeigt, sodass unser Kunde zuverlässig prüfen kann, ob es sich um ein internes Datenleck handelt. Neben dem verbesserten Schutz vor Datendiebstahl bietet die Lösung eine erhöhte Transparenz bei Datenbank-Aktivitäten auf und das IT-Management kann entsprechend optimiert werden. Der Programm-Code ist in den Besitz des Kunden übergegangen, sodass interne IT-Fachkräfte ihn frei nutzen können.

Für wen geeignet:

Für alle Unternehmen, die sensible Daten in ihren Datenbanken nutzen und über eine eigene IT-Abteilung verfügen.

Nutzen für den Kunden:

  • Erkennung und Verhinderung von Datendiebstahl und Betriebsspionage

  • Vermeidung von Image- und Vertrauensverlust

  • Vermeidung von Strafzahlungen und Umsatzverlust

  • Optimierung der bestehenden Prozesse

  • Erhöhte Transparenz bei Datenbewegungen

  • Stärkung der Kompetenz von Angestellten im Umgang mit sensiblen Daten

Leistungen Hyand Solutions:

  • Beratung

  • Umsetzung/Entwicklung

  • Betrieb und Support

Weitere spannende Projekte