HSBI und Universität der Bundeswehr München erforschen Schutz vor „Doxing“
Bielefeld – Welche Gefahren drohen Privatpersonen und Institutionen aufgrund der Spuren, die sie in Sozialen Netzwerken und anderswo im Internet hinterlassen? Das erforscht nun weitere zwei Jahre lang „ADRIAN – Authority-Dependent Risk Identification and Analysis in online Networks“, ein Projekt des Fachbereichs Wirtschaft der HSBI. Das Team um Prof. Dr. Frederik Bäumer analysiert, generiert, verschlüsselt und verschickt dafür massenhaft (synthetische) personenbezogene Daten. Gemeinsam mit der Universität der Bundeswehr München kommen Verschlüsselungstechnologien und Digitale Zwillinge zum Einsatz, um Verfahren gegen die unfreiwillige und sicherheitsgefährdende Bereitstellung von Informationen im Netz zu entwickeln.
Bodyguards müssen sich fit halten, zumal wenn es ihr Job ist, Staatoberhäupter zu beschützen. Manche verfolgen ihr Training dabei offensichtlich einen Tick zu arglos: Sie nutzen die App Strava, um beispielsweise ihre Laufstrecken mit ihren Followern zu teilen. Die französische Zeitung „Le Monde“ hat dazu kürzlich bemerkenswerte Recherche-Ergebnisse veröffentlicht. Das Blatt verglich die Strava-Aktivitäten von Personenschützern mit den Reiseplänen ihrer Dienstherren – unter anderem Emmanuel Macron, Joe Biden und Wladimir Putin. Beides passte gut zusammen. Wer also den Aufenthaltsort des Präsidenten checken will, muss lediglich seinen Leibwächtern auf Strava folgen. Wenn die mal wieder direkt vom Hotel aus losjoggen.
Die HSBI als Knotenpunkt im quantensicheren Netzwerk bei MuQuaNet
Für den Prof. Dr. Frederik Bäumer von der Hochschule Bielefeld (HSBI) war diese Sicherheitslücke in gewisser Weise ein Glücksfall: „Schon 2017 wurde die Strava-App auffällig, als durchsickerte, dass man über sie militärische Anlagen identifizieren konnte, indem man die Daten der dort tätigen Soldaten analysierte“, sagt der Wirtschaftsinformatiker und KI-Experte. „Wir haben das zum Anlass genommen, um uns für ein großes Verbundprojekt der Universität der Bundeswehr München mit einem zivilen Usecase zu bewerben.“ So entstand „ADRIAN – Authority-Dependent Risk Identification and Analysis in online Networks“. Ziel des Forschungsprojekts: Gefährdungen von Privatpersonen und Institutionen erkennen, denen sich diese durch Online-Aktivitäten beispielsweise in Sozialen Netzwerken aussetzen. Und damit einen Warnknopf zu kreieren gegen Doxing, dem internetbasierten Zusammentragen von personenbezogenen Daten.
Frederik Bäumers Arbeitsgruppe „Angewandte KI“ des Fachbereichs Wirtschaft der HSBI wurde damit Teil des dtec.bw-Projekts MuQuaNet, das ein quantensicheres Kommunikationsnetz für Forschung und Evaluierung schaffen will – also ein Netz, in dem nur verschlüsselt kommuniziert wird. Zehn Knotenpunkte besitzt das Netz bisher, darunter eine Fregatte, ein Satellit, ein Airbus-Standort und eben die HSBI. Über vier Jahre hat das neu geschaffene Zentrum für Digitalisierungs- und Technologieforschung der Bundeswehr (dtec.bw) ein HSBI-Forschungsteam mit 500.000 Euro gefördert. Jetzt steht ADRIAN 2 in den Startlöchern: Mit einem Doktoranden, zwei wissenschaftlichen Mitarbeitern, rund zehn studentischen Hilfskräften und zwei Gastwissenschaftlern wird bis Ende 2026 weitergeforscht.
HSBI-Team im Selbstversuch: Angriff ist die beste Verteidigung zur Überprüfung des quantensicheren Netzwerkes
Jeden Tag fließen von der Hochschule Bielefeld aus große Mengen an hochwertigen Daten verschlüsselt in das Netzwerk. Dafür nutzt das HSBI-Team sogenannte SINA-Boxen („Sichere Inter-Netzwerk-Architektur“), die das Bundesministerium für Sicherheit in der Informationstechnik für alle nationalen Geheimhaltungsgrade zertifiziert hat. „Unter anderem greifen wir uns immer wieder selber an, um zu untersuchen, wie robust das Netz ist“, sagt Bäumer. „Die Daten, die wir täglich verschicken, haben wir zuvor pseudonymisiert oder synthetisiert.“
Im Mittelpunkt stehen dabei „Digitale Zwillinge“. „Das Prinzip kennt man etwa aus dem Maschinenbau, wo es zum Beispiel neben dem echten Flugzeug auch ein virtuelles gibt, mit dessen Hilfe man bestimmte Szenarien durchspielen und messen kann“, erklärt Sergej Schultenkämper, Doktorand im ADRIAN-Projekt. Nur geht es bei ADRIAN um Menschen. „Digitale Zwillinge sind Datenstrukturen, in denen alle Informationen wie in einem Graphen verknüpft und semantisch ausgezeichnet sind“, so Bäumer weiter. „In der Mitte ist ein Knoten, der heißt beispielsweise ‚Frederik‘. An diesem Knoten hängt ein Pfeil mit der Info ‚geboren in …‘ und daran ein weiterer Knoten mit ‚Aachen‘. Und daran hängen wiederum ganz viele andere Pfeile von Digitalen Zwillingen. So ergibt sich ein riesiges Netzwerk.“
Was jemand einmal ins Internet gestellt hat, entzieht sich für immer seiner Kontrolle
„Das massenhafte Teilen von Bildern im Internet ist die größte Informationsquelle für uns – und damit auch die größte Gefahr für diejenigen, die das tun“, sagt Bäumer. „In Verbindung mit den Metadaten der Bilder verraten etwa Kleidung, Brillen oder Ringe viel mehr als wir denken.“ Mithilfe Künstlicher Intelligenz werden so Beziehungsgeflechte offenkundig, die für die Betroffenen schnell brisant werden können. „Viele Prominente sind beim Doxing bereits auf die Nase gefallen“, weiß Bäumer. Und auch Normalsterbliche gehen hohe Risiken ein, wenn die KI etwa erkennen kann, wann man im Urlaub ist oder wie womöglich die PIN lautet.
„Die Aufklärung über diese gefährlichen Zusammenhänge ist im Grunde der eigentliche Sinn und Zweck unserer Forschungstätigkeit“, sagt Frederik Bäumer. „Dazu machen wir Workshops, Bachelor-Seminare, gehen an die Presse und schreiben immer wieder auf LinkedIn warnende Hinweise. Denn wir müssen uns darüber im Klaren sein: Über alles, was wir einmal ins Internet gestellt haben, besitzen wir keine Kontrolle mehr.“ Auch so genannte „gelöschte“ Inhalte leben weiter, etwa weil der Plattform-Betreiber sie lediglich ausgeblendet hat oder sie von Hackern abgesogen wurden und nun irgendwo anders lagern.
Was heute noch als absolut sicher gilt, kann morgen schon geknackt werden
Bäumers Arbeitsgruppe will jedoch nicht nur vor Gefahren warnen, sondern sie auch konkret evaluieren. „Das ist eines der wichtigsten Forschungsergebnisse der ersten Phase von ADRIAN: Wir sind heute in der Lage, für eine Person das Risiko zu berechnen, das sich aus deren Präsenz im Web ergibt. Wenn uns jemand fragt, was über ihn bekannt ist, kann ich sagen: Das alles haben wir, und die Gefahr ist in diesen und jenen Bereichen so und so ausgeprägt. Genau damit beschäftigt sich die Doktorarbeit von Sergej Schultenkämper, die im April 2025 fertig sein wird.“
Das hochsichere Verschicken der Daten ist eine weitere Herausforderung: „Verschlüsselungsverfahren, die vor nicht langer Zeit noch als absolut sicher galten, sind es heute nicht mehr“, sagt Frederik Bäumer. „Man darf sich hier auf nichts verlassen. Es ist alles eine Frage steigender Rechenkapazitäten. Der Wettlauf zwischen denen, die verschlüsseln, und denen, die Verschlüsselungen knacken, hört theoretisch nie auf.“
Universität der Bundeswehr München als hochprofessioneller Partner
In diesem Rennen um unsere Datensicherheit besitzt Bäumer mit der Universität der Bundeswehr München einen hochkarätigen Partner. „Man geht dort mit sehr großer Professionalität und einer gewissen Exzellenz ans Werk“, sagt er. „In die Tagesschau werden nicht ohne Grund Professoren dieser Universität eingeladen, um zu aktuellen Krisen Stellung zu nehmen.“ Die HSBI bietet im Gegenzug ihre langjährige Erfahrung mit maschineller Sprachverarbeitung. „Wir verstehen die Grundlagen und die Werkzeuge und können sie schnell auf alles Mögliche anwenden. Die Nische Computerlinguistik wurde innerhalb der Informatik ja lange Zeit belächelt. Das hat sich spätestens seit ChatGPT geändert. Darüber freuen wir uns natürlich sehr.
“Für die kommenden zwei Jahre stehen dem Projekt ADRIAN 2 nun weitere 300.000 Euro an Fördergeldern zur Verfügung. „Dabei jagen wir nicht den ganzen Tag nach Sicherheitslücken“, sagt Schultenkämper. Ein weiteres vielversprechendes Forschungsfeld sind synthetische Daten: „Wir generieren beispielsweise massenhaft Personenbilder, die super realistisch aussehen. Oder setzen in hoher Zahl Tweets und Postings zum Weltgeschehen ab, die wir zwar nicht veröffentlichen, aber speichern.“ Herkömmliche große Sprachmodelle wie ChatGPT neigen dazu, immer wieder ähnliche Tweets zu generieren. „Deshalb haben wir eigene neuronale Netzwerke geschaffen, die das mit einer höheren Varianz hinkriegen, denn wir brauchen für unsere Arbeit täglich große Mengen an neuen, hochwertigen Daten“, erläutert Bäumer. Daten, die analysiert, verschlüsselt und verschickt werden – damit unsere Daten in Zukunft ein wenig sicherer werden.