Towards Network Resilience via Collective Counterfactual Explanations and Interventions

Team

Lernende Technische Systeme, Ruhr-University Bochum

  • Setareh Maghsudi
    Since 2023, Setareh Maghsudi is a full professor at Ruhr-University Bochum, leading the research group ‘Inteligent Technical System". From 2020-2023, she a tenure-track assistant professor at the University of Tübingen. From 2017 to 2020, she was an assistant professor at the Technical University of Berlin, where she also received her Ph.D. degree (summa cum laude) in 2015. From 2015 to 2017, she held post-doctoral positions at the University of Manitoba-Canada, and Yale University-USA. During 2017- 2020, she was visiting researcher at the University of Oxford, the University of Cambridge, the Alan-Turing Institute in the UK, also the African Institute of Mathematical Science in South Africa. In the Summer of 2019, she was a research fellow at Kyushu University, Japan.

Abstract

[EN] The synergy between wireless communication, cyber-physical system design, and artificial intelligence enables the autonomous operation of modern networked systems. For such infrastructures that underpin several critical missions, the vitality of resiliency is evident and unquestionable. Nevertheless, the volatility of resources and the uncertainty in task arrival, render resiliency challenging to achieve. In this proposal, we focus on the resource- and workload allocation problem to boost the resilience of a mission-critical system of systems against such challenges. Our solutions lie at the intersection of machine learning, optimization, and multi-agent systems. We develop robust and efficient collective algorithmic recourse solutions and apply them to network resilience. We maintain a generic framework of resiliency via network adaptivity so that our proposal accommodates a variety of applications. We provide rigorous theoretical analysis concerning efficiency, scalability, and convergence. We also discuss the performance bounds.

[DE] Die Synergie zwischen drahtloser Kommunikation, cyber-physischem Systemdesign und künstlicher Intelligenz ermöglicht den autonomen Betrieb moderner vernetzter Systeme. Für derartige Infrastrukturen, die zeitgleich mehrere kritische Aufgaben und Missionen erfüllen, ist die Wichtigkeit und Unverzichtbarkeit der Resilienz offensichtlich und unbestreitbar. Die Volatilität der Ressourcen und die Ungewissheit des Eintreffens von Aufgaben machen es jedoch schwierig, die Ausfallsicherheit zu erreichen. In diesem Antrag konzentrieren wir uns auf das Problem der Ressourcen- und Arbeitslastzuweisung, um die Widerstandsfähigkeit eines unternehmenskritischen Systems gegen solche Herausforderungen zu erhöhen. Unsere Lösungen liegen an der Schnittstelle von maschinellem Lernen, Optimierung und Multiagentensystemen. Wir entwickeln robust und effizient kollektive algorithmische Rückgriff (collective algorithmic recourse) Lösungen und wenden sie auf die Netzwerk-Resilienz an. Wir behalten einen generischen Rahmen der Resilienz durch Netzwerkadaptivität bei, so dass unser Vorschlag eine Vielzahl von Anwendungen abdeckt. Wir bieten eine strenge theoretische Analyse in Bezug auf Effizienz, Skalierbarkeit und Konvergenz. Wir diskutieren auch die Leistungsgrenzen.