Resilient Communication with Programmable Hardware (ReCoPro)

(Resiliente Kommunikation mit Programmierbarer Hardware)

Team

Kommunikationsnetze, University of Tübingen

  • Michael Menth
    Michael Menth is professor at the Department of Computer Science at the University of Tuebingen/Germany since 2010 and chairholder of Communication Networks. His special interests are performance analysis and optimization of communication networks, resource and congestion management, resilience and routing issues, industrial networking and Internet of Things. His current research focus is on network softwarization, network programmability, and Time-Sensitive Networking (TSN). Dr. Menth contributes to standardization bodies, notably to the IETF. He published more than 200 papers in the field of computer networking, holds numerous patents, participated in more than 150 TPCs, and organized multiple workshops and conferences.

  • Steffen Lindner
    PostDoc

  • Fabian Ihle
    PhD Student

Abstract

[EN] Resilience features in communication protocols mitigate critical situations where, e.g., availability, security, or performance are at risk. They are indispensable for deployment but increase complexity. In this work we focus on the design of communication protocols with resilience features and their implementation on devices with programmable data planes (forwarding hardware). Devices with programmable data plane support the implementation of existing and new protocols on commodity hardware and are key ingredients for disaggregation of communication infrastructure. On the one hand, their operations per packet are limited on high-speed platforms so that efficient implementations are challenging and feasible only for protocols with moderate complexity. On the other hand, they can assist the control and data plane through new packet headers, flexible packet processing, and optimizations. The latter use software-defined networking with learning algorithms that automatically adapt configurations to current network conditions. Successful innovations on devices with programmable data plane that are suitable for a larger market can be implemented on specialized ASICs in the future. For this work, we choose resilience mechanisms on high-speed platforms as use cases that are relevant for today’s network operation and that are discussed in standardization bodies. Those are resilient stateless multicast, 1+1 protection with packet loss recovery, hardware-assisted message flooding under unreliable forwarding conditions, mitigation of denial-of-service attacks against mapping-based communication, and automated deployment of crypto-protocols. The proposed resilience features benefit from the advantages of programmable hardware and software-defined control, but require novel system architectures and protocols, optimized operation through online learning, scalability analyses, and in particular running prototypes to demonstrate their feasibility. The project is involved in IETF standardization to disseminate findings, get feedback on early results, and shape the evolution of future protocols. The work explores limits of today’s devices with programmable data plane and proposes hardware extensions to support attractive use cases. Finally, efficient blueprints of resilient protocols on programmable hardware are provided which are useful for disaggregation.

[DE] Resilienz-Eigenschaften in Kommunikationsprotokollen werden für kritische Situationen benötigt, in denen z.B. Verfügbarkeit, Sicherheit oder Leistungsfähigkeit gefährdet sind. Sie sind unverzichtbar für den Einsatz in der Praxis aber erhöhen die Komplexität. In diesem Projekt fokussieren wir auf das Design von Kommunikationsprotokollen mit Resilienz-Eigenschaften und ihre Implementierung auf Geräten mit programmierbarer Data Plane (Weiterleitungs-Hardware). Geräte mit programmierbarer Data Plane unterstützen die Implementierung existierender und neuer Protokolle auf Standard-Hardware und gehören zu Hauptbestandteilen für die Disaggregation von Kommunikationsinfrastruktur. Auf der einen Seite erlauben sie auf Hochgeschwindigkeitsplattformern nur wenige Operationen pro Paket, so dass Implementierungen Herausforderungen darstellen und nur für Protokolle mit moderater Komplexität möglich sind. Auf der anderen Seite können sie die Control Plane und Data Plane durch neue Paket-Header, flexible Paketverarbeitung und Optimierungen unterstützen. Letztere nutzen Software-Defined Networking, wobei lernende Algorithmen Konfigurationen automatisch an die aktuelle Netzsituation anpassen. Erfolgreiche Innovationen auf Geräten mit programmierbarer Data Plane, die für einen größeren Markt geeignet sind, können zuküftig auch auf spezialisierten ASICs implementiert werden. Für die vorgeschlagenen Arbeiten wurden Resilienz-Mechanisment auf Hochgeschwindigkeitsplattformen als Anwendungsfälle ausgewählt, die für den heutigen Netzbetrieb relevant sind und in Standardisierungsgremien diskutiert werden. Diese sind ausfallsichere, zustandslose Multicast-Weiterleitung, Schutzschaltungen für Ausfallsicherheit mit Korrektur von Paketverlusten, Hardware-unterstütztes Message Flooding für Situationen mit unsicherer Informationslage, Maßnahmen gegen DoS-Angriffe bei Mapping-basierter Kommunikation und automatisierter Einsatz von Krypto-Protokollen. Die vorgeschlagenen Resilienz-Mechanismen profitieren von den Vorteilen programmierbarer Hardware und Software-basierter Kontrolle aber benötigen neue Systemarchitekturen und Protokolle, optimierten Betrieb durch Online-Learning, Skalierbarkeitsanalysen und insbesondere Prototypen, um ihre Machbarkeit unter Beweis zu stellen. Das Projekt nimmt an Standardisierungstreffen der IETF teil, um Ergebnisse zu kommunizieren, Feedback darauf zu erhalten sowie um künftige Entwicklungen mitzugestalten. Die Arbeit untersucht die Grenzen von heutigen Geräten mit programmierbare Data Plane und schlägt Hardware-Erweiterungen vor, die für attraktive Anwendungsfälle notwendig sind. Schließlich werden Musterimplementierungen für resiliente Protokolle auf programmierbarer Hardware bereitgestellt, welche für Disaggregtion nützlich sind.