Projektpartner


Karlsruher Institut für Technologie


Technische Universität München

Johannes Guttenberg Universität Mainz

Rheinisch-Westfälische Technische Hochschule Aachen


ENVELOPE

"ENVELOPE - Effizienz und Zuverlässigkeit: Selbstorganisation in HPC-Systemen" ist ein BMBF-Projekt als Teil der Förderung von Forschungsvorhaben auf dem Gebiet "Grundlagenorientierte Forschung für HPC-Software im Hoch- und Höchstleistungsrechnen" im Rahmen des Förderprogramms "IKT 2020 - Forschung für Innovationen".Start des Projekts war am 1. Januar 2017 mit einer Laufzeit von drei Jahren bis zum 31.12.2019

Das übergeordnete Ziel von ENVELOPE ist das Erreichen von systemunabhängiger Selbstorgansiation zur Abschätzung zwischen und Optimierung von Effizienz und Zuverlässigkeit in heterogenen HPC-Systemen. Entscheidend hierbei ist die Verbindung der Betrachtung des Systems auf Knotenebene mit einer globalen Sichtweise auf das System und Techniken auf der Anwendungsebene.
Insbesodnere die Zuverlässigkeit ist bei der auch in Zukunft stetig steigenden Anzahl an Knoten und somit auch an Komponenten in HPC-Systemen und der damit einhergehenden Steigerung der Wahrscheinlichkeit eines Komponentenausfalls von entscheidender Wichtigkeit. Dabei können klassische Methoden zur Steigerung der Zuverlässigkeit aufgrund ihrer enormen Kosten und des Ressourcenverbrauchs nicht eingesetzt werden. Deshalb sollen in ENVELOPE proaktiv Komponentenausfälle erkannt werden, um bereits im voraus, und nur wenn tatsächlich notwendig, Maßnahmen für die Sicherstellung eines korrekten Anwendungsablaufs treffen zu können. Die entstehende Komplexität im Umgang mit heterogenen Systeme ist dabei vor dem Anwendungsprogrammierer zu verbergen.