Der HLRN-Verbund betreibt das HLRN-IV-System an den Standorten Georg-August-Universität Göttingen und Zuse-Institut Berlin (ZIB). Im September 2018 wurde Phase 1 des HLRN-IV in Betrieb genommen. Nach Installation der Phase 2 des HLRN-IV wird das Gesamtsystem mehr als 200.000 Rechenkerne umfassen und damit über eine Spitzenleistung von rund 16 PFlop/s verfügen.
Am Standort ZIB wird als HLRN-IV-System Phase 1 das HLRN-III-System Konrad im Zeitraum zwischen September 2018 und September 2019 weiter betrieben. Mit der Inbetriebnahme HLRN-IV-System Phase 2 wird diese Phase 1 abgeschaltet.
Es folgt die Beschreibung des HLRN-IV-Systems Phase 1 am Standort Universität Göttingen.
Die Phase 1 basiert auf Intel Skylake Prozessoren und umfasst 448 Knoten. Diese sind aufgeteilt in zwei Knotenklassen (‚medium‘ und ‚large‘), die sich nur in der Menge des Arbeitsspeichers unterscheiden. Im Juli wurde zudem ein GPU Knoten in Betriebt genommen. Die Hardwareausstattung ist wie folgt:
Die Computer Knoten der ersten Phase des HLRN-IV in Göttingen
Der HLRN-IV hat jeweils drei Dateisysteme in Göttingen und Berlin.
Die Dateisysteme der ersten Phase des HLRN-IV in Göttingen (Vordergund) und Computeknoten (Hintergrund)
Das HOME Filesystem basiert auf DDN GRIDScaler (Spectrum Scale) mit DDN SFA7700X Block-Storage. Es bietet 340TiB Speicherplatz, wovon den Nutzern 280TiB zur Verfügung stehen. Die verlbeibenden 60TiB stehen für Snapshots und Softwareinstallationen zur Verfügung. Das Dateisystem bietet Disk-Quotas und Inode-Quotas für Gruppen und Nutzer, die auf allen Knoten bei Dateizugriffen verarbeitet werden können. Es werden hard-/soft-limits, grace periods usw. unterstützt. Disk-/Inode-Quotas mit Soft/Hard-Limits sowie „grace periods“ können für Nutzer, Gruppen und per Fileset konfiguriert werden. Das Dateisystem wird an die Login und Compute Knoten mittels NFS exportiert.
Das HOME Dateisystem wird kontinuierlich gesichert und es werden tägliche Snapshots des Systems gemacht.
Das WORK Filesystem basiert auf DDN EXAScaler (DDN Lustre) und pro Standort werden 2 x DDN ES18K Embedded-Storage Systeme mit integrierten OSS und einer skalierbaren MDS Einheit installiert. Das Storagesystem verfügt pro Standort über eine Nettokapazität von 8,1PiB und eine Schreib-/Lese-Performance von 81GiB/s.
Das WORK Dateisystem hat kein automatisches Backup.
Für das Archiv wird in Göttingen eine Tape-Library mit StorNext als Dateisystem bereitgestellt. Der Zugriff auf das Archiv soll von den Login-Knoten erfolgen. Dazu sollen die Login Knoten mittels NFS auf das StorNext Dateisystem des Archivs zugreifen können. Von den Vorrechnern soll eine Einzelstrombandbreite von 1 GiByte/s und eine aggregierte Bandbreite von 5 GiByte/s zu den Archiv-Servern erzielt werden, wofür eine ausreichende Netzwerkanbindung zwischen Archiv-Servern und Vorrechnern angeboten werden soll. (Wie ist hier der aktuelle Status?)
Das ZIB betreibt derzeit ein Hierarchical Storage Management (HSM) System mit Sun StorEdge SAM-FS als Steuersoftware.