Aufgaben:
* Überwachung von LSF, Leistung und Arbeitsabläufen
* Implementierung von Best Practices und Common Practices auf LSF Explorer
* Installation, Betrieb, Anpassung und Wartung von RTM
* Nutzung von APIs (REST, Python API)
* Durchführung von Schulungen zu den neuesten 2-3 LSF-Versionen mit Schwerpunkt auf GPU Verbesserungen und Reporting
* Konfigurieren von Scheduling für GPU, Speicherlimits, Affinity Strings, SLA, Fairshare und deren Interoperabilität
* Verwaltung von Job-Abhängigkeitsgruppen und Profilerstellung
* Implementierung von datenbewusstem Scheduling und Best Practices für das Datenmanagement
* Entwicklung und Schulung zu interaktiven Workload-Strategien
* Implementierung und Schulung zu Datenmanagement und Resource Connector in AWS
* Entwicklung und Präsentation von Migrationsstrategien von anderen Schedulern (wie PBS und SLURM)
Qualifikationen:
* Eingehende Kenntnisse von IBM Spectrum LSF
* Erfahrung in der Überwachung und Leistungsoptimierung von LSF-Systemen
* Kenntnisse in der Installation, dem Betrieb und der Anpassung von RTM
* Vertrautheit mit APIs (REST, Python API)
* Erfahrung mit GPU-Optimierung in LSF
* Kenntnisse in der Konfiguration von Scheduling für GPU, Speichergrenzen, SLA, Fairshare und deren Interoperabilität
* Kenntnisse im Bereich Datenmanagement und datengesteuerte Planung
* Erfahrung mit AWS-Integration
* Fähigkeiten in der Entwicklung von Migrationsstrategien von anderen Schedulern
* Ausgezeichnete Kommunikationsfähigkeiten in Englisch und Deutsch
* Fähigkeit, Schulungen zu leiten und effektive Anweisungen zu geben
Was wir bieten:
* Abwechslungsreiche Tätigkeit in einem renommierten Unternehmen
* Remote-Möglichkeit
#J-18808-Ljbffr