Job description:
Für unseren Kunden sind wir auf der Suche nach einem GitOps Experten (m/w/d) für das folgende Umfeld.
Laufzeit: 1.4.25
- 31.3.26
Auslastung: Full
Einsatzort: Remote, innerhalb EU
Scope:
Der Kunde betreibt eine umfangreiche Private und Public Cloud Infrastruktur, hierzu zählen ein eigens betriebener Sync & Share Service, ein hochverfügbarer und hochskalierbarer S3/Objektspeicher, sowie ein Infrastructure-as-a-Service (IaaS) Cloud-Dienst (auf der Basis von Apache CloudStack).
Zu den Public Cloud Services zählen neben den Hyperscaler-Angeboten im Bereich IaaS und PaaS auch die Bereitstellung von Microsoft 365 Service für den Kunden, sowie das darauf basierende KI-Chatbot “FhGenie”.
Für die Weiterentwicklung und Qualitätssicherung sowie Betrieb der neuen GitOps Container-Dienste Plattform in der Private Cloud basierend auf Rancher und Kubernetes besteht Bedarf an entsprechenden IT-Dienstleistungen.
Zielsetzung:
Um Qualitätsverbesserungen zu forcieren, die Weiterentwicklung im Rahmen von Minor Releases voranzutreiben und den Betrieb zu stärken, soll auch externe IT-Unterstützung hinsichtlich der Bearbeitung einzelner Arbeitspakete für die Leistungserbringung genutzt werden.
Die GitOps Infrastruktur-Landschaft basiert auf einer Architektur mit einem Management
- und ca. 5-10 Downstream Clustern, vCenter/NetApp als Backend, mit zunehmender Anzahl produktiver Workloads. Es gibt Test
- und Produktivsysteme. Im Einsatz sind weiterhin HashiCorp Vault, Kyverno, Palo Alto, efficientIP sowie ACME.
Der Continous Delivery Prozess findet mit Hilfe von GitLab CI/CD und ArgoCD statt, mit GitLab Docker-Runnern und Packer, Terraform
- sowie Ansible-Komponenten.
Skills (müssen jeweils abgedeckt sein):
- vCenter
- NetApp
- Palo Alto
- efficientIP
Tätigkeiten:
Arbeitspaket 1: Aufbau von Logging
- und Monitoring-Grundstrukturen
1\. Tätigkeiten/Arbeitsschritte
- Analyse der bestehenden Plattform und Anforderungen an Observability (z. B.Definition notwendiger KPIs).
- Konzeption und Planung eines skalierbaren Logging
- und Monitoring-Grundgerüsts.
- Integration der bestehenden GitOps-Prozesse für automatisierten Rollout vonMonitoring-/Logging-Komponenten.
- Implementierung der Konfigurationen und Dashboards für das zentrale Monitoring.
- Test der Erfassung von System-, Anwendungs
- und Netzwerk-Logs in Test
- undProduktivumgebungen.
- Dokumentation der implementierten Lösungen, Übergabe ans Betriebsteam.
2\. Benötigte Kompetenzen
- Fundierte Erfahrung mit Kubernetes
- und Container-Integrationen.
- Expertise im Bereich Observability (z. B. Logging-, Monitoring-Konzepte) und GitOps.
- Verständnis von Infrastruktur-Lifecycle und Cloud-nativen Plattformen.
3\. Geschätzter Aufwand (ca. 400 Stunden)
- Analyse & Konzeption
- Implementierung & Konfiguration
- Test & Qualitätssicherung
- Dokumentation & Wissenstransfer
Arbeitspaket 2: Skalierung und Hochverfügbarkeit von Logging & Monitoring
1\. Tätigkeiten/Arbeitsschritte
- Evaluierung global verteilter Architekturen und Redundanzmechanismen für Observability.
- Ausarbeitung eines skalierbaren Clustering-Konzepts für die Logging
- und Monitoring-Services.
- Implementierung von Lastverteilung und automatischen Failover-Konfigurationen.
- Einrichtung von Alarmierung und automatisierten Recovery-Prozessen.
- Durchführung von Load
- und Stresstests zur Evaluierung der Hochverfügbarkeitsmechanismen.
- Dokumentation und Übergabe an Betrieb/Support (inkl. Eskalationspläne).
2\. Benötigte Kompetenzen
- Tiefe Kenntnisse über Kubernetes-Cluster-Architekturen und Skalierung.
- Erfahrungen mit verteilten Log
- und Monitoring-Systemen.
- Expertise in GitOps-gesteuerten Rollouts und automatisierten Konfigurationsänderungen.
3\. Geschätzter Aufwand (ca. 400 Stunden)
- Analyse & Architekturplanung
- Implementierung & HA-Konfigurationen
- Tests (Load, Failover), Qualitätssicherung
- Dokumentation & Betriebskonzept
Arbeitspaket 3: Rapid GitOps Prototyping mit Netzwerk-Betriebsteams
1\. Tätigkeiten/Arbeitsschritte
- Gemeinsame Workshops mit Netzwerk
- und Infrastruktur-Teams zur Abstimmung georedundanter Anforderungen.
- Aufbau eines minimalen GitOps-Prototyps zur automatisierten Cluster-Erstellung. und -Synchronisierung über mehrere Standorte hinweg.
- Entwicklung eines verbindlichen Konfigurationsmodells für Netzwerk-, Security
- und Cluster-Policies.
- Test und Validierung der Prototypen (z. B. Failover-Szenarien, Synchronisationszeiten).
- Dokumentation der Ergebnisse, Empfehlung einer finalen Betriebsstrategie.
2\. Benötigte Kompetenzen
- Fortgeschrittene Kenntnisse in GitOps-Prinzipien, Kubernetes Multi-Cluster-Management und verteilten Architekturen.
- Erfahrung in Zusammenarbeit mit Netzwerk-Teams (z. B. bei Firewall-Policies und Routing).
- Beratungskompetenz, um Anforderungen innerhalb interdisziplinärer Teams zu moderieren.
3\. Geschätzter Aufwand (ca. 600 Stunden)
- Analyse & Workshop-Konzeption
- Prototypische Implementierung & GitOps-Aufbau
- Test & Abstimmung mit anderen Teams
- Dokumentation & Präsentation
Arbeitspaket 4: Backup-Realisierung im georedundanten Umfeld
1\. Tätigkeiten/Arbeitsschritte
- Analyse der aktuellen Datensicherungsprozesse und Anforderungen (z. B. Recovery Point/Time Objectives).
- Erstellung eines Konzepts für Backup
- und Restore-Prozesse, abgestimmt auf verteilte Kubernetes-Cluster.
- Implementierung automatisierter Backup-Jobs und Integration in das GitOps-Ökosystem.
- Test von Disaster-Recovery-Szenarien (inkl. Cross-Cluster-Restore).
- Finalisierung und Dokumentation des Backup-Prozesses inkl. Wartungs
- und Lifecycle-Konzept.
2\. Benötigte Kompetenzen
- Erfahrung in Container-basierten Backup-/Restore-Strategien und verteilten Systemen.
- GitOps-Know-how für das automatisierte Ausrollen von Sicherungskomponenten.
- Kenntnisse zu Geo-Redundanz und Failover-Mechanismen.
3\. Geschätzter Aufwand (ca. 400 Stunden)
- Anforderungsanalyse & Konzeptentwicklung
- Implementierung & Automatisierung
- Tests (DR-Szenarien), Qualitätssicherung
- Dokumentation & Übergabe