Projektüberblick
MLOps Plattform für datengetriebene Analysen
Ziel war der Aufbau einer skalierbaren Plattform zur Umsetzung moderner MLOps-Praktiken für verschiedene Data-Science-Teams. Die Plattform sollte eine standardisierte Grundlage schaffen, um Machine-Learning-Modelle effizient zu entwickeln, zu testen, bereitzustellen und zu überwachen.
Umsetzung:
Die Plattform wurde vollständig Infrastructure-as-Code basiert aufgebaut. Dabei kamen modularisierte Terraform-Module zum Einsatz, die eine wiederverwendbare Bereitstellung von Komponenten wie Netzwerk, Compute-Ressourcen, Datenhaltung und Modellbereitstellung ermöglichten.
Zur Automatisierung und Orchestrierung wurden zentrale Dienste wie GitLab CI/CD, Argo CD und Keycloak integriert. Mit GitLab wurden wiederverwendbare CI/CD-Pipelines entwickelt, die Trainings-, Test- und Deploymentphasen abbilden. Argo CD ermöglichte deklaratives Deployment von ML-Komponenten, während Keycloak ein zentrales Rollen- und Zugriffskonzept bot.
Die Plattform wurde in enger Zusammenarbeit mit mehreren Data-Science-Teams entwickelt, getestet und iterativ verbessert. So entstand eine stabile, dokumentierte Umgebung, die individuelle Projektanforderungen berücksichtigt und gleichzeitig Unternehmensrichtlinien erfüllt.