🎯 Definicja

Deployment modeli uczenia maszynowego to proces przeniesienia wytrenowanego modelu z fazy eksperymentalnej (rozwoju) do środowiska produkcyjnego, gdzie model realnie obsługuje zapytania użytkowników lub systemów. Jest to kluczowy element cyklu życia ML – umożliwia wykorzystanie predykcji modelu w aplikacjach, API, automatyzacji oraz podejmowaniu decyzji biznesowych.

🔑 Kluczowe aspekty procesu

Obejmuje zbieranie danych, przygotowanie, trening i walidację modelu, a następnie jego opakowanie i opublikowanie jako aplikacji lub usługi.
Wymaga zadbania o wersjonowanie kodu, danych i samych modeli (np. MLflow, DVC).
Ważne są aspekty bezpieczeństwa: izolacja danych, kontrola dostępu, monitorowanie podatności oraz ochrona przed atakami (np. poisoning, inference attacks).
Oceniane są metryki jakości, monitorowana drift danych oraz wydajność inferencji.
Możliwa automatyzacja przez pipeline’y CI/CD (OpenShift Pipelines, GitHub Actions, Argo CD), z integracją testów jednostkowych, integracyjnych i wydajnościowych.
Model można wdrażać jako dedykowaną usługę API (Flask, FastAPI, Django), w kontenerze (Docker/Kubernetes), lub z użyciem dedykowanych serwerów modelowych (TensorFlow Serving, TorchServe, ONNX Runtime) i platform MLOps (KServe/KFServing, Hugging Face Spaces, Gradio).
Monitorowanie po wdrożeniu: stale śledzi się metryki trafności, wykorzystania oraz anomalii, umożliwiając aktywne reagowanie i szybki rollback w razie pogorszenia jakości predykcji.

📚 Szczegółowe wyjaśnienie

Typowe etapy deploymentu modeli ML

Przygotowanie i trening modelu
- Identyfikacja problemu, zebranie/budowa odpowiedniego zbioru danych.
- Analiza, czyszczenie, eksploracja danych (w tym obrazowych – resize, augmentacje, usuwanie błędnych elementów).
- Trening i ewaluacja modelu. Analiza błędów z macierzy confusion matrix, przegląd strat i trudnych przypadków.
Pakowanie i opakowanie modelu
- Eksporotowanie modelu do formatu produkcyjnego (.pkl, .h5, ONNX, TorchScript itd.).
- Implementacja endpointu API (np. FastAPI, Flask).
- Konteneryzacja: Docker, Kubernetes – wdrażanie jako deployment/cloud function.
- Możliwość użycia platform low-code/no-code (Gradio, Hugging Face Spaces) do prostych dem.
Automatyzacja wdrożenia (MLOps, CI/CD)
- Wersjonowanie kodu i modeli (MLflow, DVC).
- Testy automatyczne: jednostkowe, integracyjne, drift, performance.
- Pipeline’y CI/CD: automatyczne budowanie, testowanie i deployment, deployment blue-green/canary/rolling.
Serwowanie modelu
- Dedicated API: serwer modele (TensorFlow Serving, TorchServe, ONNX Runtime) lub własne mikroserwisy.
- Modele serverless: KServe, AWS Lambda, OpenShift Serverless – automatyczna skalowalność, płatność za realne użycie.
- Możliwość AB testingu, shadow deploy, rollback w razie regresji.
Monitorowanie i utrzymanie
- Monitoring funkcjonalny (pomiary performance, latency).
- Drift data/modelu i alerty jakości.
- Obsługa aktualizacji, retraining i deployment kolejnych wersji.

💡 Przykład zastosowania

Zespół buduje klasyfikator obrazów – od pobrania i pre-processing kolekcji zdjęć, przez trening w Jupyterze i analizę macierzy pomyłek, po wdrożenie modelu jako REST API w FastAPI/Docker na Kubernetesie. Używa Gradio do szybkiego prototypowania dem, MLflow do śledzenia wersji, OpenShift Pipelines do CI/CD oraz promuje automatyzację monitoringu i retrainingu przy drifcie danych.

✅ Najlepsze praktyki deploymentu modeli ML

Obszar	Przykłady dobrych praktyk
Wersjonowanie	MLflow, DVC – pełna ścieżka modelu/kodu/danych
Testowanie	Jednostkowe, integracyjne, wydajnościowe, drift-testy
Automatyzacja CI/CD	ArgoCD, Tekton, GitHub Actions, Webhooki po danych/treningu
Monitorowanie	Prometheus, custom logs/alerts, monitorowanie jakości metryk
Bezpieczeństwo	Ograniczone uprawnienia, skanowanie obrazów i podatności
Ponawianie i rollback	Automatyczne rollbacki przy pogorszeniu wyników, backupy
Skalowanie	Autoscaling CPU/GPU, serverless deployment
Opakowania modeli	Kontenery, serwery modele, Gradio/HF Spaces do MVP
Utrzymanie	System obsługi aktualizacji, samoczynny retraining, feedback usera

📌 Źródła

EITT: Intensywne Warsztaty ML
ICM: Praktyki MLOps dla deploymentów
Hostersi: Bezpieczeństwo ML Deployment
EITT: Orkiestracja ML na Kubernetes/OpenShift
DS Stream: Best Practices MLOps

👽 Brudnopis

Deployment = od notebooka przez testy do serwisu API, mechanizmy automatyczne!
Low code (Gradio, HF Spaces) super jako MVP/pokaz/VAL, ale produkcja = Docker/K8s/CI/CD.
Automatyzacja retrainów, monitoring metryk jakości i kosztów.
Blue-Green, Canary, Shadow deployment = zero downtime.
Modes: batch, online, edge (Arduino/Jetson).
ML + DevOps = MLOps, kluczowe w Data Engineering.

Quartz 4

Explorer

Deployment modeli