🎯 Definicja

Mechanizm tagowania silników przetwarzania (DPE) w Ataccama ONE, pozwalający na precyzyjne kierowanie zadań (jobs) do konkretnych instancji DPE na podstawie lokalizacji danych, wymagań bezpieczeństwa lub specyfiki infrastruktury.

🔑 Kluczowe punkty

  • Routing Zadań: Etykiety decydują, który DPE przetworzy dane źródło.
  • Bezpieczeństwo Sieciowe: Pozwalają przetwarzać dane wrażliwe “blisko źródła” (np. wewnątrz firewalla on-premise), bez konieczności otwierania dostępu do chmury dla wszystkich danych.
  • Domyślne zachowanie: Jeśli nie zdefiniowano etykiet, dowolny DPE może podjąć zadanie, co może prowadzić do błędów połączenia w środowiskach hybrydowych.

📚 Szczegółowe wyjaśnienie

W środowiskach hybrydowych (Hybrid Deployment), gdzie część usług działa w chmurze (SaaS/PaaS), a dane rezydują w lokalnych centrach danych (On-premise), etykiety są kluczowe. Możesz oznaczyć lokalny DPE etykietą PL-WARSAW-SECURE. Następnie w konfiguracji źródła danych (w ONE Web App) wskazujesz, że to źródło wymaga PL-WARSAW-SECURE. Dzięki temu platforma nie spróbuje zlecić przetwarzania tego źródła silnikowi w chmurze AWS, który nie ma fizycznego dostępu do lokalnej sieci.

💡 Przykład zastosowania

  • DPE A (Chmura): Etykieta cloud-general
  • DPE B (On-premise): Etykieta on-prem-financial
  • Źródło “Klienci Banku”: Wymaga on-prem-financial. Wynik: Profilowanie tabeli “Klienci Banku” zostanie wykonane wyłącznie przez DPE B.

📌 Źródła

👽 Brudnopis

Direct Traffic: Using DPE Labels for Targeted Processing What are DPE Labels?: DPE labels are used to target specific data processing engine for a data source. If no labels are defined, any source can use any label. Connector Settings: Connector settings on DPE must be correct in order to connect to data. Security: For on-prem connections, be sure to set up the correct keys. Hybrid Deployments: Important for restricting access to data sources within your network (hybrid DPE).