🎯 Definicja
Data Mesh to podejście organizacyjno-techniczne, które traktuje dane jako Produkt. Zamiast jednego, wielkiego, centralnego zespołu “Od Danych” (wąskie gardło), masz wiele zespołów domenowych (Sprzedaż, Logistyka, HR), które same dbają o swoje dane i wystawiają je innym.
🔑 Kluczowe punkty
- Domenowość: Zespół Logistyki najlepiej zna dane logistyczne. Niech oni je czyszczą i udostępniają.
- Self-Serve Platform: Centralne IT dostarcza tylko “infrastrukturę” (gotowe klocki: S3, Airflow, Catalog), żeby domeny nie musiały wymyślać koła na nowo.
- Federated Governance: Wspólne zasady (Standardy), ale lokalne wykonanie.
📚 Szczegółowe wyjaśnienie
Różnica vs Data Lake:
- Data Lake: Wrzuć wszystko do jednego wora, centralny zespół spróbuje to zrozumieć.
- Data Mesh: Każdy trzyma swoje, ale udostępnia przez standardowe interfejsy (Data Products). To jak mikroserwisy, ale dla analityki.
💡 Przykład zastosowania
Netflix. Zespół od “Rekomendacji” produkuje dane o tym, co kto oglądał. Zespół od “Produkcji Filmowej” bierze te dane (przez API/Tabelę), żeby decydować, jakich aktorów zatrudnić. Nie proszą centralnego zespołu “zróbcie nam raport”. Sami biorą Produkt Danych i robią analizę.
📌 Źródła
- Zhamak Dehghani - “Data Mesh Principles”.
👽 Brudnopis
- Data Mesh nie jest dla każdego. W małej firmie to overengineering. Wymaga kultury DevOps i dojrzałości.