🎯 Definicja
Wirtualizacja Danych to dostęp do danych bez ich przenoszenia. Zamiast kopiować dane z CRM, ERP i Excela do jednej Hurtowni (ETL), tworzysz “Wirtualną Warstwę”, która odpytuje te systemy w czasie rzeczywistym, udając, że jest jedną bazą.
🔑 Kluczowe punkty
- No Data Movement: Dane zostają u źródła. Zero kopiowania.
- Real-Time: Widzisz dane takie, jakie są teraz w systemie źródłowym.
- Federated Query: Jedno zapytanie SQL łączy dane z Oracle (CRM) i pliku CSV (Excel).
📚 Szczegółowe wyjaśnienie
Tradycyjne ETL: Kopiuj wszystko do Data Warehouse. Zajmuje to czas i miejsce. Wirtualizacja: Użytkownik pyta o “Klientów”. Wirtualizator w tle pyta Oracle’a, pyta Salesforce’a, skleja wyniki w pamięci RAM i oddaje użytkownikowi. Technologie: Denodo, Dremio, Trino (Presto). Dremio używa Apache Arrow do szybkiego przetwarzania w pamięci.
💡 Przykład zastosowania
Firma fuzjuje się z drugą. Firma A ma SAP. Firma B ma Oracle. Zmigrowanie danych zajmie 2 lata. Stawiają Wirtualizację (np. Denodo). W tydzień mogą raportować sprzedaż z obu firm łącznie, mimo że systemy są oddzielne.
📌 Źródła
- Dremio - What is Data Virtualization?
👽 Brudnopis
- Zaleta: Szybkość wdrożenia (Days vs Months).
- Wada: Wydajność (Zapytanie jest tak wolne, jak najwolniejsze źródło). Nie nadaje się do ciężkiej analityki historycznej.