🎯 Definicja

SQL Catalog Item w Ataccama ONE to “wirtualna tabela”. Nie istnieje fizycznie w bazie, jest wynikiem zapytania SQL zapisanego w katalogu. Działa jak VIEW w bazie danych, ale jest zarządzane przez Data Catalog.

🔑 Kluczowe punkty

  • Bez ETL: Nie musisz prosić IT o stworzenie nowej tabeli w hurtowni. Wpisujesz SQL w katalogu i masz “nowy zbiór danych”.
  • Szybkie prototypowanie: Analityk może stworzyć sobie widok “Klienci VIP z Warszawy”, sprofilować go i sprawdzić jakość, zanim poprosi inżynierów o wdrożenie.
  • Lineage: System wie, skąd pochodzą dane (parsuje SQL).

📚 Szczegółowe wyjaśnienie

Tworzysz nowy Item w katalogu. Wybierasz typ: SQL. Wpisujesz query:

SELECT c.name, o.amount
FROM customers c
JOIN orders o ON c.id = o.customer_id
WHERE o.year = 2024

Klikasz Save. Od teraz możesz na tym “wytworze” puszczać Profiling, DQ Monitoring, nakładać Glossary Termy, tak jakby to była prawdziwa tabela.

💡 Przykład zastosowania

Biznes potrzebuje raportu DQ dla “Klientów Aktywnych” (którzy kupili coś w ostatnim roku). W bazie jest tylko tabela ALL_CUSTOMERS (10 mln rekordów, w tym martwe dusze). Zamiast monitorować całość (drogo/wolno), tworzysz SQL Catalog Item filtrujący tylko aktywnych. Monitorujesz ten mniejszy zbiór. Raport jest precyzyjny i dotyczy tylko tego, co interesuje biznes.

📌 Źródła

  • Ataccama ONE Catalog Documentation.

👽 Brudnopis

  • Uwaga na wydajność. Każde działanie na tym Itemie (np. Profiling) uruchamia ten SQL w bazie źródłowej. Jeśli SQL jest ciężki, “zabijesz” bazę produkcyjną.