🎯 Definicja

GenAI w Ataccama (Generative AI) to zestaw funkcjonalności opartych na sztucznej inteligencji generatywnej, zintegrowanej z platformą Ataccama ONE, które mają na celu zwiększenie produktywności zespołów danych, automatyzację powtarzalnych zadań oraz wspomaganie użytkowników w analizie i zarządzaniu danymi.

Funkcje te opierają się na dużych modelach językowych (LLM) i odnoszą się do wykorzystania naturalnego języka oraz AI w generowaniu opisu danych, reguł jakości i interakcji z katalogiem danych.

🔑 Kluczowe punkty

  • 🤖 Wspierana przez duże modele językowe (LLM) – umożliwia interakcję z danymi przez język naturalny.
  • 📋 Automatyczne generowanie: opisów zasobów danych, reguł DQ, raportów jakości danych.
  • 🔍 Inteligentna analiza danych, wykrywanie anomalii, klasyfikacja danych (np. PII).
  • 🧠 Asystent AI gotowy do odpowiadania na zapytania użytkowników w ramach katalogu danych.
  • 🚀 Przyspiesza wdrażanie projektów i eliminuje manualną, powtarzalną pracę.

📚 Szczegółowe wyjaśnienie

Kluczowe zastosowania GenAI w Ataccama

Funkcja GenAIOpis
🎯 Klasyfikacja danych (Data Classification)Automatyczne klasyfikowanie pól jako PII, NIP, numer konta itp.
📈 Wykrywanie anomalii (Anomaly Detection)AI wykrywa anomalie wartości danych lub wzorców
🧬 Dopasowywanie danych (Data Matching)GenAI wspiera rozpoznawanie rekordów podobnych lub zduplikowanych
📝 Generowanie reguł jakości (Gen. DQ rules)Można opisać regułę w języku naturalnym — AI tworzy definicję logiczną
🧾 Generowanie opisów (Gen. asset descriptions)Tworzy automatyczne opisy tabel, kolumn, terminów słownika
🔍 Zapytania przy użyciu języka naturalnegoWyszukiwanie danych/raportów/terminów na podstawie zapytań tekstowych
💬 AI AssistantChat z AI w katalogu – odpowiada na pytania, podpowiada, sugeruje dane
📊 AI-generated DQ reportsTworzenie podsumowań jakości danych automatycznie przez AI

Problemy, które rozwiązuje GenAI

  • 🤯 Brak zasobów: zespoły zarządzania danymi są często małe i przeciążone manualną pracą (często to < 0,1% załogi).
  • 🐢 Wolne wdrożenia: pisanie manualnych reguł jakości i wzbogacanie metadanych zajmuje dużo czasu.
  • 🔁 Powtarzalność: opisywanie pól, mapowanie terminów, tworzenie reguł od podstaw to czasochłonny obowiązek.
  • 🎛️ Niska akceptacja użytkowników nietechnicznych – AI eliminuje barierę interfejsu przez dialog językowy.

Jak działa?

  • Funkcjonalności GenAI uruchamiane są w wybranych sekcjach platformy:
    • ✓ Na poziomie katalogu danych (items, columns)
    • ✓ W edytorze reguł DQ
    • ✓ W słowniku terminów (glossary)
    • ✓ W panelu Asystenta lub czatu
  • Użytkownik może kliknąć: “Generate description” / “Ask AI” / “Build rule from plain text”
  • AI analizuje kontekst techniczny i metadane, a następnie generuje treść lub logikę

💡 Przykład zastosowania

  1. Użytkownik zaznacza kolumnę email_address w katalogu.
  2. Wybiera „Generate description” – AI tworzy:
    "Adres e-mail klienta używany do komunikacji i uwierzytelniania w systemie CRM."
  3. Następnie pisze w edytorze DSL:
    "Zaznacz rekord jako błąd, jeśli adres e-mail nie zawiera znaku @ lub pochodzi z domeny testowej"
    GenAI tworzy Syntax DSL i gotową do wdrożenia regułę jakości.

📌 Źródła

👽 Brudnopis

  • GenAI ma ułatwić onboarding i korzystanie z Ataccamy nietechnicznym użytkownikom
  • Wspierane elementy: reguły, katalog, glossary, monitoring (automat generuje DQ insight)
  • Wersje AI są trenowane m.in. na strukturach DSL (Ataccama), nazwach pola + prompt użytkownika
  • W przyszłości wsparcie dla feedback loop – AI uczy się, które generacje były przyjęte / odrzucone
  • Zastosowania do przyszłości: self-healing workflows, rekomendacje lineage, opisywanie dashboards