🎯 Definicja

Fakty to dane ilościowe, mierzalne wartości przechowywane w środowisku hurtowni danych, które opisują zdarzenia zachodzące w czasie — np. sprzedaże, transakcje, zużycia, wizyty. Są one centralnym elementem modelu hurtowni danych i są powiązane z tzw. tabelami wymiarów (dimension tables), które opisują kontekst tych faktów (kto, co, kiedy, gdzie).

🔑 Kluczowe punkty

  • Fakty są zorientowane wokół procesu biznesowego (np. zakup, zamówienie, logowanie).
  • mierzalne — zazwyczaj liczbowe (ilość, wartość, czas trwania, cena).
  • Używane są do analityki, raportowania, agregacji i miar KPI.
  • Istnieją różne typy faktów: addytywne, póładdytywne, nieaddytywne.
  • Fakty są łączone z wymiarami za pomocą kluczy obcych (foreign keys).

📚 Szczegółowe wyjaśnienie

Przykład: tabela faktów sprzedaży

sale_idcustomer_idproduct_idstore_iddate_idquantitytotal_amount
110001P001S00120250102250.00
  • sale_id – identyfikator faktu (rekordu)
  • customer_id, product_id, store_id, date_id – klucze obce do tabel wymiarów
  • quantity, total_amount – dane ilościowe (miary)

Rodzaje faktów

Typ faktuOpis
AddytywneDodawalne w każdym wymiarze (np. ilość sprzedaży, suma przychodu)
PóładdytywneDodawalne tylko w niektórych wymiarach (np. saldo – po czasie nie)
NieaddytywneNie da się ich sumować (np. średnia temperatura, procent konwersji)

Fakty vs. wymiary

FaktyWymiary
Ilościowe, mierzalneOpisowe, kontekstowe
np. sprzedaż, koszt, ilośćnp. klient, produkt, sklep, czas
Zmieniają się częstoRzadziej aktualizowane (wolnozmienne)
Duże objętości danychRaczej mniejsze tabele referencyjne

💡 Przykład zastosowania

W hurtowni danych dla sieci handlowej tabela faktów rejestruje wszystkie transakcje sprzedaży. Analitycy mogą zsumować dane wg daty i produktu, aby uzyskać trendy sprzedaży lub policzyć łączną wartość zamówień wg klientów — co zasila dashboardy BI i raporty KPI.

📌 Źródła

👽 Brudnopis

  • Fakty to „czynności mierzalne” – punkty transakcyjne: sprzedaż, wizyta, koszt
  • Są centralnym punktem modelu gwiazdy (star schema)
  • Don’t confuse: fakt ≠ zdarzenie logiczne → fakt to wartość + kontekst (wymiary)
  • Kluczowy podział: addytywność względem wymiarów
  • Istotne przy projektowaniu agregacji, miar w systemach BI
  • Często przechowywane jako dane partycjonowane po czasie (date_id)
  • Współgrają z walidacją typu SCD (wolnozmienne wymiary)