Operator GROUPING umożliwia wykonanie operacji grupowania danych na strumieniu wejściowym magistrali. Działanie operatora polega na wyodrębnieniu unikalnych kombinacji wartości w wybranych kolumnach (bitach), które tworzą tzw. klucz grupujący.
Dla każdej unikalnej sekwencji wartości w kolumnach klucza grupującego zostaje wygenerowany jeden rekord wynikowy. Kolumny niebędące częścią klucza muszą zostać przetworzone za pomocą wskazanej funkcji agregującej, np.:
- maksymalna wartość,
- minimalna wartość,
- suma,
- średnia,
- liczba wystąpień,
Operator działa dla całego zbioru danych dostępnego na wejściu, umożliwiając konsolidację danych w postaci zagregowanej.
Typowe zastosowania operatora GROUPING obejmują:
- usuwanie duplikatów w oparciu o wybrane kryteria,
- tworzenie raportów zbiorczych,
- przygotowanie danych do dalszego przetwarzania w postaci uproszczonej.
Przykład projektu GRAVITY z użyciem operatora GROUPING
KONFIGURACJA ZASAD GRUPOWANIA
Możesz ustawić klucz grupujący, składający się dowolnej liczby kolumn magistrali poprzez akcję drag and drop (chwytasz kolumnę magistrali wchodzącej i upuszczasz na listę klucza grupującego). Ponadto, dla pozostałych kolumn magistrali wchodzącej określasz funkcję agregacyjną BEHAVIOUR TYPE
MAX
MIN
SUM
COUNT
AVG
Na wyjściu operatora będziesz miał strumień danych przetworzonych o tej samej szerokości (czyli tej samej liczbie kolumn) co w zbiór kolumn grupowanych i agregowanych.