Search

Home

GROUPING

GROUPING

Operator GROUPING umożliwia wykonanie operacji grupowania danych na strumieniu wejściowym magistrali. Działanie operatora polega na wyodrębnieniu unikalnych kombinacji wartości w wybranych kolumnach (bitach), które tworzą tzw. klucz grupujący.

Dla każdej unikalnej sekwencji wartości w kolumnach klucza grupującego zostaje wygenerowany jeden rekord wynikowy. Kolumny niebędące częścią klucza muszą zostać przetworzone za pomocą wskazanej funkcji agregującej, np.:

  • maksymalna wartość,
  • minimalna wartość,
  • suma,
  • średnia,
  • liczba wystąpień,

Operator działa dla całego zbioru danych dostępnego na wejściu, umożliwiając konsolidację danych w postaci zagregowanej.

Typowe zastosowania operatora GROUPING obejmują:

  • usuwanie duplikatów w oparciu o wybrane kryteria,
  • tworzenie raportów zbiorczych,
  • przygotowanie danych do dalszego przetwarzania w postaci uproszczonej.

Przykład projektu GRAVITY z użyciem operatora GROUPING

image

KONFIGURACJA ZASAD GRUPOWANIA

image

Możesz ustawić klucz grupujący, składający się dowolnej liczby kolumn magistrali poprzez akcję drag and drop (chwytasz kolumnę magistrali wchodzącej i upuszczasz na listę klucza grupującego). Ponadto, dla pozostałych kolumn magistrali wchodzącej określasz funkcję agregacyjną BEHAVIOUR TYPE

  • MAX
  • MIN
  • SUM
  • COUNT
  • AVG

Na wyjściu operatora będziesz miał strumień danych przetworzonych o tej samej szerokości (czyli tej samej liczbie kolumn) co w zbiór kolumn grupowanych i agregowanych.