Search

Home

INPUT GOOGLE

INPUT GOOGLE

Operator INPUT GOOGLE umożliwia pobranie plików oraz definicji arkuszy Google Sheets z dysku Google powiązanego z uwierzytelnionym kontem użytkownika.

  • Na wejściu operatora wskazuje się plik danych lub katalog z plikami do pobrania.
  • Na wyjściu operator generuje magistralę danych zawierającą strumień rekordów.
  • Struktura magistrali wyjściowej jest uzależniona od typu pobranego pliku, co pozwala na elastyczne przetwarzanie różnych formatów danych.

Operator INPUT GOOGLE jest użyteczny w procesach, w których dane są współdzielone lub udostępniane za pośrednictwem platformy Google Workspace i muszą zostać wczytane do systemu GRAVITY w sposób automatyczny i cykliczny.

WYBÓR I TWORZENIE POŁĄCZENIA GOOGLE

Aby móc połączyć się z wybranym kontem Google, musisz wskazać wybrane połączenie Google. Przejdź do pierwszej zakładki właściwości operatora - Google account connection.

image

W polu Connection wybierz wcześniej zdefiniowane połączenia. Jeśli nie masz jeszcze żadnego połączenia lub chcesz dodać nowe, możesz użyć przycisku Add, aby je utworzyć.

image
icon
Zobacz jak skonfigurować połączenie Google.

OBSŁUGIWANE TYPY PLIKÓW

Operator może pobierać pliki typu binarnego lub tekstowego z dysku Google - bez interpretacji zawartości - albo pliki typu spreadsheet, wraz z interpretacją zawartości i utworzeniem magistrali na podstawie danych.

image

W zależności od wybranego typu pobieranych plików, przeglądarka dysku Google, uruchamiana przyciskiem Select a source from google na zakładce Google File, filtruje wyniki, wyświetlając wyłącznie pliki zgodne z tym typem.

image
  • Dla typu Spreadsheet przeglądarka wyświetla tylko pliki typu Google Spreadsheet i umożliwia wybranie wyłącznie tego rodzaju pliku.
  • Dla typu Binary file przeglądarka wyświetla tylko pliki zawierające dane binarne.
  • Dla typu Text file przeglądarka wyświetla tylko pliki zawierające dane tekstowe.

Dla typów Binary file i Text file możliwy jest wybór całego folderu. W takim przypadku operator w trakcie przetwarzania pobierze z folderu wszystkie pliki typu binarnego lub tekstowego.

Po wyborze pliku lub folderu, pola File name, FileId oraz Mimetype zostaną uzupełnione zgodnie z dokonanym wyborem.

image
icon
Podczas pobierania plików lub folderów z dysku Google, system identyfikuje je na podstawie pola FileId. Jest to unikalny identyfikator zasobu, dzięki któremu można odróżnić elementy o takiej samej nazwie w ramach folderów.

TYP PLIKÓW GOOGLE SPREADSHEET

Po wyborze pliku typu Google Spreadsheet w przeglądarce plików Google znajdziesz na zakładce File information informacje umożliwiające rozkodowanie danych z arkusza. Ponieważ arkusz ma podobną strukturę jak plik programu Excel, należy określić, w jaki sposób ułożone są dane w arkuszu.

Poniższe pola pozwalają opisać strukturę danych w arkuszu:

  • Sheet name → określa, z którego arkusza mają być pobierane dane,
  • Caption included → określa, czy dane zawierają nagłówki,
  • in row → wskazuje, w którym wierszu znajdują się nagłówki,
  • Skip first → określa, ile wierszy należy pominąć.
image

Po zdefiniowaniu struktury arkusza możesz kliknąć przycisk Test w celu sprawdzenia danych pobranych z arkusza.

image

Na zakładce Column należy wygenerować bity magistrali danych wychodzącej z operatora, klikając w przycisk Autogenerate columns.

image

System automatycznie nada nazwy bitom danych magistrali oraz określi ich typy danych na podstawie informacji z przetworzonego arkusza. Jeśli chcesz zmienić nazwę lub typ danych, kliknij odpowiednie pole i wpisz nową nazwę lub wybierz właściwy typ.

icon
Przycisk Refresh with additional and missing columns pozostawia wcześniej wygenerowane kolumny bez zmian, chyba, że kolumna została usunięta z danych, oraz dodaje nowe kolumny, które wynikają ze zmienionych danych (ma sens dla typu plików Google Spreadsheet).

TYPY PLIKÓW BINARY FILE I TEXT FILE

Po wybraniu pliku lub folderu, na zakładce File information wyświetlana jest informacja o trybie działania (Single file lub All file in the dictionary). Znajduje się tam także przycisk Test, który umożliwia pobranie plików i przegląd pobranych metadanych.

image

Po kliknięciu w przycisk Test, możesz sprawdzić pobrane dane.

image

Na zakładce Columns musisz wygenerować bity dla magistrali danych wychodzącej z operatora. Służy do tego przycisk Autogenerate columns.

image

Zarówno dla typu Binary file, jak i Text file, generowane są takie same bity kolumn. Wyjątek stanowi ostatnie pole, które przechowuje dane pliku. Dla typu Binary file pole to nazywa się data i przechowuje dane binarne, widoczne na magistrali w trybie debug jako dane zakodowane w base64. Natomiast dla typu Text file pole nazywa się textData i przechowuje dane tekstowe.