Operator INPUT GOOGLE umożliwia pobranie plików oraz definicji arkuszy Google Sheets z dysku Google powiązanego z uwierzytelnionym kontem użytkownika.
- Na wejściu operatora wskazuje się plik danych lub katalog z plikami do pobrania.
- Na wyjściu operator generuje magistralę danych zawierającą strumień rekordów.
- Struktura magistrali wyjściowej jest uzależniona od typu pobranego pliku, co pozwala na elastyczne przetwarzanie różnych formatów danych.
Operator INPUT GOOGLE jest użyteczny w procesach, w których dane są współdzielone lub udostępniane za pośrednictwem platformy Google Workspace i muszą zostać wczytane do systemu GRAVITY w sposób automatyczny i cykliczny.
WYBÓR I TWORZENIE POŁĄCZENIA GOOGLE
Aby móc połączyć się z wybranym kontem Google, musisz wskazać wybrane połączenie Google. Przejdź do pierwszej zakładki właściwości operatora - Google account connection.
W polu Connection wybierz wcześniej zdefiniowane połączenia. Jeśli nie masz jeszcze żadnego połączenia lub chcesz dodać nowe, możesz użyć przycisku Add, aby je utworzyć.
OBSŁUGIWANE TYPY PLIKÓW
Operator może pobierać pliki typu binarnego lub tekstowego z dysku Google - bez interpretacji zawartości - albo pliki typu spreadsheet, wraz z interpretacją zawartości i utworzeniem magistrali na podstawie danych.
W zależności od wybranego typu pobieranych plików, przeglądarka dysku Google, uruchamiana przyciskiem Select a source from google na zakładce Google File, filtruje wyniki, wyświetlając wyłącznie pliki zgodne z tym typem.
- Dla typu Spreadsheet przeglądarka wyświetla tylko pliki typu Google Spreadsheet i umożliwia wybranie wyłącznie tego rodzaju pliku.
- Dla typu Binary file przeglądarka wyświetla tylko pliki zawierające dane binarne.
- Dla typu Text file przeglądarka wyświetla tylko pliki zawierające dane tekstowe.
Dla typów Binary file i Text file możliwy jest wybór całego folderu. W takim przypadku operator w trakcie przetwarzania pobierze z folderu wszystkie pliki typu binarnego lub tekstowego.
Po wyborze pliku lub folderu, pola File name, FileId oraz Mimetype zostaną uzupełnione zgodnie z dokonanym wyborem.
TYP PLIKÓW GOOGLE SPREADSHEET
Po wyborze pliku typu Google Spreadsheet w przeglądarce plików Google znajdziesz na zakładce File information informacje umożliwiające rozkodowanie danych z arkusza. Ponieważ arkusz ma podobną strukturę jak plik programu Excel, należy określić, w jaki sposób ułożone są dane w arkuszu.
Poniższe pola pozwalają opisać strukturę danych w arkuszu:
- Sheet name → określa, z którego arkusza mają być pobierane dane,
- Caption included → określa, czy dane zawierają nagłówki,
- in row → wskazuje, w którym wierszu znajdują się nagłówki,
- Skip first → określa, ile wierszy należy pominąć.
Po zdefiniowaniu struktury arkusza możesz kliknąć przycisk Test w celu sprawdzenia danych pobranych z arkusza.
Na zakładce Column należy wygenerować bity magistrali danych wychodzącej z operatora, klikając w przycisk Autogenerate columns.
System automatycznie nada nazwy bitom danych magistrali oraz określi ich typy danych na podstawie informacji z przetworzonego arkusza. Jeśli chcesz zmienić nazwę lub typ danych, kliknij odpowiednie pole i wpisz nową nazwę lub wybierz właściwy typ.
TYPY PLIKÓW BINARY FILE I TEXT FILE
Po wybraniu pliku lub folderu, na zakładce File information wyświetlana jest informacja o trybie działania (Single file lub All file in the dictionary). Znajduje się tam także przycisk Test, który umożliwia pobranie plików i przegląd pobranych metadanych.
Po kliknięciu w przycisk Test, możesz sprawdzić pobrane dane.
Na zakładce Columns musisz wygenerować bity dla magistrali danych wychodzącej z operatora. Służy do tego przycisk Autogenerate columns.
Zarówno dla typu Binary file, jak i Text file, generowane są takie same bity kolumn. Wyjątek stanowi ostatnie pole, które przechowuje dane pliku. Dla typu Binary file pole to nazywa się data i przechowuje dane binarne, widoczne na magistrali w trybie debug jako dane zakodowane w base64. Natomiast dla typu Text file pole nazywa się textData i przechowuje dane tekstowe.