Operator OCR (Optical Character Recognition) umożliwia automatyczne rozpoznanie i wyodrębnienie tekstu z danych graficznych lub dokumentów PDF znajdujących się w bicie magistrali danych. Operator analizuje zawartość binarną (np. obraz zeskanowanego dokumentu lub załącznik PDF) i przekształca ją w tekst możliwy do dalszego przetwarzania w systemie GRAVITY.
Rozpoznany tekst zostaje zapisany jako nowy bit magistrali lub nadpisuje istniejący bit tekstowy – zgodnie z konfiguracją operatora.
Przykład projektu z wykorzystaniem operatora OCR.
Operator przetwarza każdy rekord magistrali danych, a wynik rozpoznania tekstu zapisuje do bitu tekstowego w rozpoznawanym rekordzie.
KONFIGURACJA OPERATORA
Konfiguracja operatora sprowadza się do wskazania bitu danych magistrali transportującego dane binarne (pole In bit), bitu gdzie ma zostać zapisany rozpoznany tekst (pole Out bit) oraz formatu danych z jakiego operator ma rozpoznać tekst (graficzny lub PDF).