Kategorie
O KonektoSmart

OCR dokumentów – wersja BETA

OCR (ang. optical character recognition – optyczne rozpoznawanie znaków) to elektroniczna konwersja plików z obrazami (zdjęcia, skany) zawierających tekst na “czysty” tekst. W księgowości technologia ta często jest wykorzystywana m.in do automatycznego uzupełniania faktur. Taką rolę pełni również u nas: przedstawiamy nowy, darmowy moduł OCR w KonektoSmart!*

*Nasz zespół jest nadal w trakcie rozwijania opcji OCR-owania plików, dlatego informujemy, że mogą występować błędy w odczycie dokumentów (przepraszamy za niedogodności). Chcemy wyposażyć ten moduł w elementy sztucznej inteligencji, tak aby algorytm uczył się na każdej dodanej fakturze, co w przyszłości zapewni w większości przypadków 100% zgodność odczytu z oryginalnym dokumentem. Dopracowanie tego elementu jest naszym priorytetem, zdecydowaliśmy się jednak na przedstawienie tej funkcjonalności Państwu już teraz, w wersji BETA, dzięki czemu zapoznacie się z wyglądem i działaniem naszego OCR-a. Prosimy o przesyłanie opinii dotyczących sposobu wyświetlania i edytowania informacji (np. czy wszystko jest czytelne i wystarczająco intuicyjne oraz czy eksport do programów księgowych działa jak należy) na adres e-mail: kontakt@konektosmart.pl. Dziękujemy za wyrozumiałość.

Od teraz, każdy dokument wgrany na naszą platformę będzie automatycznie poddany cyfrowej obróbce: system samodzielnie odczyta zawartość zdjęcia lub pdf i przekonwertuje ją na plik .JPK gotowy do pobrania przez program księgowy.

Nowy widok dokumentów w Panelu Administracji Biura Księgowego.

Po dodaniu nowego zdjęcia lub skanu faktury do działu DOKUMENTY, w kolumnie STATUS po prawej stronie wyświetli się szara ikonka z zegarem. Po najechaniu na nią pojawi się komunikat “Dokument oczekuje w kolejce do digitalizacji”. Aby rozpocząć proces wystarczy odświeżyć stronę. Ikona zmieni wtedy kolor. Może być to:

  • jasnoszary (z przekreślonym napisem OCR), kiedy procedura nie jest dostępna dla tego formatu pliku (np. system nie wykrył w nim tekstu).
  • pomarańczowy (wraz z procentową ilością rozpoznanego tekstu w dokumencie), kiedy dokument wymaga weryfikacji (sprawdzenia, czy dane odczytane przez moduł OCR zgadzają się z rzeczywistością).
Widok dokumentów wraz ze statusem OCR: oczekujący, zweryfikowany, przetworzony, błędny format.

Ikona zmieni również kolor (na zielony) po zweryfikowaniu i  zatwierdzeniu dokumentu. W przypadku napotkania przez system nieścisłości (np. zbyt wczesna data wystawienia) przy numerze dokumentu zostanie wyświetlona ikona pomarańczowego trójkąta ostrzegawczego.

Trójkąt z wykrzyknikiem przy numerze dokumentu oznacza błąd w trakcie digitalizacji.

Aby otworzyć podgląd dokumentu wystarczy kliknąć na załadowany plik. Wyświetli się wtedy poniższy widok:

Widok dokumentu wraz z nową zakładką DIGITALIZACJA/OCR [BETA]

W zakładce DIGITALIZACJA/OCR sprawdzą Państwo, jakie dane udało się uzupełnić automatycznie i są gotowe do eksportu do pliku JPK. W przypadku nieprawidłowego (lub, co będzie na razie częstsze, niepełnego) odczytania danych przez system istnieje możliwość ręcznej korekty w tym samym miejscu.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *