09.06.2016

OCR – optyczna pomoc tłumaczowi

Masz dość żmudnej i wyczerpującej pracy przy przepisywaniu obszernych tekstów? Musisz wykonać tłumaczenie błyskawicznie, bo Klient nie może dłużej czekać? Mamy na to sposób – optyczne rozpoznawanie tekstu (OCR). Od dzisiaj komputer wykona za Ciebie wiele zbędnych czynności za Ciebie. Oszczędność czasu i pieniędzy! Wkładamy tekst do skanera czy innego wielofunkcyjnego urządzenia, klikamy i… gotowe! Nawet specjalistyczne tłumaczenie medyczne czy finansowe może być wykonane dużo szybciej. Taka nagroda za wytrwałość.

Sprawa jednak nie jest taka prosta jakby mogło się wydawać. Sam skaner jest bardzo pomocny, ale najpierw potrzeba odpowiednio przetworzyć tekst, dlatego powinniście poznać magiczne trzy słowa – Optical Character Recognition (Optyczne rozpoznawanie znaków). Pozwoli zamienić dowolną grafikę na tekst. W jaki sposób? Już spieszymy z wyjaśnieniem. Pierwszy etap polega na wczytaniu strony w komputerze, np. w formie skanu, a następnie wykorzystujemy program do OCR, który sprytnie dzieli stronę na kilka stref, w poszukiwaniu treści. Innymi słowy – analizuję layout. Nie musimy nic robić ręcznie, gdyż program sam podzieli tekst na poszczególne akapity, zdania, słowa i znaki. Kolejność nieprzypadkowa. Następnie – w ostatnim etapie analizy układu strony – program jest w stanie stworzyć zbiór pojedynczych znaków w oparciu o wczytany dokument. Będzie to przydatne w kolejnych fazach optycznego rozpoznawanie tekstu. Program jest bardzo precyzyjny. Nie ma tutaj miejsca na pomyłkę, każdy szczegół ma znaczenie dla późniejszej analizy. Niektóre znaki w języku polskim wyglądają bardzo podobnie, dlatego identyfikacja to najważniejsza część całego procesu, dlatego bazuje zarówno na rozpoznawaniu wzorów, jak i cech. Ponadto, program podczas całościowej analizy, wykorzystuje profesjonalne słowniki, dzięki którym znaki przeistaczają się w słowa, słowa w zdania, a zdania w akapity. Oczywiście stosowana jest także korekta gramatyczna, aby wszystkie zwroty były maksymalnie poprawne. Jeśli cały proces zakończy się sukcesem, wtedy program zapisuje rozpoznaną stronę w formie pliku, np. .txt czy .pdf – najpopularniejszy format, który po zakończeniu całego procesu OCR oferuje dwie warstwy: obraz (skan) oraz tekst, dając nam możliwość swobodnego zaznaczania i przeszukiwania. Także nie marnujcie więcej czasu na żmudne przepisywanie tekstów – technologia przychodzi tutaj z dużą pomocą. W razie jakichkolwiek problemów, służymy oczywiście naszym doświadczeniem i infrastrukturą.

Blog

OCR – optyczna pomoc tłumaczowi