4 bezpłatne narzędzia OCR online poddane ostatecznemu testowi

4 bezpłatne narzędzia OCR online poddane ostatecznemu testowi

Jeśli chcesz przekonwertować dowolny tekst drukowany na tekst cyfrowy, który można kopiować, wklejać, edytować i wyszukiwać, musisz użyć skanerów do optycznego rozpoznawania znaków (OCR).





Gdy zdecydujesz się zeskanować lub zrobić zdjęcie dokumentu, zostanie on zapisany w formacie takim jak JPEG lub PDF. Oprogramowanie OCR może następnie rozpoznać litery i cyfry w tych dokumentach i przekonwertować je na przeszukiwalny plik PDF lub plik, który można edytować w programach takich jak Microsoft Word.





Problem polega na tym, że niektóre skanery OCR działają znacznie lepiej niż inne, a najlepsze są dość ciężkie dla portfela.





Na przykład Omnipage18 kosztuje 150 USD, ale jest szczególnie dobry w rozpoznawaniu różnych języków. Adobe Acrobat Pro DC kosztuje 400 dolarów, ale ma niesamowitą dokładność. ABBYY FineReader kosztuje 150 USD, ale świetnie sprawdza się w przekształcaniu dokumentów, takich jak czasopisma i broszury, w tekst, który można przeszukiwać. W dalszej części tego artykułu będziemy testować ofertę online firmy ABBYY.

Jeśli jednak szukasz darmowych alternatyw, które możesz pobieranie i używać w systemie Windows lub OS X, powinieneś wypróbować te narzędzia OCR . Ale jeśli wolisz skorzystać z darmowego, online Narzędzie OCR, czytaj dalej, ponieważ wypróbowaliśmy kilka najlepszych, z wynikami poniżej.



Test

Wygląda na to, że większość ludzi używa teraz swoich smartfonów do skanowania, postanowiłem użyć Aplikacja Evernote do skanowania (Bezpłatne na iOS i Androida). Zeskanowałem pierwszą stronę książki Richarda Dawkina Wspinaczka na górę nieprawdopodobna , aby zobaczyć, jakie wyniki możemy uzyskać dzięki bardzo prostemu formatowaniu. Zeskanowałem też stronę Tima Ferriss'a 4-godzinny szef kuchni wypróbować skanery z nieco bardziej skomplikowanym formatowaniem. Każdy z tych plików zapisałem jako PDF.

Dokumenty te zostały następnie przepuszczone przez niektóre z rzekomo najlepszych internetowych narzędzi OCR, aby sprawdzić, jak dobrze sobie radzą.





Bezpłatny OCR online [nie jest już dostępny]

Na szczęście nie jest wymagana rejestracja, aby korzystać z bezpłatnego OCR online. Byłem pod podwójnym wrażeniem, gdy zobaczyłem ich roszczenia do zachowania formatowania i układu mojego dokumentu.

Witryna twierdzi, że może obsługiwać formaty PDF, GIF, BMP, JPEG, TIFF i PNG jako dane wejściowe. Dane wyjściowe mogą być DOC, dokumentem tekstowym PDF, RTF i TXT. Niestety nie mogłem się dowiedzieć, czy mają limit rozmiaru pliku.





Podstawowy dokument do PDF

Przerobiony absolutnie perfekcyjnie. Nie ma nic więcej do powiedzenia! Jedziemy do bardzo Dobry początek.

Dokument podstawowy do DOC

Rzeczywiste słowa wydają się przekonwertowane bezbłędnie, z wyjątkiem „liczby” z „Mount Rushmore” jakoś BRAKUJĄCEGO. Jednak formatowanie to inna historia. Wiele przecinków zostało zastąpionych podkreśleniami, a w całym dokumencie wstawiono losowe spacje. Kiedy później zobaczysz, jak oprogramowanie premium wypadło w tym teście, nie jest to zły wysiłek w ogóle .

Złożony dokument do PDF

Złożony dokument do DOC

Tym razem konwersja trwała tylko 10 sekund, a tekst został ponownie przekonwertowany z około 95% dokładnością. Wystąpiły dziwne problemy z odstępami, a oprogramowanie miało problemy z konwersją czcionki w prawym górnym rogu dokumentu i pominęło kilka znaków tu i tam.

Werdykt

i2OCR

i2OCR przedstawia imponujące twierdzenia. Narzędzie rozpoznaje ponad 60 języków, obsługuje układy wielokolumnowe (poprzez usunięcie formatowania), nie ma limitów rozmiaru plików, może konwertować przesłane pliki oraz z adresów URL. Nie musisz się też rejestrować, aby korzystać z tego narzędzia.

Usługa działa po prostu wyodrębniając tekst z obrazu, a następnie wyświetlając niesformatowany tekst. Możesz szybko poprawić wszelkie błędy w widoku obok siebie, przed skopiowaniem tekstu do innych programów lub pobraniem w formacie DOC, PDF lub HTML.

Uwaga: kiedy próbowałem przesłać moje dokumenty PDF, zostały one odrzucone przez i2OCR, więc musiałem przekonwertować je na JPEG (robiąc zrzut ekranu, a następnie przesyłając pliki).

Dokument podstawowy na zwykły tekst

Złożony dokument na zwykły tekst

Większość tekstu została przekonwertowana bez zbyt wielu błędów, z wyjątkiem tytułu i przepisu w prawym górnym rogu, które były nieczytelne dla tego narzędzia. Sposób, w jaki kolumny zostały przekonwertowane na zwykły tekst, był daleki od ideału. Jeśli chcesz, aby ta konwersja była wykonalna, potrzeba dużo czasu, aby uporządkować wiersze w spójne zdania.

Werdykt

OCR online

OCR online obsługuje obecnie 46 różnych języków i może konwertować pliki PDF, JPG, BMP, TIFF i GIF na format Word, Excel lub zwykły tekst. Witryna twierdzi, że „przekonwertowane dokumenty wyglądają dokładnie tak samo jak oryginał – tabele, kolumny i grafika”.

Wersja, z której możesz korzystać bez rejestracji, pozwala na konwersję do 15 obrazów na godzinę (limit 5mb). Jeśli założysz konto, możesz kupić więcej stron poza tym limitem, a jednocześnie będziesz mógł konwertować wielostronicowe dokumenty i archiwa ZIP.

Dokument podstawowy do DOC

Podstawowy dokument przekonwertowany bezbłędnie poza cyfrą rzymską i nie odebranie. Zgodnie z obietnicą witryny formatowanie było dokładnie takie, jak w książce. Uznanie dla tego narzędzia.

Złożony dokument do DOC

Po rozczarowaniu poprzednimi narzędziami OCR do konwersji złożonego dokumentu, byłem pod ogromnym wrażeniem OCR online. Układ był prawie idealny, jak widać powyżej. Po raz kolejny jednak przepis nie został przyjęty zbyt dobrze, ale wszelkie inne drobne błędy były znikome.

Werdykt

Absolutnie fantastyczne wyniki Online OCR. Jedynym minusem, jaki widzę, jest to, że nie ma możliwości pobrania przekonwertowanych dokumentów w formacie PDF, ponieważ wspomniane formaty wyjściowe obejmują tylko DOCX, XLSX i TXT.

ABBYY FineReader Online (10-stronicowa wersja próbna)

Jak wspomniano wcześniej, firma ABBYY jest jednym z liderów rynku oprogramowania OCR, którego pełny program do pobrania kosztuje około 150 USD. Oferują 10-stronicowy bezpłatny okres próbny za swoje narzędzie online (wymagana rejestracja). W przypadku subskrypcji 5 USD ich narzędzie online pozwoli Ci przekonwertować 200 stron każdego miesiąca.

Akceptowane pliki mogą mieć do 100 MB w dowolnym z następujących formatów: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP i PNG. ABBYY rozpoznaje również prawie 200 języków. Wyjścia są szczególnie imponujące, z wyborem między DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 i EPUB.

Podczas okresu próbnego możesz nawet wypróbować kilka funkcji BETA. Pierwsza to opcja przetłumaczenia dokumentu na inny język. Drugim jest wyeksportowanie przekonwertowanego dokumentu na konto w chmurze, niezależnie od tego, czy jest to Dropbox, Dysk Google, Evernote, Microsoft OneDrive czy Box.

Podstawowy dokument do DOCX

Złożony dokument do DOCX

Po konwersji było bardzo mało błędów w tekście w dokumencie (oprócz OCR ponownie walczącego z czcionką przepisu!), ale formatowanie pozostawiało wiele do życzenia.

Trzy kolumny w jakiś sposób zajęły dwie strony, z kolumną środkową tylko pojawiające się na drugiej stronie. Gdybyś naprawdę chciał robić cokolwiek z tym przekonwertowanym dokumentem, skończyłoby się na wyrywaniu włosów.

Podstawowy dokument do PDF

Złożony dokument do PDF

Werdykt

Ostateczny wynik

Jeśli, jak większość ludzi, chcesz tylko zeskanować kilka artykułów z czasopism i kilka rachunków domowych, nie musisz edytować tych dokumentów. Dlatego konwersja bezpośrednio do pliku PDF będzie dla Ciebie odpowiednia, ponieważ nadal będziesz mógł przeszukiwać te dokumenty. W tym celu Free Online OCR był zdecydowanie najlepszym darmowym narzędziem, które testowaliśmy. Biorąc to pod uwagę, jeśli chcesz płacić 5 USD miesięcznie za niemal doskonałość, ABBYY FineReader online był nieco dokładniejszy.

Jeśli chodzi o konwersję dokumentów do DOC, nie udało nam się znaleźć idealnego rozwiązania, ale zdecydowanie najlepsze wyniki OCR online . Konwersja nie była idealna, ale integralność formatowania została w dużej mierze zachowana, a błędy były znikome. Kiedy porównamy te wyniki z ofertą „premium” firmy ABBYY, nie możesz nie być pod ogromnym wrażeniem.

W tym poście nie uwzględniliśmy funkcji OCR Dysku Google; trochę ze względu na wszechobecność Google, ale bardziej ze względu na to, że chcieliśmy przetestować kilka innych bezpłatnych usług OCR online.

Do Ciebie: Jakie inne internetowe narzędzia OCR poleciłbyś naszym czytelnikom? A którego wypróbowałeś, a którego nigdy więcej nie użyjesz?

Udział Udział Ćwierkać E-mail Przewodnik dla początkujących dotyczący animacji mowy

Animowanie mowy może być wyzwaniem. Jeśli jesteś gotowy, aby rozpocząć dodawanie dialogu do swojego projektu, podzielimy ten proces za Ciebie.

jak znajdujesz swoje filmy na facebooku?
Czytaj dalej Powiązane tematy
  • Internet
  • Wydajność
  • Konwersja plików
  • OCR
O autorze Rob Słowik(272 opublikowane artykuły)

Rob Nightingale jest absolwentem filozofii na Uniwersytecie York w Wielkiej Brytanii. Od ponad pięciu lat pracuje jako menedżer i konsultant ds. mediów społecznościowych, prowadząc warsztaty w kilku krajach. Przez ostatnie dwa lata Rob był także pisarzem technologii i jest menedżerem mediów społecznościowych MakeUseOf i redaktorem biuletynów. Zwykle znajdziesz go podróżującego po świecie, uczącego się montażu wideo i eksperymentującego z fotografią.

Więcej od Roba Nightingale'a

Zapisz się do naszego newslettera

Dołącz do naszego newslettera, aby otrzymywać porady techniczne, recenzje, bezpłatne e-booki i ekskluzywne oferty!

Kliknij tutaj, aby zasubskrybować