Cum se fac documente OCR online cu ABBYY FineReader

Dacă vă duceți fără hârtie, veți avea nevoie de o modalitate ușoară de a face ca documentele dvs. scanate să poată fi căutate, astfel încât să fie mai mult decât imagini statice ale documentelor pe hârtie. Am analizat deja modalitățile de a găsi documente OCR în aplicații cum ar fi Adobe Acrobat, PDFPen și Google Drive. Deși fiecare dintre aceste aplicații poate recunoaște textul în documentele dvs., aceasta nu este funcția lor principală.

Poate că unul dintre cei mai cunoscuți dezvoltatori OCR este ABBYY, care produce numeroase programe de gestionare fără hârtie. În acest tutorial, vă vom arăta cum puteți utiliza aplicația Web FineReader și tehnologia OCR pentru a converti PDF-uri, scanări și alte fișiere imagine în text editabil.

ABBYY FineReader Advantage

Chiar dacă versiunea online nu este la fel de puternică ca versiunea pentru desktop, ABBYY FineReader Online este probabil cea mai puternică serviciu OCR online disponibil acum. 

Pre-procesare

ABBYY FineReader preia majoritatea lucrărilor care ar fi trebuit făcute pentru ca OCR să aibă succes în alt serviciu, deoarece prelucrarea prealabilă se face în aplicația în sine. ABBYY FineReader corectează distorsiunile imaginii, cum ar fi orientarea paginii și zgomotul, înainte de a începe scanarea. Desigur, aspecte precum luminozitatea și calitatea imaginii depind de utilizator, dar nu va fi necesară o nouă editare a utilizatorului.

Procesul de scanare

După prelucrare, ABBYY FineReader descompune documentul în elemente precum tabele, imagini și blocuri de text înainte de a detecta linii și litere și cuvinte individuale. Tehnologia determină apoi relația dintre toate proprietățile paginii una cu cealaltă. Aceasta este pentru a asigura replicarea exactă nu numai a textului din document, ci și a întregului aspect al paginii în sine.

Suport lingvistic

ABBYY FineReader Online acceptă în prezent 42 de limbi, chiar și cu caractere non-latine, cum ar fi ebraică și coreeană. Există suport pentru dictionare pentru 37 dintre aceste limbi, care ajută la crearea unei recreări și mai precise, prin verificarea cuvintelor detectate în cel puțin un dicționar. Serviciul este capabil de OCR pe documente cu până la trei limbi diferite la un moment dat.

Lista completă a limbilor acceptate pentru ABBYY FineReader Online.

În plus față de suportul lingvistic, serviciul poate scana texte vechi în limbile germană și letonă care au fost stabilite în scrisoarea neagră, făcând ABBYY FineReader Online o opțiune viabilă pentru OCR a documentelor istorice. 

Costul

Un serviciu atât de puternic nu vine fără preț. OCR pe ABBYY FineReader Online nu este prea scump: creditele de pagină costă între $ 3- $ 10USD pentru incrementări de 20-200 de pagini. Cu toate acestea, primiți 20 de credite în pagini gratuit la înscrierea la serviciu.

Procesul OCR

După ce v-ați conectat la contul ABBYY FineReader Online, veți fi redirecționat către pagina de încărcare. 

Noțiuni de bază

Mai întâi, găsiți documentul sau imaginea pe care doriți să o încărcați și asigurați-vă că ABBYY FineReader suportă OCR pentru fișierul dvs. Serviciul acceptă fișiere OCR pentru fișiere PDF, .jpg, .png, .bmp, .pcx, .dcx, .tif, .gif și .djvu. Dimensiunea maximă a fișierului este de 30 MB. 

Bacsis: Pentru cele mai bune rezultate, asigurați-vă că fișierul dvs. este de înaltă calitate, iar dimensiunea textului este de cel puțin 9pt sau 10pt. 

Dacă doriți să obțineți OCR un document fizic, utilizați un scaner hardware, cum ar fi Doxie, sau o aplicație mobilă pentru a converti documentul fizic într-un format de fișier compatibil ABBYY FineReader.

Încărcarea documentului

După ce documentul dvs. este gata pentru încărcare, faceți clic pe Încărcați buton sub Încărcați un fișier pentru procesare camp. Găsiți fișierul în Fereastră pentru ferestre, și faceți clic pe Deschis. Aș recomanda să verificați Trimiteți-mi un link de descărcare prin e-mail caseta chiar sub câmpul de fișier pentru a avea acces ușor la documentul recreativ după ce a fost înregistrat OCR. Fișierul încărcat apare în Selectați fișierele pentru procesare câmp câteva secțiuni de mai jos.

Selectați un fișier pentru încărcare.

Apoi, definiți limbile din documentul dvs. sub Selectați limba (limbile) documentului camp. Derulați lista până când găsiți limbile documentului. Dacă aveți mai multe, selectați limbile suplimentare ținând apăsată tasta Comanda cheie, dacă utilizați un Mac sau Control cheie, dacă utilizați un PC și faceți clic pe.

ABBYY FineReader Online acceptă OCR pentru maximum trei limbi într-un singur document.

Dacă scanați un document mai vechi care a fost setat cu litera neagră, faceți clic pe hyperlink în dreptul casetei de selecție a limbii. Lista de limbi se va schimba și vă va oferi opțiunile corecte din Germania și Letonia pentru OCR.

Apoi, du-te la Selectați un format de ieșire pentru a selecta formatul în care fișierul va fi OCRed. În acest moment, ABBYY FineReader Online poate exporta fișierele ca Microsoft Word sau Excel (atât în ​​formatele 97-2003 cât și în versiunile noi), documentele Open Office, PDF, RTF sau Plain Text. Alegeți formatul în care doriți să fie convertit documentul final din meniul drop-down. 

Selectați un format de ieșire din meniul derulant.

Bacsis: Când selectați ieșirea documentului, fiți atenți la tabele, diagrame și alte imagini care pot apărea în documentul dvs. de intrare, deoarece procesorul de texte este posibil să nu le poată gestiona corect și să obțină rezultate slabe.

Asigurați-vă că documentele pe care doriți să le înregistrați sunt scoase în evidență Selectați fișierele pentru procesare camp. Acum, apăsați tasta Recunoaşte , iar programul ABBYY FineReader va începe procesul de scanare OCR. 

presa Recunoaşte pentru a începe procesul OCR.

Procesarea documentului

După ce apăsați Recunoaşte, veți fi redirecționat (ă) la Istoricul sarcinilor , unde veți putea verifica progresul documentului OCRed. În funcție de dimensiunea fișierului, OCR poate dura de la câteva secunde până la câteva minute. 

Procesarea poate dura oriunde între câteva secunde și câteva minute.

După terminarea procesării, puteți să descărcați documentul în formatul pe care l-ați selectat, precum și să exportați documentul direct din aplicația web pe Google Drive, Evernote și Dropbox. De asemenea, puteți evalua calitatea lucrării OCR, care permite ABBYY să-și îmbunătățească produsele. 

După ce ați terminat procesarea, puteți să descărcați documentul sau să-l exportați direct la un serviciu cloud.

Documentele OCR rămân pe serverul ABBYY FineReader timp de două săptămâni înainte ca acestea să fie șterse automat. 

Acum, du-te la lucru!

ABBYY FineReader Online este o modalitate ușoară de a complica documentele OCR pe web pentru un cost redus. Deși nu este perfect perfect în timp ce se ocupă de imagini și alte elemente stilistice, textul se traduce fără cusur, chiar și în documente cu mai multe limbi, în multe formate diferite de fișiere editabile. 

Dacă aveți probleme cu OCR în ABBYY FineReader Online sau orice gânduri sau preocupări legate de OCR sau fără documente în format digital, lăsați un comentariu mai jos!