5 moduri de a obține documente OCR pe computerul dvs. Mac

Dacă ați fost stimulat să încercați să vă deplasați spre un birou fără hârtie atunci nu sunteți singuri! 2013 este anul de a merge fără hârtie și asta nu înseamnă doar scanarea acelor vechi încasări și corespondență, este pe deplin digitizarea acestora. În acest ghid vă vom arăta cinci aplicații diferite care pot transforma documentele pe care le-ați scanat în cele pe deplin căutate utilizând o tehnologie numită OCR.

Actualizare: Puteți, de asemenea, să scanați cu ușurință documentele cu tehnologie OCR prin iPhone, utilizând noul Aplicația DocScan pe piața Envato.

Aplicația DocScan pe Envato Market

Dacă preferați să utilizați un scaner tradițional pentru a vă scana documentele, citiți-le pentru detalii complete despre cum să faceți acest lucru.

Ce este OCR?

OCR înseamnă Recunoaștere optică a caracterelor. Ori de câte ori scanați un document, scanerul în sine nu are cum să știe care este diferența dintre text și o imagine, astfel încât tot ceea ce scanați este în mod efectiv o imagine. Acest lucru se aplică și în cazul în care alegeți să îl salvați în format PDF, deoarece nu veți putea (încă) selecta niciun text.

Tehnologia OCR a fost în jur de ceva timp, dar este o caracteristică adesea subevaluată, care de obicei nu este niciodată privită. Dacă ați cumpărat un scanner în ultimii ani, atunci sunt șanse să aveți deja un software destul de frumos OCR pe discul cu care a venit! Ca utilizatori de Mac, suntem uneori rasfatiti de faptul ca nu mai trebuie sa ne facem griji cu privire la instalarea driverelor, asa ca software-ul pe aceleasi discuri este adesea ignorat.

Bacsis: Un PDF este doar un container pentru text și imagini, astfel încât orice chitanțe sau corespondență pe care le-ați scanat și salvate ca PDF nu sunt încă căutate.


1. Prizmo

Prizmo este o aplicație dedicată OCR. Nu este conceput pentru a vă ajuta să vă cultivați sau îndreptați documentele scanate, scopul său unic este de a analiza textul oricărei scanări și de al converti în text care poate fi căutat. Nu se limitează numai la documentele text simplu, cum ar fi chitanțe și corespondență, Prizmo va analiza chiar ziare și reviste vechi, cărți acoperă, aproape orice, oricare ar fi forma, dimensiunea și culoarea textului este ceva ce Prizmo va converti.

Prizmo include capacitatea de a capta scanări direct de la Captură de imagini, Aplicația de importare încorporată a camerei și scanerului OS X, astfel încât să o puteți utiliza împreună cu orice scanner existent. De asemenea, puteți să importați fișiere existente dacă le-ați scanat deja.

Pasul 1

Când lansați Prizmo, vă va solicita să creați un document nou sau să deschideți unul deja existent. Înainte de a continua, aceasta se referă la a Prizmo documentul și nu cel pe care doriți să îl analizați. Poate fi puțin confuz, dar Prizmo poate salva scanările pe care le-ați făcut dacă vreți să reveniți și să modificați textul, de exemplu dacă ați scanat într-un PDF de 200 de pagini și ați observat că unele pagini nu au fost analizate corespunzător în mijlocul și un text lipsesc. Salvarea muncii dvs. în Prizmo înseamnă că vă puteți întoarce și efectuați modificări după cum este necesar.


Prizmo își creează propriile documente, astfel încât să le puteți trimite mai târziu (și să le editați)

Selectați Document nou ... și veți primi un nou document Prizmo pentru a începe să utilizați.


Prizmo își creează propriile documente, astfel încât să le puteți trimite mai târziu (și să le editați)

Putem glisa și fixa un fișier imagine (JPG, PDF, TIFF, etc), să importăm din scanerul nostru sau chiar să navigăm într-o bibliotecă foto.

Pasul 2

În scopul acestui tutorial, folosesc un document existent pe care l-am scanat în utilizarea scanerului meu plat. A fost salvat direct ca un PDF și după cum puteți vedea, nu pot scoate în evidență niciun text.

Selectați Deschideți fișierul imagine ... și selectați o imagine pe care să o utilizați.

Pasul 3

După ce vedeți imaginea încărcată, veți primi un aspect familiar al paginii, completat cu miniaturile de pagină din partea stângă.


Prizmo are un aspect foarte asemănător cu aplicația Apple Preview

Avem câteva comenzi de ajustare în partea inferioară, unde putem regla rotația, cultura imaginii și multe altele. Prizmo va detecta automat cerințele documentului și va efectua automat modificările necesare ale setărilor, dar le putem întotdeauna să le modificăm ori de câte ori este necesar.

Pasul 4

Sunt mulțumită de setările prestabilite, deci faceți clic pur și simplu Recunoaşte și Prizmo vor detecta automat orice zone de text și le vor analiza aproape instantaneu.


Prizmo poate să documenteze OCR rapid și precis

În același mod în care ați desenat o zonă de scanat când scanați un document, același lucru se poate face și pentru zonele de text. Prizmo va încerca acest lucru automat, dar din nou, aveți control complet.

Textul analizat este apoi afișat în partea dreaptă a documentului. În acest stadiu, nimic nu este salvat. Dacă OCR nu a fost complet corect, puteți intra și puteți efectua orice schimbare.

Pasul 5

Prizmo a fost 100% corect cu documentul meu, astfel încât nu pot fi făcute schimbări. Puteți exporta documentul dvs. într-un număr de servicii de tip cloud, cum ar fi dropbox și Disc Google, sau să le atașați la un nou mesaj de poștă electronică.


Prizmo include suport pentru o serie de servicii cloud

O să salvez documentul pe desktop, așa că voi selecta Fişier…

Prizmo este extrem de util pentru oricine scanarea documentelor în mod regulat cu orice tip de scaner. Controalele avansate la care aveți acces înseamnă că puteți regla cum funcționează procesul OCR, în loc să vă bazați pe setările complet automate.

Aflați mai multe despre Prizmo.


2. ABBYY FineReader Express

ABBYY FineReader Express este un alt instrument specializat OCR creat special pentru sarcină, și o face foarte bine. Procesul OCR este automatizat, astfel încât singura interacțiune cu utilizatorul îi spune ABBYY FineReader Express ce document să se încarce și unde trebuie salvat versiunea OCR'd.

În loc să creați un document nou sau să deschideți un document existent, ABBYY FineReader Express are o caracteristică Sarcini rapide panou care se deschide la lansare. Este o modalitate rapidă de a documentelor OCR cu cât mai puține clicuri de mouse posibil.

Puteți converti documentele scanate într-un număr de formate diferite și un as cu mâneca este capacitatea de a procesa OCR o foaie de calcul și a scoate o aplicație complet accesibilă și editabilă, ceea ce îl face foarte tentant pentru utilizatorii de afaceri.

Pasul 1

Întrucât avem deja un PDF, avem nevoie de OCR, lansăm ABBYY FineReader Express și selectăm Conversia în PDF care poate fi căutat și selectați documentul pe care doriți să îl utilizați pentru OCR.


ABBYY FineReader Express include un panou cu Tastele rapide pentru a face OCR ușor

Pasul 2

De fapt, asta este! ABBYY FineReader Express vă va solicita să salvați noul document OCR'd într-o locație la alegere. În mod ciudat, vi se solicită să salvați documentul înainte de încărcarea previzualizării, pentru a vedea dacă ABBYY FineReader Express a reușit să documenteze corect documentul OCR, va trebui să Anulare salvați documentul și apoi salvați-l din meniu.


ABBYY este una dintre cele mai simple aplicații de utilizat când vine vorba de OCR

Aflați mai multe despre ABBYY FineReader Express.


3. Doxie

Am acoperit scanerul și software-ul Doxie în ghidul nostru anterior "Du-te fără hârtie cu Doxie"Dar merită menționat din nou caracteristicile sale OCR încorporate.

Doxie include OCR încorporat în aplicația sa de import, astfel încât toate documentele scanate vor avea opțiunea de a fi analizate. Cu toate acestea, Doxie nu conține o mulțime de controale și automatizează cea mai mare parte a procesului.


Doxie are mai puține controale decât o aplicație, cum ar fi Prizmo

Pasul 1

Scanați orice document pe care doriți să îl înregistrați și apoi lansați Doxie app, asigurându-vă că scanerul dvs. Doxie este conectat.

Pasul 2

Odată ce ați importat documentul scanat, puteți selecta unde și cum doriți să îl exportați. În acest caz, voi selecta PDF cu OCR (alb-negru). Este mai bine să selectați tipul de document deoarece acesta poate să vă asigure utilizarea unui format care necesită mai puțin spațiu.


Doxie include opțiunea de a exporta ca PDF sau cu OCR adăugat

Bacsis: Deseori veți găsi că multe companii trimit scrisori de corespondență care sunt într-o anumită culoare pentru a păstra cu marca lor - aș recomanda doar salvarea lor ca alb-negru pentru a păstra dimensiunea fișierului cât mai scăzut posibil.

Pasul 3

Odată ce ați selectat unde să salvați PDF-ul, Doxie va documenta OCR și va exporta documentul. Textul este complet căutat și nu înlocuiește textul scanării, ci utilizează o caracteristică inteligentă a numelor de fișiere PDF suprapunere text. Documentul dvs. poate arăta la fel ca înainte, dar este un lucru bun. În schimb, textul este plasat în mod transparent peste text, făcând ca acesta să poată fi căutat și evidențiat.


Doxie păstrează în continuare aspectul formatului PDF, dar suprapune textul care poate fi evidențiat

În timp ce procesul Doxie este foarte simplu, nu există atât de multe opțiuni ca o aplicație dedicată OCR, cum ar fi Prizmo. Cu toate acestea, înseamnă că dacă sunteți deja un utilizator Doxie sau doar scanați lumina, atunci aceste caracteristici pot să nu vă fie de mare folos.

Scanerele Doxie încep de la 119 USD și sunt disponibile de la Getdoxie.com.


4. PDFPen

PDFPen este puțin diferit de Prizmo, deoarece nu este doar un instrument OCR. Este un instrument all-in-one conceput pentru a umple, edita și modifica PDF-uri. Una dintre caracteristicile sale este că poate detecta documentele scanate și poate efectua OCR într-un singur pas.

Pasul 1

Lansați PDFPen și vă va solicita în mod automat să selectați un PDF pentru a fi deschis. Selectați un document scanat și faceți clic pe Deschis.

Pasul 2

Odată ce PDFPen deschide documentul și detectează că a fost scanat (mai degrabă decât descărcat sau generat de computer), acesta va solicita să-l analizați și să digitizați textul. Aveți opțiunea de a rula doar instrumentul OCR pe pagina curentă sau pe întregul document.


PDFPen este o altă aplicație concepută pentru a automatiza majoritatea procesului OCR

Specificați limba dorită și selectați butonul relevant - în acest caz, am selectat doar Document OCR.

Pasul 3

Odată terminat, salvați PDF-ul. Spre deosebire de Doxie sau Prizmo, nu creați încă o copie imediat. PDFPen modifică fișierele PDF existente, astfel încât să puteți salva modificările, eliminând inconvenientele de gestionare a unui fișier suplimentar.

Aflați mai multe despre PDFPen.


5. Evernote

Evernote este un serviciu extrem de popular de sincronizare a notițelor care acționează mai mult ca un hibrid între un album și un notebook. Gândiți-vă că aveți un dulap plin cu informații care sunt întotdeauna disponibile și întotdeauna ușor de căutat.

Am acoperit extensiv Evernote înainte de aici pe Mactuts + și încurajez pe oricine care folosește Evernote (sau este interesat să o folosească mai mult) pentru a citi articolul "Îngrijirea Elefantului: Sfaturi și trucuri Evernote minunate"Pentru a afla mai multe despre el.

O caracteristică a lui Evernote, care este adesea trecute cu vederea și nu a fost prezentată niciodată utilizatorului, este serviciul lor OCR automat. Da, orice imagine adăugată la Evernote este scanată pentru text și adăugată în nota ta. Se execută pe server astfel încât adăugarea unui document către Evernote nu este convertită instantaneu. Datorită numărului de utilizatori Evernote, nu este instantaneu. Pentru a preveni problemele serverului, toate documentele care necesită OCR sunt în coada de așteptare. Nu există nici o modalitate de a ști când va fi scanat, dar este de obicei în 24-48 de ore. Dacă sunteți membru premium, este mai rapid.

Pasul 1

Pentru a avea un document scanat, trageți-l și adăugați-l la o notă nouă sau existentă, asigurându-vă că ați sincronizat Evernote imediat ce ați făcut-o. Cam despre asta e.


Evernote acceptă atașamente pentru note și orice imagine va fi în mod automat OCR'd de către serverele lor

Pasul 2

În cele din urmă, Evernote va scana documentul și va efectua OCR. După ce se întâmplă acest lucru, documentul va fi apoi actualizat și sincronizat înapoi la Evernote de pe dispozitiv. A fost nevoie de aproximativ zece minute pentru Evernote la OCR documentul pe care l-am adăugat (sunt un abonat Evernote Premium, astfel că vremurile vor varia).

OCR este, de obicei, foarte precis, dar nu există control asupra modului în care funcționează OCR-ul. Se efectuează automat fără intrarea sau setările utilizatorului.

Pasul 3

Apoi puteți căuta text și, după cum puteți vedea, subliniază textul în timp ce căutați. După ce a trecut prin notă, pare să fi fost exact 100%.


Odată ce documentul a fost OCR'd de către serverele Evernote, acesta va putea fi căutat în cadrul Evernote și veți avea posibilitatea de a exporta documentul și ca PDF care poate fi căutat

Pasul 4 (opțional)

Dacă doriți să păstrați o versiune PDF care poate fi căutată în afara Evernote, puteți face clic dreapta și selectați Salvați caută PDF ca ...

Nu este ideal deoarece Evernote împachetează fiecare cuvânt cu o cutie verde, astfel că poate să nu fie o idee bună, dar funcționează.

În timp ce caracteristicile sale sunt destul de elementale, utilizarea Evernote ca centru central pentru biroul dvs. fără hârtie devine și mai populară, deci dacă doriți să faceți același lucru, atunci puteți să eliminați orice proces OCR și să abandonați scanările direct în Evernote. Va avea grijă de OCR pentru dvs. și din moment ce majoritatea articolelor vor fi chitanțe și corespondență, probabil că veți avea aproape nici o problemă cu serviciul OCR al Evernote.

Evernote este gratuită, cu conturi premium de la 5 USD pe lună sau 35 USD pe an.


Înfășurarea în sus

Există o serie de moduri în care puteți să digitalizați documentele scanate pentru a le face să poată fi căutate de text și costurile de utilizare a unui instrument OCR au scăzut dramatic. Au dispărut zilele în care ați fost blocați la orice aplicație a scanerului dvs., sunteți acum liber să utilizați aproape orice aplicație OCR pe care doriți să o utilizați.

Dacă intenționați să vă aflați folosind nu numai instrumente OCR, ci doriți o modalitate de manipulare a PDF-urilor, atunci PDFPen este cea mai bună alegere. Pentru oricine vrea doar o cale de a OCR atunci aș recomanda Prizmo. Chiar dacă aveți un Doxie, Prizmo vă oferă mai mult control asupra modului în care funcționează procesul OCR.

Pentru oricine care vrea să facă ceva ocazional OCR, obținerea unui cont gratuit Evernote este cea mai economică opțiune.

Ați încercat să mergeți fără hârtie? Te deranjezi cu OCR sau totul poate fi căutat în biroul tău digital? Ne-ar plăcea să auzim de la dvs. așa, ca întotdeauna, să discutăm subiectul mai departe în comentarii.