Hirdetés
Ha bármilyen nyomtatott szöveget digitális szöveggé konvertál, amelyet másolhat, beilleszthet, szerkeszthet és kereshet, akkor optikai karakterfelismerő (OCR) szkennert kell használnia.
Ha egy dokumentum beolvasása vagy fényképezése mellett dönt, azt JPEG vagy PDF formátumban menti el. OCR szoftver ezután felismeri a betűket és számokat ezekben a dokumentumokban, és átalakítja azokat a kereshető PDF 4 módszer a PDF fájlok ingyenes létrehozására és szerkesztéséreA számítástechnika világában elterjedt összes fájltípus közül a PDF valószínűleg az egyik legszigorúbb fájl, és ugyanakkor mindenki számára elérhető (elsősorban olvasásra) ... Olvass tovább , vagy egy olyan fájlba, amelyet szerkeszthetünk olyan programokban, mint a Microsoft Word.
A probléma az, hogy egyes OCR-szkennerek sokkal jobban működnek, mint mások, a legjobb az, hogy elég nehéz a pénztárcáján.
Az Omnipage18 például 150 dollárba kerül, de különösen jól ismeri a különböző nyelveket. Adobe Acrobat Pro DC 400 dollárba kerül a szemöldöklés, de hihetetlen pontossággal rendelkezik.
ABBYY FineReader 150 dollárba kerül, de fantasztikus a dokumentumok, például a folyóiratok és brosúrák kereshető szöveggé konvertálására. Később ebben a cikkben teszteljük az ABBYY online ajánlatát.Ha azonban ingyenes alternatívákat keres, akkor lehetősége van Letöltés és Windows vagy OS X operációs rendszeren való használathoz próbálja ki ezeket az OCR eszközöket Az 5 legjobb OCR eszköz a képek kivonásáhozHa papírlapok vannak, hogyan konvertálhatja az összes kinyomtatott szöveget olyanmá, amit egy digitális program képes felismerni és indexelni? Tartsa a közelben egy jó OCR szoftvert. Olvass tovább . De ha inkább egy ingyenes, online OCR eszköz, olvassa tovább, ahogy az első néhányat kipróbáltuk, az alábbiakban bemutatott eredményekkel.
A teszt
Úgy tűnik, hogy a legtöbb ember most használja okostelefonok, hogy megvizsgálják őket Szkennelje és kezelje bevételeit, helytakarékos, papírt és időt használjonA papírlevelek könnyen elvesznek, és nehéz megtalálni azokat, amikor leginkább szüksége van rájuk. Szerencsére a digitalizálás mindkét problémát megoldja. Olvass tovább , Úgy döntöttem, hogy használom Az Evernote szkennelhető alkalmazása (Ingyenes az iOS-en és az Androidon). Beolvastam Richard Dawkin első oldalát A hegymászás valószínűtlen, hogy megnézze, milyen eredményeket érhetünk el az alapvető formázással. Beolvastam egy Tim Timrississ oldalt is. A 4 órás séf kipróbálni a szkennereket valamivel bonyolultabb formázással. Ezeket a fájlokat PDF formátumban mentettem el.

Ezeket a dokumentumokat azután állítólag a legjobb online OCR eszközökön futtattuk, hogy megtudjuk, mennyire teljesítettek.
Ingyenes online OCR [már nem érhető el]
Szerencsére nincs ingyenes regisztráció az ingyenes online OCR használatához. Kettős benyomásom volt, amikor láttam követelésüket a dokumentumom formázásának és elrendezésének megtartására.

A webhely állítólag támogatja a PDF, GIF, BMP, JPEG, TIFF és PNG bemeneti adatokat. A kimenetek lehetnek DOC, PDF szöveges dokumentum, RTF és TXT. Sajnos nem tudtam megtudni, van-e fájlméret-korlátjuk.
Alapdokumentum PDF-be
Teljesen tökéletesen konvertálva. Nincs sok mást mondani! Már indulunk nagyon jó kezdés.
Alapdokumentum a DOC-hoz
Úgy tűnik, hogy a tényleges szavak hibátlanul átalakultak, kivéve a „Rushmore-hegyről” származó „kitörést”, ami valahogy az AWOL-ra megy. A formázás azonban más történet. Sok vesszőt cseréltek aláhúzásra, és a dokumentum egészére véletlenszerű szóközök kerülnek. Amikor később meglátja, hogy a prémium szoftver miként teljesített ebben a tesztben, ez nem egy rossz erőfeszítés egyáltalán.
Összetett dokumentum PDF-be
A dokumentum konvertálása óriási 120 másodpercet vett igénybe! A teljes szöveg elkészítése után az összes szöveget körülbelül 95% -os pontossággal konvertáltuk, bár az oldal jobb felső sarkában lévő különálló mezőbe a szöveg nem volt kereshető. Néhány más karakter a PDF-ben is hibás volt.
Komplex dokumentum a DOC-hoz
Ezúttal a konvertálás csak 10 másodpercet vett igénybe, a szöveget pedig újra körülbelül 95% -os pontossággal konvertáltuk. Volt néhány furcsa távolsági kérdés, és a szoftvernek nehézségei voltak a dokumentum jobb felső sarkában lévő betűtípus konvertálásával, és itt-ott elhagyott néhány karaktert.
Ítélet
Ha egyszerűen formázott dokumentumokat akar konvertálni PDF-be, ez egy fantasztikus eszköz. A DOC-ra való áttérés szempontjából az eredményeknek nem kellett volna otthont írniuk.
Az i2OCR néhány lenyűgöző igényt támaszt. Az eszköz több mint 60 nyelvet ismeri fel, képes kezelni több oszlopos elrendezést (a formázás eltávolításával), nincs fájlméret-korlát, konvertálhatja a feltöltött fájlokat és az URL-ekből. És ezen eszköz használatához sem regisztrálnia kell.
A szolgáltatás úgy működik, hogy egyszerűen kivonja a szöveget a képről, majd formázza a szöveget. A szövegek más programokba másolása, vagy DOC, PDF vagy HTML formátumban történő letöltés előtt gyorsan javíthatja a mellékelt nézetben szereplő hibákat.
Megjegyzés: amikor megpróbáltam feltölteni a PDF-dokumentumaimat, ezeket az i2OCR elutasította, tehát ezeket JPEG formátumba kellett konvertálnom (egy képernyőképet készítettem róla, majd feltöltöttem a fájlokat).
Alapdokumentum a sima szöveghez
Az eszköz működése miatt minden formázás elveszik, bár a képről a szövegre való átalakítás szinte tökéletes volt. Volt néhány apró hiba, például a bekezdések közötti távolság, és néhány vesszőt helyettesítettünk pontokkal, de ezek kis nigglák.
Komplex dokumentum a sima szöveghez
A szöveg nagy részét túl sok hiba nélkül konvertáltuk, kivéve a címet és a jobb felső sarokban lévő receptet, ami az eszköz számára olvashatatlan volt. Az az oszlopok egyszerű szöveggé konvertálása messze nem volt ideális. Ha azt akarja, hogy ezt az átalakítást megvalósíthatóvá tegye, sok időre lenne szükség ahhoz, hogy a sorokat koherens mondatokká alakítsák át.
Ítélet
Az alapdokumentumoknál az i2OCR nagyszerűen működik. A szöveg letöltés előtti szerkesztésének képessége szintén nagyon jó érintés. Bonyolultabb dokumentumok esetében azonban a konvertálás még mindig elég pontos, de a szöveg kiadásának módja nem fogja sokkal könnyebbé tenni az életét.
Az online OCR jelenleg 46 különböző nyelvet támogat, és konvertálhatja a PDF, JPG, BMP, TIFF és GIF fájlokat Word, Excel vagy Plain Text formátumba. A webhely azt állítja, hogy „a konvertált dokumentumok pontosan úgy néznek ki, mint az eredeti - táblázatok, oszlopok és grafikák”.
A verzió, amelyet regisztráció nélkül használhat, lehetővé teszi, hogy óránként akár 15 képet konvertáljon (5 MB korlát). Ha regisztrál fiókot, akkor további oldalakat is megvásárolhat ezen a korlátozáson felül, miközben képes konvertálni a többoldalas dokumentumokat és a ZIP-archívumokat is.

Alapdokumentum a DOC-hoz
Az alapdokumentum hibátlanul átalakult a római számtól eltekintve én nem veszik fel. Ahogy a webhely ígérte, a formázás pontosan olyan volt, mint a könyvben. Kudos ehhez az eszközhöz.
Komplex dokumentum a DOC-hoz
Miután csalódott voltam a korábbi OCR-eszközökkel a komplex dokumentum konvertálása során, nagymértékben lenyűgözött az Online OCR. A fenti elrendezés közel tökéletes volt. Még egyszer, még egyszer, a receptet nem választották túl jól, de minden kisebb hiba elhanyagolható volt.
Ítélet
Abszolút fantasztikus eredmények az online OCR segítségével. Csak azt látom, hogy a konvertált dokumentumokat nem lehet PDF formátumban letölteni, mivel az említett kimeneti formátumok csak a DOCX, XLSX és TXT fájlokat tartalmazzák.
Mint korábban említettük, az ABBYY az OCR szoftverek egyik piacvezetője, teljes, letölthető programjának költsége körülbelül 150 dollárba kerül. Ők kínálnak a 10 oldalas ingyenes próbaverzió online eszközükhöz (regisztráció szükséges). 5 dolláros előfizetésért az online eszköz lehetővé teszi havonta 200 oldal konvertálását.

Az elfogadott fájlok mérete legfeljebb 100 MB lehet, bármelyik formátumban: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP és PNG. Az ABBYY szinte 200 nyelvet is felismer. A kimenetek különösen lenyűgözőek, a DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 és EPUB közül választhat.
A próba során kipróbálhatja még néhány BETA funkciót. Az első lehetőség a dokumentum lefordítására egy másik nyelvre. A másik az, hogy exportálja a konvertált dokumentumot a felhőalapú tárfiókjába, legyen az Dropbox, Google Drive, Evernote, Microsoft OneDrive vagy Box.
Alapdokumentum a DOCX-hoz
Az általános eredmények jó voltak, de nem elképesztő, tekintve, hogy ez prémium termék. Több vesszőt és periódust cseréltek egymással, több fordított vesszőt cseréltek csillaggal, néhány nagybetű hiányzott, és egy szót (az irodalomírót) helytelenül írtak.
Komplex dokumentum a DOCX-hoz
A konvertálás után nagyon kevés hiba volt a dokumentum szövegében (kivéve az OCR-t, amely újra küzd a recept betűkészletével!), Ám a formázás nagyon kívánságot hagyott.

A három oszlop valahogy két oldalt vett fel, a középső oszloppal csak megjelenik a második oldalon. Ha valóban akarta volna csinál bármi is ezzel a konvertált dokumentummal, végül kihúzza a haját.
Alapdokumentum PDF-be
A konvertált PDF áttekintése közben egyáltalán nem találtam hibát. Talán megtaláltuk, ahol az ABBYY kiemelkedik. Fantasztikus eredmények.
Összetett dokumentum PDF-be
Ismét nem találtam hibát a konvertált fájlban. Az ABBYY nyilvánvalóan tudja, hogyan lehet kivételesen jól konvertálni a PDF-be.
Ítélet
Ha szívesen fizet néhány dollárt, úgy tűnik, hogy a PDF-re történő konvertálás fenomenálisan jól működik ezzel a szolgáltatással, és így is a konvertált fájlok szinkronizálása a felhőalapú tárolóval különösen akkor hasznos, ha nagy mennyiségű lapot szkennel dokumentumokat. Mint a többi lehetőségnél, az ABBYY még mindig nem gondolta ki, hogyan lehet hibátlanul konvertálni a dokumentumokat DOC-ra az egyszerű szerkesztés érdekében.
A végső eredmény
Ha a legtöbb emberhez hasonlóan csak néhány folyóiratcikket és néhány háztartási számlát keres be, akkor ezeket a dokumentumokat nem kell szerkesztenie. Ezért a PDF-formátumba való közvetlen konvertálás megfelelő lesz az Ön számára, mert ezekben a dokumentumokban továbbra is kereshet. Ehhez a Free Online OCR határozottan a legjobb ingyenes eszköz volt, amelyet teszteltünk. Ennek ellenére ha hajlandó fizetni 5 dollárt havonta a tökéletességért, Az ABBYY FineReader Online kissé pontosabb volt.
Amikor a dokumentumokat DOC-ra konvertáltuk, nem sikerült tökéletes megoldást találnunk, ám messze a legjobb eredményeket Online OCR. A konvertálás nem volt tökéletes, de a formázás integritását nagyrészt érintetlenül tartottuk, és a hibák elhanyagolhatóak voltak. Ha ezeket az eredményeket összehasonlítjuk az ABBYY „prémium” ajánlatával, nem tud segíteni, csak hatalmas benyomást kelt.
Nem vettük fel A Google Drive OCR képességei ebben a posztban; egy kicsit a Google mindentudásáért, de inkább azért, mert szeretnénk kipróbálni néhány másik ingyenes online OCR szolgáltatást is.
Neked: mely más online OCR-eszközöket ajánlja az olvasóinknak? És melyiket próbálta, hogy soha többé nem használná?
Rob Nightingale filozófiai diplomát szerzett az Egyesült Királyság York-i Egyetemen. Több mint öt éve szociális médiamenedzserként és tanácsadóként dolgozott, és több országban tartott workshop-okat. Az elmúlt két évben Rob szintén technológiai író volt, és a MakeUseOf Social Media Manager, valamint a Hírlevél Szerkesztője. Általában utazik a...