Molim preporuku za OCR softver
(1 korsinik/a gleda/ju temu) (1) Gost

Molim preporuku za OCR softver


17.02.2015 | 23:34
Imam 200 A4 listova tehničkih tablica koje moram vratiti u elektronički oblik.

Stvar je isprintana iz Excela, nekim običnastim Arial-olikim fontom (možda je Calibri, možda je Tahoma, nemam oko da to razlikujem, ali uglavnom radi se o sans-serifnim slovima), sve crnom bojom, na bijelom papiru. Ćelije su u najobičnijem rasteru - pune linije standardne debljine, i horizontalno, i vertikalno.

(Iz prilično glupih društveno-političkih razloga ne mogu do izvornog elektroničkog dokumenta niti imam ikakvu alternativu da ga nabavim. Ne dirajte u ljutu ranu. Jedina mi je opcija OCR iz ovih papira.)

Papire ću dobiti skenirane kao TIFFove 1-bit color depth, maksimalne rezolucije koju skener podržava bez interpolacije.

Postoje kolone samo s brojevima i kolone s tekstom (na hrvatskom, čćžđ...)

Radi se o ogromnoj količini podataka pa naknadna ručna kontrola i ispravljanje APSOLUTNO NE dolazi u obzir.

Zato mi je bitno da je točnost OCR-a što je veća moguća, osobito za brojke.

Također bi bilo bitno da OCR kuži da se radi o tablici i formatira izlaz kao tablicu. Bilo da koristi TABove ili CSV ili kako god.

Cijena softvera bi se morala uklopiti u ne više od $150-200. Poželjno je i manje.

Online OCR servisi nisu baš poželjna opcija, ali ne isključujem ih a priori.

Zahvalan na svim prijedlozima i idejama!
17.02.2015 | 23:36
Pardon. Nije nužno da se radi o Mac softveru. Može i Win softver.
  • Dijete
  • Posjetitelj
18.02.2015 | 03:08
www.abbyy.com.au/finereader/

Ima trial pa probaj, ne znam kako radi sa tablicama, ali mi je jedini OCR s kojim sam radio. Nije mi vise dostupan, pa ne mogu sam provjeriti to s tablicama, ali oni se hvale da svi elementi, tablice i grafike ostaju...

Koristio sam verziju 9 (aktualna je 12) i ta je lijepo radila sa dijakritickim i tvoji tiffovi se cine overkill jer je prepoznavao i lose skenirane dokumente.
18.02.2015 | 07:03
I moj glas ide Abbyy fine reader-u. Radi s tabelama, prepoznaje nase grafeme, brojke mu idu odlicno. Ne znam cemuu TIFF, jer je taj formatobicno vrlo veliki. Treba ti 300dpi, greyscale ili B&W (imam na skeneru opciju OCR).
Ono u sto nije siguran, oznaci kao markerom. Eksport napravi i u Excel. Ako nije zahtjevna tablica, cak ju ok prebaci. Jedini problem moze bitidatibrojke spremi kao tekst, ali u Excelu to mozes prebaciti u broj.
Doduse, ja imam Abbyy fine reader express jer imam 10.6.8, a za vise sisteme je onaj pro koji ima vise opcija i mogucnosti.
24.02.2015 | 13:55
jesi našao neko rješenje za ovo?
24.02.2015 | 17:16
Probao sam Abby i još neka 2 (u istom rangu cijene), na testnom batchu od 10 stranica. Ova druga 2 su totalna katastrofa, brrr...

Abby je odradio posao na kraju. Ne odlično, ali OK. Radi se o tablicama. Sve ispada OK, samo je problem što ADF od scannera ne uspijeva sve papire povući idealno ravno pa onda na onima koji su otišli zeru ukoso (ništa dramatično, recimo da 2-3 mm bježe od vrha do dna) ima problema s prepoznavanjem ruba ćelije (pa ubacuje nepostojeće jedinice, male "L", velika "I", uskličnike i slične znakove).

Također, gotovo svaki put kad je imao više jedinica zajedno, ili jedinicu kraj kose crte ("/1" ili "1/") to je prepoznao kao "ll" (dva mala "L"), iako je jedinice pokraj drugih znamenaka prepoznavao nepogrešivo.

Najmanje bitan, ali najviše uočljiv problem imao je s ne-hrvatskim slovima. Naime, ako odabereš HR kao jezik, da bi uredno prepoznavao čćžšđ, onda ne doživljava slova W i Y (iako je X ok, s njim nema problema), nego w tumači kao "vv", a y kao "v".

Moram naglasiti da se radi o jako malom postotku pogrešnog prepoznavanja, ali količina toga je ogromna tako da se i s tim malim postotkom nakupilo ispravljanja. No, opet je sve bilo gotovo u jedan dan.

Hvala svima na preporukama!
Moderatori: Bertone
  • Stranica:
  • 1

Vikalica™

Zadnja poruka: pred 8 minuta
  • Yonkis: WWDC26 June 8–12, 2026 [link]
  • rak21: Je li netko ulovioacbook pro M5 pro za 2200 u instaru? Baš me zanima jel prošla narudžba ili su stornirali jjer su bili jeftiniji 500€ i više od drugih.
  • smayoo: Ja sam nedavno imao tako raspadnut prikaz oglasa u Firefoxu, ispalo je da je problem bio u Ghosteryju
  • CoffeePod: Probao sam Tahoe na M4 MBP i M2 Airu i ono je sramotno na sto lici i kako performa
  • CoffeePod: Ima netko da i dalje odbija preci na Tahoe i iOS26?
  • drlovric: Na iPadu u Sagari oglasnik se raspao. Tekst se preklapa i necitljiv je ispod fotografije artikla.
  • zoranowsky: Kod mene na firefoxu i safariju sve ok s oglasima
  • Yonkis: [link]
  • Yonkis: Jedino na Braveu izgledaju normalno. Firefox, Edge, Safari ne.
  • smayoo: Što se desilo? Meni izgledaju normalno.
  • Yonkis: Što se desilo sa Oglasima? Npr.[link]
  • superstric: obavljeno
  • Yonkis: Obavio svoje
  • dpasaric: Imenso, obavljeno! :)
  • Djuro genijalac: rješeno. Bilo bi lakše da si objavio i točne odgovore, but here we are ;-)
  • imenso: Hvala!
  • Sarek: Riješeno i podijeljeno dalje
  • zoranowsky: Ispunjena anketa
  • smayoo: ispunjena
  • imenso: Svaki glas je važan i hvala unaprijed svakome na rješavanju i(ili) dijeljenju linka. To mi je za sina, za diplomski
  • Yonkis: Nema nas 200 ovdje, samo 300!!!
  • imenso: Ekipa, molio bih ako imate pet minuta vremena da riješite anketu, ne treba više od 5 minuta, moraju skupiti barem 200 odgovora: [link]
  • Djuro genijalac: Meni najbolje: Sori kume, samo Hajduk živi vječno!
  • Ender: chuck norris je pobedio zivot :)
  • smayoo: Rak je prebolio Chucka Norrisa... :)
  • Yonkis: [link] P.U.M Carlos Ray Norris
  • zoranowsky: R.I.P. Chuck Norris
  • Yonkis: generative AI apps paid Apple close to $900 million in App Store fees last year - [link]
  • cariblanco: [link]
  • drlovric: Team MacBook Pro M. Deremo. Ovo je jedna od rijetkih situacija gdje sam ja u vecini :)
  • dpasaric: Anketa je ažurirana novim modelom, znači i dalje ima smisla, govori nam što tko koristi ovdje.
  • Yonkis: p.s. kad će neka nova anketa? :)
  • Yonkis: Može netko Tim Apple pitati što je sa ovim AirDropom, jesu magneti u pitanju ili atmosferski pritisak u pitanju da radi kako je oglašavano?
  • dpasaric: Juhu za Poguea! :)
  • Yonkis: Ajde napokon da se tu nešto slatko pojede, neka bude i kalorijska bomba, preživjeti ćemo :)
  • Performita: Javio mi se David Pogue, pripremam poslasticu za Jabučnjak ????????
  • Yonkis: Ovo nije mjesec ovo je jutro [link]
  • Air: Ha ha, evo radi sa iPhonea - pitam se kad će već ova čuda implementirati u ozbiljnije fotoaparate?
  • Air: [link]
  • Air: probao sam samo C/P, probao sam C/P foru kojom ubacujem link u post, ali nefunkcionira kod mene
  • Riba: Probaj preko nekog url shortenera.
  • Riba: Samo ga upises ali mislim da ju neki znakovi zbune.
  • Air: Kako u vikalicu ubaciti link?
  • smayoo: @Yonkis - meni je to sve poisključivano, uvijek i oduvijek. Jedino imam uključeno da stavlja točku kad lupim dva razmaka i da automatski stavlja veliko slovo iza točke.
  • rusty: First 50 knjiga shipped!
  • Yonkis: Da li i vama iOS tipkovnica krivo ispravlja riječi a zanimljiv mi je ovaj primjer [link]
  • ZoPaj: iPhone Book i iPhone Book Neo
  • Yonkis: Preklopni iPhone, bit će kad tad, samo kako će se zvati? [link]
  • Yonkis: Apple prvih 50 godina [link]
  • Bertone: MA pusti ga, cendra bez veze, da mu je bilo bitno probudio bi se u pet :D

Za vikanje moraš biti prijavljen.

Prijava

Novo na Jabučnjaku

Teme

Poruke

Komentari

Anketa

Koji Mac koristite?

Page Speed 0.85 Seconds

Provided by iJoomla SEO