Molim preporuku za OCR softver
(1 korsinik/a gleda/ju temu) (1) Gost

Molim preporuku za OCR softver


17.02.2015 | 23:34
Imam 200 A4 listova tehničkih tablica koje moram vratiti u elektronički oblik.

Stvar je isprintana iz Excela, nekim običnastim Arial-olikim fontom (možda je Calibri, možda je Tahoma, nemam oko da to razlikujem, ali uglavnom radi se o sans-serifnim slovima), sve crnom bojom, na bijelom papiru. Ćelije su u najobičnijem rasteru - pune linije standardne debljine, i horizontalno, i vertikalno.

(Iz prilično glupih društveno-političkih razloga ne mogu do izvornog elektroničkog dokumenta niti imam ikakvu alternativu da ga nabavim. Ne dirajte u ljutu ranu. Jedina mi je opcija OCR iz ovih papira.)

Papire ću dobiti skenirane kao TIFFove 1-bit color depth, maksimalne rezolucije koju skener podržava bez interpolacije.

Postoje kolone samo s brojevima i kolone s tekstom (na hrvatskom, čćžđ...)

Radi se o ogromnoj količini podataka pa naknadna ručna kontrola i ispravljanje APSOLUTNO NE dolazi u obzir.

Zato mi je bitno da je točnost OCR-a što je veća moguća, osobito za brojke.

Također bi bilo bitno da OCR kuži da se radi o tablici i formatira izlaz kao tablicu. Bilo da koristi TABove ili CSV ili kako god.

Cijena softvera bi se morala uklopiti u ne više od $150-200. Poželjno je i manje.

Online OCR servisi nisu baš poželjna opcija, ali ne isključujem ih a priori.

Zahvalan na svim prijedlozima i idejama!
17.02.2015 | 23:36
Pardon. Nije nužno da se radi o Mac softveru. Može i Win softver.
  • Dijete
  • Posjetitelj
18.02.2015 | 03:08
www.abbyy.com.au/finereader/

Ima trial pa probaj, ne znam kako radi sa tablicama, ali mi je jedini OCR s kojim sam radio. Nije mi vise dostupan, pa ne mogu sam provjeriti to s tablicama, ali oni se hvale da svi elementi, tablice i grafike ostaju...

Koristio sam verziju 9 (aktualna je 12) i ta je lijepo radila sa dijakritickim i tvoji tiffovi se cine overkill jer je prepoznavao i lose skenirane dokumente.
18.02.2015 | 07:03
I moj glas ide Abbyy fine reader-u. Radi s tabelama, prepoznaje nase grafeme, brojke mu idu odlicno. Ne znam cemuu TIFF, jer je taj formatobicno vrlo veliki. Treba ti 300dpi, greyscale ili B&W (imam na skeneru opciju OCR).
Ono u sto nije siguran, oznaci kao markerom. Eksport napravi i u Excel. Ako nije zahtjevna tablica, cak ju ok prebaci. Jedini problem moze bitidatibrojke spremi kao tekst, ali u Excelu to mozes prebaciti u broj.
Doduse, ja imam Abbyy fine reader express jer imam 10.6.8, a za vise sisteme je onaj pro koji ima vise opcija i mogucnosti.
24.02.2015 | 13:55
jesi našao neko rješenje za ovo?
24.02.2015 | 17:16
Probao sam Abby i još neka 2 (u istom rangu cijene), na testnom batchu od 10 stranica. Ova druga 2 su totalna katastrofa, brrr...

Abby je odradio posao na kraju. Ne odlično, ali OK. Radi se o tablicama. Sve ispada OK, samo je problem što ADF od scannera ne uspijeva sve papire povući idealno ravno pa onda na onima koji su otišli zeru ukoso (ništa dramatično, recimo da 2-3 mm bježe od vrha do dna) ima problema s prepoznavanjem ruba ćelije (pa ubacuje nepostojeće jedinice, male "L", velika "I", uskličnike i slične znakove).

Također, gotovo svaki put kad je imao više jedinica zajedno, ili jedinicu kraj kose crte ("/1" ili "1/") to je prepoznao kao "ll" (dva mala "L"), iako je jedinice pokraj drugih znamenaka prepoznavao nepogrešivo.

Najmanje bitan, ali najviše uočljiv problem imao je s ne-hrvatskim slovima. Naime, ako odabereš HR kao jezik, da bi uredno prepoznavao čćžšđ, onda ne doživljava slova W i Y (iako je X ok, s njim nema problema), nego w tumači kao "vv", a y kao "v".

Moram naglasiti da se radi o jako malom postotku pogrešnog prepoznavanja, ali količina toga je ogromna tako da se i s tim malim postotkom nakupilo ispravljanja. No, opet je sve bilo gotovo u jedan dan.

Hvala svima na preporukama!
Moderatori: Bertone
  • Stranica:
  • 1

Vikalica™

Zadnja poruka: pred 4 dana, 10 sati
  • dpasaric: Osvrt je na naslovnici...
  • dpasaric: Ja bih samo Siri koja radi kako treba.
  • stefanjos: pa nije da ikome treba, ali radije bi to nego iakkav AI image generator haha
  • drlovric: Top je stvar. Razmazi oci i plus dobijes par sat i baterije usput.
  • dpasaric: Kome to uopće treba? :)
  • drlovric: Slazem se. Natjerala ih AI blamaza a ne dobra volja :)
  • stefanjos: 120hz na obicnom iphoneu. Napokon!
  • stefanjos: Drpongrac. Nema uvrede. Autoagnostik sam ali volim svoj polo :)
  • drpongrac23: Bez uvrede, isprika svakome, imao san bekutanera kockici m3, golfa 4 i polo sdi - sve redom šrot!!!!
  • drpongrac23: @stefanjos - fauwe = krampwagen! Hyundai rulez!!!!
  • drpongrac23: Uskoro event! Euforija počinje!!!! Gemišti na hlađenju!!!!
  • stefanjos: @yonkis, a stvarno je tino haha. samo fauve :P
  • Borisone: [link]
  • Borisone: Kao i svake godine u rujnu, nova generacija iPhona, te eventualno AirPodsi, Apple TV, i sl.
  • Yonkis: A što se predstavlja?
  • dpasaric: Danas Appleov Keynote u 19 sati po našem vremenu!
  • Yonkis: tino1 mora pješke jer ga izdao Bayerische Motoren Werke :)
  • stefanjos: ?
  • Yonkis: [link] tužno
  • smayoo: Rijeka je treći grad u Europi po godišnjoj precipitaciji. Prva je Genova u Italiji, a drugi je Nikšić u Crnoj Gori
  • smayoo: Nije istina. London ima više kišnih dana godišnje, ali Rijeka ima veću godišnju precipitaciju (kumulativnu količinu padalina u mm po m2)
  • hal9000: @yonkis • Navodno je.
  • Yonkis: Jel' ovo istina za Rijeku? [link]
  • smayoo: Riječani i ostali zainteresirani, kavica i ćakula ovu subotu (30.08.) ujutro u 10h u gradskoj kavani Renard
  • drlovric: @vanjus: Barem si imao mogucnost izbora. Odaberes banku koja ima Apple Pay i cao :) biH je doslovce prije tjedan-dva dobila Apple Pay, nije uopce bilo dostupno u drzavi.
  • VanjusOS: pa znam da je Apple pay bio dostupan preko PBZ-a već godinama, ali tek od jučer je to moguće i preko HPB.
  • Yonkis: @smayoo - mogli bi subotu ujutro. Ima li još zainteresiranih, gdje je tino1?
  • Yonkis: @VanjusOS - to misliš kao "napokon" tj sarkastično?
  • smayoo: @yonkis - ja mogu u subotu ujutro. U nedjelju popodne-navečer možda također, ali nisam siguran.
  • VanjusOS: ljudi, tehnološka revolucija! od danas Apple Pay i preko HPB-a!!
  • Yonkis: Jel netko za kakvu kavu ovaj vikend? U Ri mislim :)
  • Yonkis: Glede Tita.. u Splitu: [link]
  • smayoo: @drlovric, nema na čemu, drago mi je. :)
  • mbp2009: Titini kriteriji: onaj koji je bio protiv njega. Kao i kriteriji svakog drugog kriminalca i diktatora :)
  • drlovric: @Smayoo: Isli u plavo bijeli. Sasvim pristojna hrana. Nismo uopce razocarani. Hvala :)
  • jura22: Da, tocno tako. Sakupljao po ulici! Zene, djecu, starce. Po redu. Bez kriterija.
  • smayoo: U samom Osijeku, nažalost, po mom iskustvu ništa nije baš trajno na visokom nivou. Ako bih morao preporučiti bar jedno mjesto, to bi bio "Plavo-bijeli". Klasični restoran, kad vidiš kako su konobari odjeveni, izgleda kao da su još osamdesete, ali hrana je konzistentno vrlo dobra. Ali to je nekakav standardni restoranski jelovnik, nema nekih baš tradicionalno slavonskih jela
  • smayoo: Varga u Bilju, pojeli smo zbilja dobar čobanac prije koju godinu. Još je bolji u Sokaku u Đakovu, kod ergele, ali to ti nije blizu Osijeka
  • drlovric: Sutra sam u Osijeku. Molim lokalce za preporuku za dobru slavonsku hranu.
  • Air: U protivnom je imao vanzemaljsku sreću da je baš smaknuo one koji su mu smetali.
  • Air: @jura22 ja sam nekoj logici siguran da je Tito imao kriterije po kojima je to činio.
  • smayoo: Kako misliš - da je nekog dao smaknuti bez kriterija? Skupljao je nasumično ljude po ulici pa ih vodio na smaknuće?
  • Yonkis: Što je kriterij?
  • jura22: “kriterija”
  • smayoo: Što je krizerij?
  • jura22: Danas se sjecamo svih koje je Tito dao smaknuti bez krizerija.
  • Bertone: e da je ufatiti svu tu struju nekako i pospremiti je za kasnije ;D
  • smayoo: Leleee... :)
  • Yonkis: Evo par slika od jutros, slikano iPadom: [link]
  • mbp2009: Sve ok, pbz radi na beti

Za vikanje moraš biti prijavljen.

Prijava

Prisutni jabučari

Novo na Jabučnjaku

Teme

Poruke

Oglasi

Komentari

Anketa

Koji Mac koristite?

Page Speed 1.20 Seconds

Provided by iJoomla SEO