Molim preporuku za OCR softver
(1 korsinik/a gleda/ju temu) (1) Gost

Molim preporuku za OCR softver


17.02.2015 | 23:34
Imam 200 A4 listova tehničkih tablica koje moram vratiti u elektronički oblik.

Stvar je isprintana iz Excela, nekim običnastim Arial-olikim fontom (možda je Calibri, možda je Tahoma, nemam oko da to razlikujem, ali uglavnom radi se o sans-serifnim slovima), sve crnom bojom, na bijelom papiru. Ćelije su u najobičnijem rasteru - pune linije standardne debljine, i horizontalno, i vertikalno.

(Iz prilično glupih društveno-političkih razloga ne mogu do izvornog elektroničkog dokumenta niti imam ikakvu alternativu da ga nabavim. Ne dirajte u ljutu ranu. Jedina mi je opcija OCR iz ovih papira.)

Papire ću dobiti skenirane kao TIFFove 1-bit color depth, maksimalne rezolucije koju skener podržava bez interpolacije.

Postoje kolone samo s brojevima i kolone s tekstom (na hrvatskom, čćžđ...)

Radi se o ogromnoj količini podataka pa naknadna ručna kontrola i ispravljanje APSOLUTNO NE dolazi u obzir.

Zato mi je bitno da je točnost OCR-a što je veća moguća, osobito za brojke.

Također bi bilo bitno da OCR kuži da se radi o tablici i formatira izlaz kao tablicu. Bilo da koristi TABove ili CSV ili kako god.

Cijena softvera bi se morala uklopiti u ne više od $150-200. Poželjno je i manje.

Online OCR servisi nisu baš poželjna opcija, ali ne isključujem ih a priori.

Zahvalan na svim prijedlozima i idejama!
17.02.2015 | 23:36
Pardon. Nije nužno da se radi o Mac softveru. Može i Win softver.
  • Dijete
  • Posjetitelj
18.02.2015 | 03:08
www.abbyy.com.au/finereader/

Ima trial pa probaj, ne znam kako radi sa tablicama, ali mi je jedini OCR s kojim sam radio. Nije mi vise dostupan, pa ne mogu sam provjeriti to s tablicama, ali oni se hvale da svi elementi, tablice i grafike ostaju...

Koristio sam verziju 9 (aktualna je 12) i ta je lijepo radila sa dijakritickim i tvoji tiffovi se cine overkill jer je prepoznavao i lose skenirane dokumente.
18.02.2015 | 07:03
I moj glas ide Abbyy fine reader-u. Radi s tabelama, prepoznaje nase grafeme, brojke mu idu odlicno. Ne znam cemuu TIFF, jer je taj formatobicno vrlo veliki. Treba ti 300dpi, greyscale ili B&W (imam na skeneru opciju OCR).
Ono u sto nije siguran, oznaci kao markerom. Eksport napravi i u Excel. Ako nije zahtjevna tablica, cak ju ok prebaci. Jedini problem moze bitidatibrojke spremi kao tekst, ali u Excelu to mozes prebaciti u broj.
Doduse, ja imam Abbyy fine reader express jer imam 10.6.8, a za vise sisteme je onaj pro koji ima vise opcija i mogucnosti.
24.02.2015 | 13:55
jesi našao neko rješenje za ovo?
24.02.2015 | 17:16
Probao sam Abby i još neka 2 (u istom rangu cijene), na testnom batchu od 10 stranica. Ova druga 2 su totalna katastrofa, brrr...

Abby je odradio posao na kraju. Ne odlično, ali OK. Radi se o tablicama. Sve ispada OK, samo je problem što ADF od scannera ne uspijeva sve papire povući idealno ravno pa onda na onima koji su otišli zeru ukoso (ništa dramatično, recimo da 2-3 mm bježe od vrha do dna) ima problema s prepoznavanjem ruba ćelije (pa ubacuje nepostojeće jedinice, male "L", velika "I", uskličnike i slične znakove).

Također, gotovo svaki put kad je imao više jedinica zajedno, ili jedinicu kraj kose crte ("/1" ili "1/") to je prepoznao kao "ll" (dva mala "L"), iako je jedinice pokraj drugih znamenaka prepoznavao nepogrešivo.

Najmanje bitan, ali najviše uočljiv problem imao je s ne-hrvatskim slovima. Naime, ako odabereš HR kao jezik, da bi uredno prepoznavao čćžšđ, onda ne doživljava slova W i Y (iako je X ok, s njim nema problema), nego w tumači kao "vv", a y kao "v".

Moram naglasiti da se radi o jako malom postotku pogrešnog prepoznavanja, ali količina toga je ogromna tako da se i s tim malim postotkom nakupilo ispravljanja. No, opet je sve bilo gotovo u jedan dan.

Hvala svima na preporukama!
Moderatori: Bertone
  • Stranica:
  • 1

Vikalica™

Zadnja poruka: pred 3 dana, 23 sati
  • dpasaric: Nema, možda nešto sitno što je lokalno na lageru.
  • zvone: Mislim da u istylwu imaju jos stare cijene. Ili?
  • dpasaric: Klijent jučer poželio kupiti jedan solidan MacBook Pro 16", cijena nešto iznad 3.000 € PDV. Što mislite koliko je nakon poskupljenja radne memorije? 3.500 € PDV... veselo...
  • dpasaric: Hardver koji mi je trebao doći na review nažalost kasni! Nadam se da će uskoro! :)
  • Pongy75: @smayoo - Victoria!!!
  • smayoo: MX Master FTW! :)
  • zoranowsky: Od mene isto glas za MX master
  • Pongy75: Palac gore za Logitech MX Master! Od Magic mouse zabolinruka nakon duljeg rada.
  • Tito: MAgic mouse - najbolji mis ikada!!!
  • drlovric: @super. Zaobidji ga u sirokom luku. Bolje kupi za te pare Logitech MX Master :)
  • jura22: Rubno? Nije upotrebljiv osim kao ukras na stolu. Imao dva, jednog prodao a drugog poklonio kupcu mog MBP.
  • dpasaric: Magic Mouse - lijep, ali rubno upotrebljiv! :)
  • superstric: ako netko treba, apple magic mouse 63,01 euro na amazon prime day
  • dpasaric: :)
  • smayoo: Čestitam svima Dan antifašističke borbe!
  • drlovric: Za nekih tjedan dana moj Macbook Pro M1 Pro 16" ide na prodaju. Ako nekoga zanima takvo racunalo (us layout, 16gb ram) neka se javi za dogovor.
  • dpasaric: Možda je to bio Belonguzije - androdi kojeg je predstavio LET 3 u Pikiju jednom davno... istina, imao je dosta ograničen rječnik... :)
  • accom: Evo, čitam o zidiću i gledam Baltazara... jel to bila prva AI mašina na svijetu?
  • dpasaric: To se i meni dogodilo par puta, uvijek prije objave napravim barem copy u buffer, a često ako je nešto kompleksnije, samo paste u TextEdit, just in case.
  • Yonkis: I pretraga je beskorisna, zato sam pisao novu temu jer mi je trebalo manje vremena da ju natipkam i dodam screenshotove nego da češljam rezultate pretrage.
  • Yonkis: Jedem ti jabucnjak, napišem novu temu i nisam odabrao Forum i sve mi izbriše kad sam kliknuo PROVJERI. Odsutajem, 20 min tipkanja otišlo u vjetar. Nikakav alert ili nešto da iskoči da me upozori.
  • ZeljkoB: Zaba na dev beti radi bez greske
  • dpasaric: Vidio sam neke na Twitteru da su stavili dev betu, ali nisu ovdje.
  • mbp2009: ne vidim neke konkretne info na netu za to
  • mbp2009: Ne znam odakle ove diskusije poticu, ali da vidim, ima li koga na dev beti ios? Pogotovo ovaj dio me zanima za PBZ i poslovnu PBZ, ako radi
  • dpasaric: Čekam da mi dođe jedan zanimljiv komad hardvera, pa ću finalizirati velik pregled monitora koji će mnogima biti koristan!
  • dpasaric: "Your request has been processed"
  • Ender: takodje i ja molim admina da obrise i moj korisnicki nalog. ostavljam mogucnost da se kasnije opet prijavim kad i ako se neke stvari promene. pozzz i svako dobro.
  • dpasaric: @Air U redu, razumio sam. Hvala ti na svemu onom pozitivnom, ono drugo će srediti vrijeme.
  • jura22: Vrijeđaj partizane i Tita pa da vidiš.
  • Air: Ako si razumio onda napravi to, a ne da moram pisali litanije za jednostavan zahtjev.
  • dpasaric: Air, naravno da je dovoljno, ako to želiš mogu i ja odmah, ali hej, jutro je pametnije od večeri, prespavaj, pa javi, najmanji je problem kliknuti na delete.
  • Air: Zanimljiv vam je latinski. Uživajte. Između vaših upisa napišite što je potrebno da zatvorim račun na Jabučnjaku ako nije očigledno dovoljno razumljivo ovo što sam napisao na vikalici.
  • smayoo: Canis mater studiorum. Stara studentska. :D
  • dpasaric: @Gjuroo: Per aspera ad astra!
  • Gjuroo: @Air: Illegitimi non carborundum.
  • dpasaric: Chill out i vidjet ćeš kako će ovo sada biti ugodnije, korisnije i pozitivnije mjesto za sve korisnike.
  • dpasaric: Joj ne drami.
  • Air: Molim odgovornu osobu da obriše Air račun.
  • Air: U ovim novim okolnostima transparentnog licemjerstva pojedinca podvlačim crtu. Ja nemam želudac za trpiti to da mi jedan licemjer briše čiste postove samo zato što on ima problem u svojoj glavi. Kako je tino1 rekao bilo mi je zadovoljstvo dolaziti na Jabučnjak radi ljudi. Ovim putem pozdravljam sve dobre ljude Jabučnjaka i HVALA vam! Nakon ovog upisa brišem svoj račun.
  • dpasaric: Sve što je sada obrisano u "kafanskim laprdanjima" je bilo u dogovoru s Djurom, počistili samo za sobom i tko hoće može tamo dalje s "lakim temama".
  • drlovric: @Rusty: Slazem se 100%. Svako bira za sebe. Jedna tema u sekciji Razno, nije smetala nikome ko je dosao da konzumira nesto drugo. Ako sam dosao u ducan da kupim povrce, zasto bi mi smetalo sto prodaju i hranu za bebe? :)
  • rusty: Evo kao dugogodišnji član foruma, moram priznati da niti jednom nisam otvorio političke teme niti sudjelovao u njima na forumu. Dolazim vidjeti non političke, non automobili teme. I jedna i druga su mi kao nogomet, besmislene i ne interesantne. Da li će mi faliti, ne. Da li ću manje dolaziti na forum, ne.
  • dpasaric: To je tvoje viđenje.
  • dpasaric: Obećajem da ćemo je izreklamirati na forumu, pa tko voli…
  • Air: Znam tvoje ovlasti. Nije u tome problem. Problem je što se Jabučnjak predstavlja kao pozitivan, a ovo što ti radiš je negativno!
  • dpasaric: Evo, pokreni i ti moderiraj Signal grupu za vaše političke rasprave.
  • dpasaric: I probaj biti koristan. Pokreni nešto pametno i svima korisno.
  • dpasaric: Pročitaj kućni red još jednom.
  • Air: @dpasaric Otvorio si javni komunikacijski kanal. Tko si ti da brišeš postove iste tematike o kojoj sam pišeš, ako ti postovi nisu uvredljivi i ne krše nikakav zakon?

Za vikanje moraš biti prijavljen.

Prijava

Novo na Jabučnjaku

Teme

Poruke

Oglasi

Anketa

Koji Mac koristite?

Page Speed 0.36 Seconds

Provided by iJoomla SEO