Molim preporuku za OCR softver
(1 korsinik/a gleda/ju temu) (1) Gost

Molim preporuku za OCR softver


17.02.2015 | 23:34
Imam 200 A4 listova tehničkih tablica koje moram vratiti u elektronički oblik.

Stvar je isprintana iz Excela, nekim običnastim Arial-olikim fontom (možda je Calibri, možda je Tahoma, nemam oko da to razlikujem, ali uglavnom radi se o sans-serifnim slovima), sve crnom bojom, na bijelom papiru. Ćelije su u najobičnijem rasteru - pune linije standardne debljine, i horizontalno, i vertikalno.

(Iz prilično glupih društveno-političkih razloga ne mogu do izvornog elektroničkog dokumenta niti imam ikakvu alternativu da ga nabavim. Ne dirajte u ljutu ranu. Jedina mi je opcija OCR iz ovih papira.)

Papire ću dobiti skenirane kao TIFFove 1-bit color depth, maksimalne rezolucije koju skener podržava bez interpolacije.

Postoje kolone samo s brojevima i kolone s tekstom (na hrvatskom, čćžđ...)

Radi se o ogromnoj količini podataka pa naknadna ručna kontrola i ispravljanje APSOLUTNO NE dolazi u obzir.

Zato mi je bitno da je točnost OCR-a što je veća moguća, osobito za brojke.

Također bi bilo bitno da OCR kuži da se radi o tablici i formatira izlaz kao tablicu. Bilo da koristi TABove ili CSV ili kako god.

Cijena softvera bi se morala uklopiti u ne više od $150-200. Poželjno je i manje.

Online OCR servisi nisu baš poželjna opcija, ali ne isključujem ih a priori.

Zahvalan na svim prijedlozima i idejama!
17.02.2015 | 23:36
Pardon. Nije nužno da se radi o Mac softveru. Može i Win softver.
  • Dijete
  • Posjetitelj
18.02.2015 | 03:08
www.abbyy.com.au/finereader/

Ima trial pa probaj, ne znam kako radi sa tablicama, ali mi je jedini OCR s kojim sam radio. Nije mi vise dostupan, pa ne mogu sam provjeriti to s tablicama, ali oni se hvale da svi elementi, tablice i grafike ostaju...

Koristio sam verziju 9 (aktualna je 12) i ta je lijepo radila sa dijakritickim i tvoji tiffovi se cine overkill jer je prepoznavao i lose skenirane dokumente.
18.02.2015 | 07:03
I moj glas ide Abbyy fine reader-u. Radi s tabelama, prepoznaje nase grafeme, brojke mu idu odlicno. Ne znam cemuu TIFF, jer je taj formatobicno vrlo veliki. Treba ti 300dpi, greyscale ili B&W (imam na skeneru opciju OCR).
Ono u sto nije siguran, oznaci kao markerom. Eksport napravi i u Excel. Ako nije zahtjevna tablica, cak ju ok prebaci. Jedini problem moze bitidatibrojke spremi kao tekst, ali u Excelu to mozes prebaciti u broj.
Doduse, ja imam Abbyy fine reader express jer imam 10.6.8, a za vise sisteme je onaj pro koji ima vise opcija i mogucnosti.
24.02.2015 | 13:55
jesi našao neko rješenje za ovo?
24.02.2015 | 17:16
Probao sam Abby i još neka 2 (u istom rangu cijene), na testnom batchu od 10 stranica. Ova druga 2 su totalna katastrofa, brrr...

Abby je odradio posao na kraju. Ne odlično, ali OK. Radi se o tablicama. Sve ispada OK, samo je problem što ADF od scannera ne uspijeva sve papire povući idealno ravno pa onda na onima koji su otišli zeru ukoso (ništa dramatično, recimo da 2-3 mm bježe od vrha do dna) ima problema s prepoznavanjem ruba ćelije (pa ubacuje nepostojeće jedinice, male "L", velika "I", uskličnike i slične znakove).

Također, gotovo svaki put kad je imao više jedinica zajedno, ili jedinicu kraj kose crte ("/1" ili "1/") to je prepoznao kao "ll" (dva mala "L"), iako je jedinice pokraj drugih znamenaka prepoznavao nepogrešivo.

Najmanje bitan, ali najviše uočljiv problem imao je s ne-hrvatskim slovima. Naime, ako odabereš HR kao jezik, da bi uredno prepoznavao čćžšđ, onda ne doživljava slova W i Y (iako je X ok, s njim nema problema), nego w tumači kao "vv", a y kao "v".

Moram naglasiti da se radi o jako malom postotku pogrešnog prepoznavanja, ali količina toga je ogromna tako da se i s tim malim postotkom nakupilo ispravljanja. No, opet je sve bilo gotovo u jedan dan.

Hvala svima na preporukama!
Moderatori: Bertone
  • Stranica:
  • 1

Vikalica™

Zadnja poruka: pred 9 sati, 19 minuta
  • hal9000: OVO: -> [link]
  • hal9000: @yonkis: ma neki kompjuterski virusi... nemam pojma što je to! @smayoo: pa ja bih baš na krstarenje... :D
  • VanjusOS: [link]
  • smayoo: Sad su ti ta krstarenja vrlo povoljna pa nemaš više izgovora. ;)
  • Yonkis: hal9000 misliš o norovirusima? Srećom besparica me opet spasila pa nisam na kruzerima :j
  • hal9000: Danas čujem ekipu kako priča o nekim virus killer-ima. Može mi netko objasniti što je to? :D
  • imjasminh: Prodano kolegi s foruma.
  • imjasminh: 750 eur - [link]
  • Yonkis: Moram priznati da je ovo dobro odrađena aplikacija: [link]
  • imjasminh: Pozdrav svima! Prodajem Apple Watch Ultra 3, 49mm Black Titanium, račun garancija. Nije ni 2 mjeseca star, bacite pogled na oglase: [link]
  • dpasaric: I previše su ih prodali s obzirom na sve... oko 600.000
  • user: pa se nije dobro prodavao
  • user: Apple Vision je očito preskup bio
  • Riba: Bas glupost od hardvera.
  • Yonkis: Ok, i nije to neuspjeh, nešto su naučili iz toga, nadam se.
  • Riba: RIP Apple Vision. - [link]
  • drlovric: Lijepo [link]
  • dpasaric: Kao jako su zabirnuti za tvoju privatnost, a istovremeno s druge strane čini sve da je potkopaju...
  • Yonkis: Ova opcija neće nikada biti dostupna u EU ili...? [link]
  • Yonkis: The iOS 26.4.2, iPadOS 26.4.2, iOS 18.7.8, and iPadOS 18.7.8 updates that Apple released today address a security vulnerability that the FBI recently used to extract Signal message previews from an iPhone even after the app was deleted.
  • drlovric: Ja sam zadnji put cuo nikada da mi neko kaze, jao jest mi spor SSD na Mac :) To samo forsiraju ovi YT recenzenti. Nama normalnim smrtnicima totalno nebitna stavka na modernim M Macovima...
  • Yonkis: Zato jer mac diktira koliko će brzo SSD raditi. Ako radi max onda ce se i trošiti max. Ovako radi laganica pa traje dulje. Ovo pričam iz guzice. Možda ima smisla.
  • ZoPaj: mjerim s blackmagic disk speed test: mac studio m4 1tb disk 6380 mb/s read, 5200 write vanjski tb5 samsung 9100pro 4tb u acasis 80gps 6430 mb/s read, 6000 write znači vanjski brži od ugrađenog mac ssd
  • jura22: Uz TB5 i dobro kućište dobiju se velike brzine prijenosa podataka, ne kao interni SSD (otprilike duplo manje).
  • jura22: RAM se ne da "odlemiti" jer je sastavni dio SoC-a.
  • Ender: @cavarovobrdo: ... ili barem SSD.
  • cavarovobrdo: Nadam se da će novi CEO odlemiti RAM ;)
  • cavarovobrdo: Muštuluk: John Ternus to become Apple CEO
  • imenso: John Ternus novi CEO
  • CoffeePod: @yonkis jos me macOS 26 nije vidio a tko zna hoce li 27. Sequioa mi je toliko dobra da nemam razloga updejtati, a cijela prica sa Liquid Glass mi je odvratna.
  • Yonkis: The upcoming macOS 27 release will be compatible with Apple silicon Macs only.
  • dpasaric: Možeš uz search naći svaki
  • dpasaric: Pa zadnji intervju je na naslovnici, a ostali raspršeni tijekom godina
  • Ender: @dpasaric: a gde su ti razgovori? mislim gde se mogu naci?
  • Performita: Omogućuje lako postavljanje novih uređaja, sigurnost podataka i poslovni email bez velikog IT odjela. Cilj je da tvrtke rade jednostavnije i sigurnije na Apple uređajima.
  • drlovric: U cemu je fora sa ti Business? Imamo li mi mali smrtnici neku korist od toga ili je to samo za velike tvrtke?
  • Performita: Kalimera, Dobro jutro... ovo za Apple Business rolls zvuči kao izvrsna vijest!!!
  • Borisone: Apple Business rolls out to 200 countries today - brace for impact - even Croatia!
  • Yonkis: iOS 26.4.1 and iPadOS 26.4.1 This update has no published CVE entries.
  • stefanjos: Treba mi as u rukavu kada me netko pita gdje da ide haha :D
  • smayoo: Ima ih nekoliko koji se oglašavaju kao iPhone serviseri, nijedan mi nije baš ulio povjerenje, ali nemam neposrednih loših iskustava.
  • stefanjos: gdje nositi iphone na popravak u rijeci kada nema jm elektronike?
  • Yonkis: @smayoo Nema na čemu, evo ja upisah.
  • smayoo: @Yonkis, evo, otključano, hvala na upozorenju!
  • dpasaric: Booo?
  • Yonkis: “ Lažu li nas :) ...nastavak sa vikalice.” - tema zaključana a zadnji post završava sa pitanjem?
  • smayoo: Sretan Uskrs!
  • Yonkis: Sretan Uskrs braćo! I sestre!
  • zoranowsky: Sretan Uskrs!
  • Gjuroo: Sretan Uskrs!

Za vikanje moraš biti prijavljen.

Prijava

Novo na Jabučnjaku

Teme

Poruke

Oglasi

Komentari

Anketa

Koji Mac koristite?

Page Speed 0.79 Seconds

Provided by iJoomla SEO