ABBYY FineReader Express, formatiranje teksta
(1 korsinik/a gleda/ju temu) (1) Gost

ABBYY FineReader Express, formatiranje teksta


21.01.2011 | 14:07
Kada skenirani tekst obradim u ABBYY FineReader Expres, koristeći opciju Convert to Text Document, pa taj tekst prebacim u word, ne mogu da zadržim formatiranje teksta. Naime, uvučeni redovi više nisu uvučeni, nego poravnati s lijeve strane. Postoji li mogućnost da zadržim formatiranje teksta kakav je u originalu, ili ga moram ponovo formatirati i svaku uvlaku ponovo postaviti?

U jednoj ranijoj verzijiABBYY-a sam išao na Convert to Searchable PDF i dobijao sam bolji rezultat. sada u ovoj verziji ne.

Kako postići najbolje rezultate kod ovog programa?
21.01.2011 | 17:58
A da li tekst spremaš kao Plain ili Rich Text? Spremaš li ga u .rtf formatu? Kako je kad ga otvoriš u TextEditu?
sad sam provjerio. Mora biti spremljen kao .rtf.

Javi rezultat.
21.01.2011 | 19:26
U .rtf, ali kada ga prebacim u word i formatiram, ne mogu dobiti uvlake kod pasusa, dijaloga i sl. Sve moram ponovo ručno dotjerati. Opet, velika pomoć. Ne mogu više ni zamisliti taj mukotrpni posao prekucavanja dugih (književnih) tekstova.
23.01.2011 | 10:58
Ja sam prebacivanje knjiga do sada radio na PC-u sa ABBYY 10-kom ravno u MS Word i osim manjeg broja ispravaka pogrešno prepoznatih slova i ponekad prevelikih razmaka između pasusa sve drugo je već ok. Do sada me najviše namučilo par stranica u jednoj knjizi gdje je tekst bio formatiran u dva stupca i to su još morali biti fino poravnati zbog veze teksta izmedju stupaca. Pokušao sam i direktno u PDF, međutim iz nekog razloga na pojedinim stranicama mi je jedan red u tekstu prelazio izvan desne margine, a nije se dalo u Acrobatu sredit, pa i dalje radim preko MS Worda.

Skinuo sam zadnju verziju za Maca pa kad probam napisat ću dojmove.
23.01.2011 | 11:04
ABBYY 10 nije za Mac, pa je možda u tome razlika.
23.01.2011 | 11:28
Pa vjerojatno postoji razlika između PC i Mac verzije. Daj mi malo vremena da se poigram sa Mac verzijom pa napišem osvrt.
24.01.2011 | 14:17
Eto isprobao sam ABBYY za Maca i prvi su dojmovi pozitivni iako se razlikuje od verzije Pro za Windoze u nekoliko bitnih točaka.

Prva je razlika, a ujedno i najveća, što Mac verzija pored slike skenirane stranice na kojoj se mogu postavljati okviri oko teksta koji će pročitati ne nudi odmah i sam tekst sa strane i to sa istaknutim eventualnim pogreškama kod prepoznavanja gdje se te greške mogu ispraviti. Zapravo, odmah po skeniranju se nudi spremanje prepoznatog teksta u prethodno izabrani RTF format, a koji se nakon toga u mojem slučaju odmah otvara u instaliranom MS Wordu. Mislim da je to nepotrebno i da bi prvo trebalo korisniku ponuditi da ispravi okvire za tekst, izmjeni ili izbriše eventualne fusnote, zatim ispravi pogreške kod prepoznavanja i tek onda napravi izvoz u željeni dokument baš kako omogućuje windows Pro verzija.

Druga je bitna razlika što Mac verzija skenirane dvije stranice knjige odjednom ne odvaja kao dvije stranice, nego ih prepoznaje kao jednu sa tekstom u dvije kolone. To jako komplicira kasnije formatiranje stranica jer se prvo treba riješiti stupaca teksta te izmjeniti orijentaciju stranice i njezin format što može dovesti do gubitka izvornog formata teksta. Ne mogu vjerovati da u Mac verziju nisu implementirali tu osnovnu opciju koju posjeduje windows verzija.

Ima još jedna stvar koja mi nije jasna. Imam kupljenu licencu za ABBYY FineReader Express Edition for MAC i nakon aktivacije i regidtracije još uvijek mi je opcija "Preferences..." na izbornku zasivljena i onemogućena? Je li to normalno ili što? Ipak sam očekivao da će imati mogućnost nekih osnovnih postavki poput inicijalnog formata stranica, isključivanje prepoznavanja fusnota itd. da sad ne nabrajam sve.

Mislim da Mac verzija po svojim mogućnostima još uvijek daleko zaostaje od svoje verzije za windowse, vjerojatno zato i onaj Express u nazivu. Mislim da je dobra za prepoznavanje kakvih dokumenata, možda ugovora i slično, ali definitivno još nije dovoljno zrela za obimniji posao kao što je prebacivanje štampanih knjiga pa čak ni njihovih manjih dijelova.

Ipak, jedna me je stvar oduševila. Naime, ja imam mrežni mutifunkcijski printer/skener i ABBYY mi ga uredno prepozna i podigne njegov ScanGear baš kao i na PCju i čak mi omogućuje slijedno skeniranje bez prekidanja

Pa Laki, da se sada još malo osvrnem na tvoj problem. Dakle, ja imam ABBYY FF Express Build 8.0.0.3891 i MS Word:mac 2011 verzija 14.0.0 (100825).

Prvo sam skenirao desetak stranica jedne knjige, onda sam još jednom provjerio okvire oko tekstova na stranicama i morao neke nepotrebne izbrisati. Još sam jednom pokrenuo prepoznavanje i tekst mi se otvorio automatski u Wordu.

Veličina stranice u wordu je bila A4, landscape orjentirana sa tekstom u dva stupca. Prvo sam selektirao cijeli tekst i "Split text into colimns" stavio na 1.

Zatim sam preko izbornika "File" -> "Page Setup..." promijenio orjentaciju u portrait, te odabrao veličinu A5 koja odgovara veličini skenirane knjige. Pokušaj da to napravim preko "Layout" kartice sa "Orientation" i "Size" rezultiralo je totalnim gubitkom formata teksta.

Dobio sam tekst koji je između nekih pasusa imao preveliki razmak koji sam eliminirao tipkom "delete", a vjerojatno zbog toga što je ABBY umetnuo page break pa se nakon ovih promjena nalaze na pogrešnom mjestu. Možda postoji i bolji način za maknuti PB, ali ja imam vremena pa to deletam

Meni su margine bile već ok, ali ako nisu sad je vrijeme da se prvo isprave margine i onda na kraju selekcijom cijelog teksta može se malo povećati ili smanjiti indent (uvlačenje) pasusa koje ovim postupkom nisam izgubio. I kad sam sve to napravio dobio sam slijedeće:

ABBYYfornat1.jpg


Oprosti, nisam neki stručnjak za word, pa vjerojatno neke stvari radim pješke, a može se vjerojatno i jednostavnije, ali meni je dovoljno da mogu prebaciti štampanu knjigu od kojih par stotinjak stranica u EPUB format i čitati na iPadu. Nekim pasusima na kraju to uvlačenje može biti veće ili manje nego drugima, pa ja to obično namjestim tako da stavim kursor na taj red i onda na horizontalnom ruleru namjestim "First line indent" oznaku da se poravna s ostalima. Vjerojatno se to može i preko trake izbornika "Format" -> "Paragraph" -> "Indents and Spacing", ali ne volim kad mi word nešto radi s tekstom automatski, a da ja to ne vidim jer često jednu stvar napravi kako treba, ali zezne neku drugu
24.01.2011 | 15:08
Teško formatira tekst. Jednostavne stvari idu. Kao gornji primjer, ali probajte neki složeniji tekst s tabelama, više kolona, slikom i razlićitim fontovima. Nije svemoguć. OCR je više zamišljen kao pomoć pri skeniranju teksta da se ne mora prekucavati. Ipak se daktilografija uči neko vrijeme, a OCR ide u par sati. Uvijek postoje iznimke koje OCR program teže savladava.
Za MAC je ABBYY FineReader Express Edition for Mac i mislim da ono express nije kao puna verzija, već ekspres. Možda griješim.
24.01.2011 | 16:19
@zabac OCR jest zamišljen da prvenstveno zamjeni ukucavanje, ali ABBYY se također reklamira i da može zadržati format teksta, vidi ovdje, a to prilično i dobro radi, barem kad su tekstovi u pitanju, pa čak i oni sa slikama, različitim fontovima i stupcima (osim u izuzetnim slučajevima). Isprobano i radi na Windows verziji ok. Ja sam do sada skenirao desetak knjiga od kojih je jedna imala čak 380 stranica. Za tu knjigu od 380 stranica trebalo mi je manje od 5 sati od prvog skena do gotove knjige u EPUB formatu.

Veći problem prestavlja Word koji bez obzira na svoje već dugačko postojanje i razvoj, još uvijek ima svoje mušice, pa zna izgubiti format teksta samo zbog jednog krivog klika na krivu funkciju na krivom mjestu i u krivo vrijeme Sva sreća što postoji Undo, premda sam doživio da u nekim specifičnim slučajevima čak ni Undo više ne zna vratiti prethodno stanje pa nastane sranje.

I da, dobro si to zamjetio, a ja već prethodno napisao da je ova verzija ABBYY-ja Express baš zato što joj očito nedostaju one funkcije koje ima Pro verzija na Windowsima. Na žalost za Maca za sada je izgleda dostupna samo Express verzija.
25.01.2011 | 14:29
Moje malo iskustvo sa ABBYY za Maca.
Skeniram dvije stranice knjige, odaberem Convert Text Document, tekst mi se pojavi na desktopu kao .rtf. Pojave se obje stranice jedna ispod druge, odnosno tekst kao cjelina dviju stranica. Tekst u .rtf je formatiran sa uvlakama.
Prebacim taj tekst u word (ne otvara mi se automatski u Wordu 2011) i on je takođe i tu formatiran kako treba, ali je povučen udesno. Ne vidim desnu marginu. Označim tekst u wordu, pa kliknem na Normal. E, sada su problemi - nema više formatiranog teksta, nego ga ručno moram postaviti tako da bude poravnat s obje strane i svakom pasusu dati ručno uvlaku.

Kako natjerati word da mi da i desnu marginu? Kako sačuvati uvlake?
word.jpg
26.01.2011 | 11:47
Sank je napisao:
Dakle, ja imam ABBYY FF Express Build 8.0.0.3891 i MS Word:mac 2011 verzija 14.0.0 (100825)


Da se osvrnem na ovo - Sank, updejtaj si Office, mislim da su već dva-tri updejta izašla koja poboljšavaju stabilnost i brzinu, tako nešto...
26.01.2011 | 11:52
Sank je napisao:
Za tu knjigu od 380 stranica trebalo mi je manje od 5 sati od prvog skena do gotove knjige u EPUB formatu.


Smije li se znati koje to knjige skeniraš? Samo neke znanstvene ili ima i bestsellera?

S obzirom da ovi bedaci od izdavača u nas još ništa ne rade oko digitalnih knjiga - spreman sam ti platiti za kopije tvojih skenova (imam u obitelji ljude koji jako vole čitati, no s vidom im se toliko zakompliciralo da više ne vide dovoljno dobro ovu veličinu fonta u knjigama). A onda ebookove na iPad i vozi miško.
26.01.2011 | 18:51
@Vanjuška

Hvala za info za office update. Zar se ne bi trebao MS office updejtat automatski kao na win? Budem provjerio.

Za knjige što pitaš do sada sam prebacio nekoliko bestselera, a i neke edukativne knjige. Možda to nije uredu, ali opet s druge strane papirnato izdanje sam platio, a čitam kad prebacim u elektronsko. Recimo da radim sigurnosnu kopiju.

Iz tog razloga rado ću ti posuditi moje sigurnosne kopije knjiga, ali nikako naplatiti da ne kršim zakon o intelektualnom vlasništvu To bi bilo isto kao da sam ti posudio papirnato izdanje. Budem ti se javio na PM sutra sa popisom.

@Laki

Nisam baš najbolje razumio kako ti se pojavi RTF tekst na desktopu, ali definitivno ti nije ok označiti tekst i kliknuti na normal, osim ako ga možda nisi nekako prekonfigurirao jer ti inače Normal style definitivno pregazi prethodni format. Koliko vidim tebi desna margina bježi izvan papira pa da li si probao preko Page Setupa provjeriti veličinu papira i postavke margina i od tamo pokušati ispraviti?
27.01.2011 | 12:12
Ne znam kako mi se pojavi okvir rtf tekst. Jednostavno iskoči prozor na desktopu satekstom. Evo slike. E, a kako sačuvati ovo formatiranje kada sve prebacim u word? To istražujem.

Uvijek mi javlja da je slika koju ovdje hoću da prikopčam prevelika.
Prilozi:
27.01.2011 | 12:17
Slika
Sim.jpg
28.01.2011 | 12:58
Skenirati se mogu po dvije stranice, a onda u Photoshopu izrezati svaku posebno, pa ubaciti u ABBY. Problem i dalje ostaje formatiranje. Istražujem dalje.
Moderatori: Bertone
  • Stranica:
  • 1

Vikalica™

Zadnja poruka: pred 21 sati, 24 minuta
  • drlovric: Bas tako Mario. Ja sam bio u USA i kupio MBP M1 Pro 16" i najmanju potrebu nemam da ga mijenjam. Pogrijesio sam jedino sto nisam uzeo 14" :)
  • marioart: uredjaji su predobri i predugo traju :)
  • Riba: Zalosno je vidjeti kako mac prodaja stagnira.
  • Yonkis: Ili ovako nešto? [link]
  • Yonkis: Gdje staviti ovakve vijestice? [link]
  • gladhr2: [link] ima li netko pametan da mi malo pomogne sa ovim problemom..?
  • dpasaric: Nema indoor mapa kod nas AFAIK.
  • Yonkis: Jeste li znali za bolji anti-reflective sloj na 17ici? [link]
  • Yonkis: Ima li u Rijeci ili igdje u HR ovo implemetirano? [link]
  • Yonkis: Novi AirTag: [link]
  • Yonkis: Bijah u Smart Doctoru, zamjenska je 100€ a originalna je 170€
  • smayoo: @Yonkis, pitao si kome vjerujemo :)
  • marioart: @Yonkis ovisno o aparatu koji imas, nije ti zgorega ni provjeriti cijene u sluzbenom servisu... ja sam u mediamarktu u njemackoj platio zamjenu za 13pro 88eura ... spojis ugodno sa korisnim i u Graz u shoping i servis
  • Yonkis: A ovi u Rijeci, Smart Doctor? Evo linka:[link]
  • Yonkis: Novi firmware ako nekome treba: [link]
  • Yonkis: Nevjerovatno da je cijena skočila na 150€ a znam da je prije 2 godine bila cca 70€. Prestrašno!
  • smayoo: @Yonkis - nažalost, u Rijeci više nikom. :( U Zagrebu je Davor više puta spomenuo da ima dobra iskustva s Agramservisom
  • VanjusOS: pa ti vratim
  • VanjusOS: ako imaš kabl kojeg trebaš isprobati možeš poslati meni da isprobam spojiti Mac pro
  • VanjusOS: i ja tražim već thunderbolt 2 kabel, iz Osijeka sam
  • zoranowsky: Jel ima netko u ZG za posuditi thunderbolt 2 kabel? Imam issue sa minijem M4 i thunderbolt 27 displayem pa trebam testirati neke kombinacije...
  • Yonkis: Kome vi u Rijeci vjerujete za zamjenu baterije na iPhonu jer u iStyleu je 150 € i čeka se par tjedana
  • Yonkis: :(
  • smayoo: [link]
  • smayoo: RIP Scott Adams :(
  • Gjuroo: Za sad to može zvučati i kao Affinity priča. Not great but not that bad.
  • Soffoklo: Za to vrijeme Apple se lagano pretvara u Adobe - [link]
  • drlovric: Sve je bolje od ove blamaze sa Apple AI i cekanja pametnije Siri koja nikako da dodje :)
  • IkoIko: Apple i Google sklopili ugovor o korištenju Gemini AI... Zanimljiv razvoj situacije
  • ZeljkoB: Spigen - [link]
  • Riba: Moza zato da mozes koristiti BT tipkovnicu i mouse i dok je zaklopljen?
  • user: glupo: zatvorim laptop, BT i dalje upaljen, što ne bi trebalo ovo **** se ugasit kad ga poklopim
  • rusty: date hack je samo na par sekundi. vratiš datum, startaš app čisto da se digne i vratiš datum opet. To je to. Čisto da loada profile i postavke
  • smayoo: Date hack nisam htio raditi jer potrga druge stvari. Krenuo sam instalirati staru verziju LogiOptions preko homebrewa, ali riješili su problem prije nego sam dospio to napraviti
  • rusty: Osobno mislim da je 12h predugo za cert problem I nisam mogao doć na sebe kakav su problem napravili. Ono što je još gore, ovo im nije prvi put za taj isti slučaj. Dakle kako ne naučiš nešto iz ovoga. Dodano, date hack rješava problem da se ne mora drugi put čekati 12h
  • Bertone: A jučer nisam koristio MBP nego T14s pa nisam iskusio veselje sa certifikatima :D
  • Bertone: Imam MXMastera već godinama [link] i jedina dobra stavr kod njega je što ga mogu koristiti sa MBP, Tnink Padom i desktop računalom bez pretjeranog petljanja, no da je (pre)skup za ono što nudi, je.
  • smayoo: I, na kraju, ako za neki komad hardvera koji sam u životu kupio mogu reći da NIJE preskupo plaćen, to je sigurno Logitech MX Master 3. Jučer ujutro jesam bio spreman popi... na njih, ali činjenica je da su problem riješili unutar cca 12h otkad se pojavio.
  • smayoo: Osim toga, hardver radi s bazičnim postavkama, ali svi tweakovi i custom podešenja - ne.
  • smayoo: Radi se o softveru koji mora dobiti dozvolu korisnika da zakopa dosta duboko pod haubu radi komunikacije s periferijom.
  • smayoo: Ne mora biti spojeno na internet. Sigurnosni certifikat aplikacije je bio istekao i Apple ga je blokirao, a Logitech nije pazio na datum isteka certifikata i nije izdao update s novim certifikatom na vrijeme
  • Bertone: Ček malo, preskupo plaćeni hardver ne dela na Apple računalu ako računalo nije spojeno na internet (na stranu sad istekli certifikat) ili sam propustio nešto
  • smayoo: Da, jučer sam imao natezanje oko toga. Ali moram im priznati da su brzo riješili.
  • Yonkis: [link]
  • smayoo: @mrobert, forum, tema "eOI - opet diskriminacija"
  • stefanjos: SRETNA NOVA!
  • drlovric: [link]
  • signout: Sretna Nova!
  • zoranowsky: Sretna Nova!
  • dpasaric: Sretno nam svima! :)

Za vikanje moraš biti prijavljen.

Prijava

Novo na Jabučnjaku

Teme

Poruke

Oglasi

Komentari

Anketa

Koji Mac koristite?

Page Speed 0.72 Seconds

Provided by iJoomla SEO