Free OCR (hladam)
Hladam dobry soft na rozpoznavanie textu, najlepsie free, ale nemusi byt.
Mam asi 100 stran textu, je to tmavomodry text, Arial 12, ktory by som rad previedol do elektronickej formy (nechce sa mi to moc prepisovat).
Poradi niekto nieco nech nemusim skusat?
Mam to odscanovane na 400 DPI.
Změna předmětu, původně: Free OCR (Kráťa)
Myslim, ze nie je co vymyslat, Najlepsie skusenosti mam s ABBY Finer readerom. Podla mna je to 1 na trhu.
Jedno free ocr existuje, dokonce se tak i tusim jmenuje. Ale neni to nic svetoborneho.
Pokud ten text obsahuje diakritiku, zkus OCR, ktere je soucasti Office 2007 a vyssich, fungovalo docela dobre.
Jinak ABBY Fine reader (verze 9 nebo 11), pripadne posledni Omni page pro.
Já jednou nainstaloval trial ABBY Fine reader a během víkendu převedl asi 30 povídek.
Skusil som, prevadza to pekne (Abby Fine Reader).
Problem je ale v tom ze text co mam je vo forme tabuliek (su to tabulky bez ciar) no a vysledkom je uz podstatne ina tabulka ako ta povodna, dany soft to nevie nejako usporiadat tak ako je original
Jak má ten soft vědět, kde jsou hranice buněk na originále, když tam nejsou čáry?
Nemusi vediet kde su hranice buniek.
Ale poviem priklad
mam 5-stlpcovu tabulku
v prvom riadku da pekne vsetkych 5 buniek vedla seba
lenze v 2.riadku da vedla seba len 4 bunky a tu 5 bunku da niekde uplne inde.
Potom v 3 a 4 riadku je zas vsetko OK.
V 5 a 6 a 7 ale zas porozhadzuje posledne bunky tak ako sa mu zachce
Ten SW netuší, že je vstup v nějaké tabulce a udělá to podle sebe "jak to vidí".
V tom pripade si s tim musis vyhrat a nakreslit mu cary, kde maji byt tabulky - pred rozeznavanim textu upravit oblast pro rozeznavani.
Ale to znamena, ze si budes hrat s kazdou strankou.
Och!
Mozem to skusit, ale to uz bude (skoro) ako to pisat rucne...
Tak nebude to take jednoduche.
Myslel som ze si spravim mriezku ktoru budem na jednotlive obrazky kopirovat, lenze bunky maju roznu vysku, takze z toho nic
A nakonec bude nejrychlejší, převést jen na písmena a pak dodělat tabulky "růčo"
Tak zistujem ze asi najrychlejsie to bude napisat rucne
Dakujem vsetkym za rady a pomoc!
Ta slova nepřepisuj. Je z nich naděláš tabulky
Tohle ABBYY samozrejme umi. Pokud mas tabulky na vsech stranach stejne, udelej to na jednom snimku, pak si uloz snimek jako vzor, oznac vsechny ostatni obrazky a nacti vzor.
Free OCR je napriklad Tesseract, ale s tymi tabulkami to bude asi problem v kazdom OCR. S tym sa budes muset pohrat rucne.