Přidat otázku mezi oblíbenéZasílat nové odpovědi e-mailem Knihy v pdf - nejde přeložit text

Zdravím místní specialisty.Dostal jsem CD s několika naskenovanými knihami.Jsou v němčině,angličtině a polštině.Jde mi o to,že bych si rád přeložil text.Problém je v tom,že když označím text,tak mi to napíše "kopírovat ctrl+c".To udělám a když to chci potom vložit do překladače,tak se nic nevloží.Kde je chyba?
Změna předmětu, původně: Knihy v pdf (Kráťa)

Předmět Autor Datum
chyba je v tobě :-) jak chceš kopírovat neexistující text z naskenovaného OBRÁZKU? Aby to fungovalo…
touchwood 10.03.2012 08:05
touchwood
Naskenovanými, tedy jako obrázky? Tak to budeš muset nejprve prohnat OCR programem, text rozpoznat.
L-Core 10.03.2012 08:05
L-Core
A jak se to dělá?
patlal 10.03.2012 08:11
patlal
V prvé řadě musíš nějaký OCR program mít. Obvykle je to popsáno v manuálu, nápovědě nebo programy mí…
L-Core 10.03.2012 08:18
L-Core
Naskenovanými? Než se drbat s rekognitou, bude rychlejší naučit se německy / anglicky / polsky.
mif 10.03.2012 08:13
mif
dnes bych doporučil spíše ABBYY finereader.
touchwood 10.03.2012 08:18
touchwood
To jsem jen tak plácnul. Bílý pes, černý pes - pořád pes.
mif 10.03.2012 08:24
mif
Tak s tím souhlasím.Pouze plácání a nic k věci.
patlal 10.03.2012 08:26
patlal
No a co čekáš? Potřebuješ rekognitu (Optical Character Recognition, OCR). Kdysi jsem si s tím hrál,…
mif 10.03.2012 08:31
mif
Nebo si sehnat danou knihu v textu.
L-Core 10.03.2012 08:19
L-Core
Ty knížky nejsou tak lehce sehnatelné.Kdyby to šlo takto lehce sehnat,tak to nebudu mít naskenované…
patlal 10.03.2012 08:24
patlal
Nepostradatelný text v polštine ... vrtá mi, vzpomínky na mládi Jana Pavla II/Karol Wojtyla ... Po…
Joseph 10.03.2012 08:23
Joseph
Kvalitny OCR program zadarmo nezozenies. Fine reader je jeden z najlepsich, ale nie je zadarmo. Ale…
fleg 10.03.2012 08:31
fleg
Tak ten zrovna zkouším...uvidíme...
patlal 10.03.2012 08:32
patlal
Drahý příteli, kvalitní OCR neexistuje (i když FR je jedním z těch lepších). Nejsme ve Star Treku. B…
mif 10.03.2012 08:35
mif
Takže když je dokument na CD ve formátu pdf,tak je ještě důležité to v jakém jazyce je to naskenovan…
patlal 10.03.2012 08:38
patlal
Nikoliv. Je důležité ovládat jazyk skenovaného dokumentu. Rekognita ti tam naseká otazníky, které bu…
mif 10.03.2012 08:53
mif
Tak jsem nainstaloval ten FR a píše to,že obrázek je malý a poškrábaný..fakt se mi to nechce datlova…
patlal 10.03.2012 09:06
patlal
je toho 65 stran textu To je pohoda. Lepší nadatlovat, a do mateřštiny (neznáš-li autorův jazyk) př…
mif 10.03.2012 09:15
mif
Musíš to celé rozdělit na dvě fáze. První - z obrázku dostat text, který se správný, bez překlepů.…
L-Core 10.03.2012 12:51
L-Core
Nesouhlasim, kvalitní OCR existuje, pokud máš kvalitní vstup. Před 10ti lety už byly programy, kde j…
AZOR 10.03.2012 09:22
AZOR
Abys byl schopny delat OCR, potrebujes aspon trochu kvalitni zdroj (obrazky, idealne stupne sede). P…
Jan Fiala 10.03.2012 11:19
Jan Fiala
Home verzia: 41,- € s DPH , v porovnáni s cenou knih není mnoho, cena jedinej knihy s odbornou témat…
Joseph 10.03.2012 08:37
Joseph
Tak s tím souhlasím.To je fakt.Někdo tu ovšem psal,že to není zas tak jednoduché.
patlal 10.03.2012 08:40
patlal
A zeptám se ještě na jednu věc.Přemýšlím o koupi tohoto Ruční scaner Scanline MT4090.Bude to fungova…
patlal 10.03.2012 08:47
patlal
Abbyy je vymakaný software,pracuje s velkým množstvom akýchkolvek skenerov,dôležité je mať správne o…
audax 10.03.2012 09:17
audax
Ručním skenerem nedokážeš jet tak pomalu a plynule, aby vznikl kvalitní podklad pro rozpoznání a sní…
Kráťa 10.03.2012 09:32
Kráťa
Kazdy rozumny OCR podporuje vstup i ve formátu .PNG. JPG - tedy pres nejakou "standartní obrázkovou…
AZOR 10.03.2012 09:34
AZOR
než takový (a ještě předražený) šit, proč si nekoupíš normální scanner? Já osobně doporučuju tento…
touchwood 10.03.2012 09:50
touchwood
Protože je ruční a ne stolní.
patlal 10.03.2012 10:01
patlal
Nadělej z té knihy obrázky (klávesa print screen) a nepotřebuješ skener. Ruční skener je dobrý tak d…
Kráťa 10.03.2012 10:49
Kráťa
Jak se prosím dělají z normální papírové knihy printscrenem obrázky? Rád se scanneru zbavím :-P
Jan Fiala 10.03.2012 11:23
Jan Fiala
Hihi. Z té pdf jsem měl na mysli. Ale jak píšeš nahoře Azorovi. Pokud to už někdo zprasil...
Kráťa 10.03.2012 11:25
Kráťa
než takový (a ještě předražený) šit, proč si nekoupíš normální scanner? Já osobně doporučuju tento m…
Jan Fiala 10.03.2012 14:20
Jan Fiala
OCR program bude fungovat s jakymkoliv scannerem. Skenovat minimalne na 300 DPI ve stupnich sedi.
Jan Fiala 10.03.2012 11:22
Jan Fiala
Tenhle skener mám (hodí se, neb je přenosný a na dvě tužkové baterky). ABBYY Fine Readeru je lhostej…
oldsoft 10.03.2012 12:40
oldsoft
Díky pozitivní info.Tak to ho můžu bez obav koupit.
patlal 10.03.2012 14:12
patlal
Tak zatím program maká jak má.Díky všem za rady.
patlal 10.03.2012 14:13
patlal
Tak mám další problém.Když se to v tom programu naskenuje a dám uložit do složky,tak se to sice přek…
patlal 10.03.2012 14:23
patlal
TIFF je běžnej obrazovej formát...
oldsoft 10.03.2012 14:27
oldsoft
To asi je,ale přesto mi to nejde otevřít...
patlal 10.03.2012 14:31
patlal
Tak co děláš: skenuješ z papíru a dostáváš soubory .tiff? ABBYY Fine Reader otevírá TIFF zcela bez p…
oldsoft 10.03.2012 14:34
oldsoft
Mám soubory na CD..ty skenuju tim FR a pak to dám uložit do složky.No a v té složce to nejde pak ote…
patlal 10.03.2012 14:38
patlal
Nerozumím. Jak se skenují soubory z CD Fine Readerem? Skenuje se z papíru, knihy, časopisu. Co teda…
oldsoft 10.03.2012 14:40
oldsoft
Třeba vytiskne pdf > oskenuje papír ručním skenerem > hodí do FR.
Kráťa 10.03.2012 15:07
Kráťa
No to je nápad ;-) PDF (i obrázkové) Fine Reader otevře taktéž. Návrh pro patlala: pokud nějaká kníž…
oldsoft 10.03.2012 15:10
oldsoft
Já ti to můžu poslat tu jednu stránku na maila...můj je sklokan1@seznam.cz...pošli jen čau a já ti n… poslední
patlal 10.03.2012 16:31
patlal
FineReader umi zpracovat i PDF. Proste provede OCR z obrazku, ulozenych v PDF. Drivejsi verze se cho…
Jan Fiala 10.03.2012 16:17
Jan Fiala
Prohlizec obrazku a faxu - soucast Windows Pripadne jakykoliv prohlizec obrazku (XnView, IrfanView,…
Jan Fiala 10.03.2012 14:38
Jan Fiala

Nikoliv. Je důležité ovládat jazyk skenovaného dokumentu. Rekognita ti tam naseká otazníky, které budeš muset nahradit správnými písmenky. Používáš-li zároveň s ní i thesaurus (některé "lepší" OCR jej nabízejí), pak ti z textu vznikne kontextově nesrozumitelná matlanina. Navíc vyladit (naučit) to není žádná prdel. Vím co mluvím (píšu). Neříká se mi to snadno, ale chceš-li si zachovat mentální zdraví, raději to vzdej.

Tak jsem nainstaloval ten FR a píše to,že obrázek je malý a poškrábaný..fakt se mi to nechce datlovat do Google překladače...je toho 65 stran textu.Těch knížek je na tom CD 17 a to bych se z toho asi rozpospos..l.Fakt není jiná možnost jak to z toho CD překlopit do překladače?

je toho 65 stran textu

To je pohoda. Lepší nadatlovat, a do mateřštiny (neznáš-li autorův jazyk) přeložit třeba gůglem. Taky z toho (strojového překladu) vznikne paskvil, bude se v tom ale dát trochu orientovat. Abych ale jen nehanil - ten FR není špatný, chce ale "študovat" (to poznáš :-)), krom toho doporučuju obrázek s co nejlepším rozlišením a černobílý (striktně!) s vysokým kontrastem. Hraj si, tu máš kohouta...

Musíš to celé rozdělit na dvě fáze.

První - z obrázku dostat text, který se správný, bez překlepů. Máš dvě možnosti: OCR a opravovat ručně nebo to rovnou v cizí řeči přepisovat. Bohužel opravování v neznámé řeči zabere možná víc času než to rovnou v té neznámé řeči opisovat (záleží, jak píšeš).

Druhá - překlad. Pokud cizí řeči rozumíš a nebudeš používat nějaký translator, asi bude nejrychlejší ten naskenovaný text ROVNOU překládat a přepisovat v češtině.

Katastrofálně náročné na čas. Buď bych to našel v textech, nebo bych se na to vykašlal.

My, co některou ze zmíněných (či více) řečí umíme, jsme za vodou. Pokud to nepotřebuješ fyzicky, pro jiné.

Nesouhlasim, kvalitní OCR existuje, pokud máš kvalitní vstup. Před 10ti lety už byly programy, kde jsem po menších opravách dokázal identifikovat nad 98% textu, možná více. Osobně si myslim, že MNOHEM VÍCE (a zvláš když se pak ty chyby vynásobí) to zmrví ten překlad do jiného jazyka.

Abbyy je vymakaný software,pracuje s velkým množstvom akýchkolvek skenerov,dôležité je mať správne ovládače pre skener a používaný operačný systém aby bol skener správne nainštalovaný a inicializovaný operačným systémom,potom ho nájde aj obslužný software

než takový (a ještě předražený) šit, proč si nekoupíš normální scanner?
Já osobně doporučuju tento model: http://www.alfacomp.cz/php/product.php?eid=1051400 8800000010BH

Tyhle scannery s CIS snimacem na skenovani knih moc dobre nejsou. Budou problemy v miste vazby knihy. Budes muset knihy rozlamat, abys polozil stranky na sklo i v miste vazby.
Poud to myslis se skenovanim knih vazne, pak neco s CCD snimacem.

Tenhle skener mám (hodí se, neb je přenosný a na dvě tužkové baterky). ABBYY Fine Readeru je lhostejné, z jakého skeneru obrázek pochází. Jen je potřeba dostatečný kontrast a rozlišení. Tenhle umí 300 a 600 dpi, tzn. v pohodě. Občas člověku ujede ruka, takže obrázek začíná rovně a končí šikmo, ale to se dá při troše cviku zvládnout.

Tak mám další problém.Když se to v tom programu naskenuje a dám uložit do složky,tak se to sice překlopí tam kam má,ale s koncovkou "tif" a nejde to pak otevřít.Píše mi to,že mám najít program pomocí webu,ale mezi nabídnutejma k použití to napíše Adobe Reader a ten mám.Přesto to ten Adobe neotevře.

No to je nápad ;-) PDF (i obrázkové) Fine Reader otevře taktéž. Návrh pro patlala: pokud nějaká knížka není tajná, dej pokusně jednu z nich někam na ulozto.cz, já to zkusím svým ABBYY Fine Readerem 10 Professional (koupeným, to je soft, který se vyplatí) a uvidíme, co z toho vyleze.

Zpět do poradny Odpovědět na původní otázku Nahoru