Přidat otázku mezi oblíbenéZasílat nové odpovědi e-mailemVyřešeno převod jpg do txt

Hledám nějaký software,který mi převede dokument s koncovkou jpg do txt..Chci totiž text upravovat ve Wordu,ale s koncovkou jpg to nejde..Děkuji

Předmět Autor Datum
Můžu se zeptat, co tam chceš upravovat za text? jpg je formát pro obrázek. Jestli máš text v jpg, po…
MaSo 26.02.2008 12:56
MaSo
Windows, Linux - například. :-D
touchwood 26.02.2008 12:57
touchwood
Potřebuješ OCR software. Nejlepší je ABBYY FineReader finereaderpro eden z nejznámějších a nejkvali…
Kráťa 26.02.2008 12:59
Kráťa
Nemušíš instalovat software, na to stačí online služba: ascii.php EDIT: pardon, přehlídl jsem, že v…
Ynd0r 26.02.2008 12:59
Ynd0r
Já už se u notifikačního e-mailu lekl, že OCR někdo poskytuje on-line, tak sem rychle běžím a on je…
Kráťa 26.02.2008 13:10
Kráťa
www.free-ocr.com
Meteleskumbleskum 11.05.2013 11:57
Meteleskumbleskum
Díky 586x. Převedlo to bezchybně i veškerou diakritiku. To nemá chybu! [http://pc.poradna.net/file/…
Kráťa 11.05.2013 12:30
Kráťa
A dost obstojně to vzalo i útok internetem [http://www.q3.cz/images/550_utok_internetem_tn.jpg ] /…
Kráťa 11.05.2013 12:39
Kráťa
Tak to je ale dokonalý. A o té stránce se hodí vědět, převádí moc dobře.
Potkan007 11.05.2013 12:44
Potkan007
::)
mif 26.02.2008 13:03
mif
haf,haf - nevim jak jsi k tomu souboru přišel/a a jestli jsi to mohl/a ovlivnit, ale pokud to jde, s…
AZOR 26.02.2008 13:43
AZOR
přitakal bych. pokud to skenuju a dopředu počítám, že budu potřebovat zpět vyrazit psaná data, nikdy…
lední brtník 27.02.2008 00:01
lední brtník
Kráťa - musím říci, že v poslední době zapracovala i Recognita a nejlepší software založený na tomto…
Redmarx N 26.02.2008 23:07
Redmarx N
cus chci nejakej program co mi prevede jpeg z PC do wordu... potrebuju si oskenovany text upravit a…
JPEG do DOC 12.12.2011 19:11
JPEG do DOC
Třeba ABBYY Fine Reader. Ale formát JPG není zrovna ideální pro rozpoznávání textu.
host 12.12.2011 19:16
host
Proč není JPG ok pro rozpoznávání textu? Komprese? Nebo v čom je problém?
Redsnake 11.05.2013 13:15
Redsnake
Neřekl bych, že jpg je nevhodný, ale faktem je, že se jedná o jeden z nejméně vhodných formátů. Dův…
Flash_Gordon 11.05.2013 13:22
Flash_Gordon
Takže abych tomu rozuměl, OCR má u jpg problém rozpoznat kontury textu a potom logicky má problém i…
Redsnake 11.05.2013 13:56
Redsnake
OCR zna dalo by se rici jen dve barvy, cernou a bilou. Pokud ti z principu JPG diky ztratove kompres…
RedMaX 11.05.2013 15:13
RedMaX
Ano tak to bylo mysleno. Jpg nielen rozmazava ale dokonca vytvara artefakty v okoli pismen, viz napr…
MM.. 11.05.2013 15:20
MM..
ok, už to chňápu:) Díky, zas jsem o něco chytřejší. To OCR online je super, asi využiju. poslední
Redsnake 11.05.2013 15:31
Redsnake
Já používám ABBYY a jsem nadmíru spokojen...
lukinpark 12.12.2011 19:26
lukinpark
Ked uz sme u tych OCR tak treba spomenut i open source tesseract-ocr.
poihu 12.12.2011 19:51
poihu

Potřebuješ OCR software. Nejlepší je ABBYY FineReader
finereaderpro

eden z nejznámějších a nejkvalitnějších OCR nástrojů pro převod naskenovaného psaného nebo ofoceného textu s velmi nízkým procentem chyb do elektronické podoby. Rozpoznat lze dokonce i text vyfocený digitálním fotoaparátem. Podporuje všechny scannery s TWAIN rozhraním. Umožňuje věrný převod naskenované stránky do editovatelného textu včetně...

A dost obstojně to vzalo i útok internetem

[http://www.q3.cz/images/550_utok_internetem_tn.jpg ]

/I
J [NF-'O
UPC Česká republika, a.s. N C"f-`--
ı>.O.Bøx 53 Qg ,
Pnhn-żšżkøv ž. E311..
130 Il Í
ˇ 13 -63- 2089
KI2Y=2I0f W-< “ “
Dfllflb
Klientské centrum
V Ostravě dne 10.3.2009
Stížnost
Já, Kızyszınf ulh hyáıhn nn vnvšnvsızći v oxznvê - Hnıváınáøh, zz ıhnıø nhøi øznáxniı,
že má sousedka Miroslava Visková se dopouští trestné činnosti, a to tim, že má intemet od
Telefoniky 02 a vysílá elektrické vlny přes moji zeď a ty mi působí vážné zdravotní
problémy. Sousedka těmito elektrickými vlnami narušuje mé zdravi, působí to špatné věci, je
to jako laser a není možno se před tím schovat. Výše jmenovaná má přilehlý byt k mému bytu
a pouští mi el. zařízení ( internet), který mi vadi, jde mi to do hlavy, do čela, obličeje, do
kolen a do zad. A já tím trpim nespavostí a nemohu v klidu spát a vůbec ani bydlet. Seděl
jsem vkuchyni na židli, střelilo mi do zad,jako by mě střelil kulkou a ten denjsem musel
okamžitě opustit byt, protože jsem se bál o mé zdraví. Za hodinu jsem se vrátil do bytu a věšel
jsem prádlo a stál v koupelně na vaně a ona mi pustila paprsky do srdce a zůstalo mi špatně.
Málem jsem se vyvrátil, vybulil jsem se a spadl. Jednou jsem žehli prádlo a pustila mi do
obličeje, kdy jsem pocítil velké pálení obličeje a začala mě okamžitě nesnesitelně bolet hlava.
Proto jsem se rozhodl opustit byt jelikož jsem už dál tu bolest nesnesl. Stal se ze mě
bezdomovec.
Taky mi pustila do a to už jsem nemohl ani chodit. Píše se, že internet škodí zdravi, člověku
ubližuje,ale ve skutečnosti internet zabíjí.
Začal jsem v celé této věci podnikat kroky k nápravě a sepsal jsem petici, kde mi lidé dali svůj
podpis a to je také přílohou k mé stížnosti. Byl jsem si stěžovat na Magistrátu města Ostravy,
kde jsem řekl, že vysílají do oči, hlavy prostě do celeho lidského organismu po celé Ostravě.
Tam mi řekli, že sejedná o trestný čin omezování svobody s následkem ubližování na zdraví.
Dozvěděl jsem se, že ty vlny v intemetu působí nějaká kostka, ale vy víte nejlépe co to působí
a ničí lidské zdraví celoplošné, a pokud S tím nic neuděláte tak Vás bude trestně stíhat Policie
ČR, protože mi to řekli.
Doufám, že mé žádosti vyhovíte, kladně to vyıˇˇešíte, protože to působí na každého člověka
A taky byl u mě můj známý, který mi pomáhal sekat dřevo, a taky byl zasażen vlnou od
sousedky. A měl velké bolesti hlavy a začal se škrabat po celé hlavě.
A taky chci říct, že nastala internetová válka. Bydlel jsem na ubytovně Nl-I v Ostravě -
Zábřehu a slyšel jsem jak barák proti baráku vysílá vlny z internetu. A taky jsem zažil, když
jsem bydlel na ubytovně JARENA a taky byly probly v každém bytě kde hrály. Já mám
revma a slyším prostě všechno, a kam cestou jdu, nebo jedu autobuse, trolejbusem všude i na
zastávkách MHD. Revma má 30% obyvatelstva a trpí jako já. Soused mi pustil na cestu
Z internetu až mi to bralo dech. Jednou jsem byl na nádraží a pustil mi taky až jsem nemohl
dýchat a jak jsem vešel do haly, tak jsem až chytil dech. Zkrátka hrají všude!!!. internetu
přibylo jako hřibů po dešti.
Udělejte S tím něco na celém Ostravsku a pokud to neuděláte hned, protože to nejde, tak to
alespoň vzkažte po intemetu nebo napište, aby nevysílalì vlny na lidi.
S pozdravem Kızysztof Vi-‹

přitakal bych.
pokud to skenuju a dopředu počítám, že budu potřebovat zpět vyrazit psaná data, nikdy nepoužiju "fotoformát" .jpg se ztrátovou kompresí, ale dám přednost obrázku s případnou bezeztrátovou kompresí (.gif, .png), ve stupních šedi, 16-64 "barev", cca 100dpi pro snímání.
protože ocr softy často pochází z anglo-us a mají nejlepší účinnost na omezenější znakovou sadu bez nabodeníčků, háčků, kroužků atd., snažil bych se jim lehce vyjít vstříc. jak rozumným bezztrátovým formátem image předlohy, tak zároveň slušným kontrastem (především volba zaostření pro zvýraznění kontur, dále gamma a kontrast, a je rozumné omezit barevnou hloubku textu na max.64-128 barev)

Kráťa - musím říci, že v poslední době zapracovala i Recognita a nejlepší software založený na tomto enginu dosahuje stejné přesnosti rozpoznání jako Finereader - Omnipage 16.

AZOR - no o BMP bych se az zase tak nezminoval. Kdyz tak RAW nebo TIFF. Jinak ale neni problem ani s JPEG, ale musi mit nalezite parametry, komprese na minimalně 85% nekomprimovaneho.

JPG je bitmapový obrázek, tudíž když to otevřeš a je tam text nebo třeba nějaká krásná děva, tak pro ten soft je to prostě vždycky obrázek. Úprava teda v bitmapovém editoru, ale samozřejmě nikoliv, že by si psal znaky na klávesnici, ale kreslíš jiné obrázky, třeba v podobě znaků.
Druhá možnost je to co ti radí Kráťa, použít OCR software a převést bitmapu na znaky. To pracuje tak, že když máš v tom JPG nakreslené písmeno K, tak ono to srovnává s nějakým vzorem a zjistí, že se to podobá K, tak do textového editoru napíše K. Z toho je jasný, že téměř nikdy nedosáhneš stoprocentního přepsání, občas to nějaký znak nepozná. U slušného kontrastního obrázku se dosahuje správnosti nad 95%. Aby si ji dosáhl, musíš splnit nějaké podmínky, např. jak tu bylo už zmíněno, obrázek nesmí být příliš komprimovaný nebo např. by měl mít rozlišení 300 dpi a vyšší - podle velikosti písmen.

Neřekl bych, že jpg je nevhodný, ale faktem je, že se jedná o jeden z nejméně vhodných formátů.

Důvodem je způsob, jakým pracuje jpg - ukládá podobné barvy do oblasti pod stejnou barvou a toto není pro detekční analýzu příhodné.

Nejlepší formát je BMP nebo PNG (pomiňme teď vlastní velikosti).
Zlepšit vlastnosti jpg pro textovou analýzu je možné zvětšením rozlišení a snížením komprese.

Ano tak to bylo mysleno. Jpg nielen rozmazava ale dokonca vytvara artefakty v okoli pismen, viz napr. http://upload.wikimedia.org/wikipedia/commons/6/6d /Sego_lily_cm-150.jpg
Je to kvoli tomu ze jpeg kompresia vzdy rozdeli obrazok na male stvorce a pre kazdy stvorec sa snazi najst vhodny jpeg "obrazec". Pre pismena logicky neexistuju presne obrazce ale len take vselijake s artefaktami. Cim vyssia kompresia je nastavena tym vacsie stvorceky a tym silnejsie artefakty.
P.S. a neni to kvoli podobnym farbam, artefakty vzniknu aj pri kompresii ciernobieleho obrazca (ktory mal originalne len farby 0,1)

Zpět do poradny Odpovědět na původní otázku Nahoru