převod jpg do txt - poradna.net

Hledám nějaký software,který mi převede dokument s koncovkou jpg do txt..Chci totiž text upravovat ve Wordu,ale s koncovkou jpg to nejde..Děkuji

Předmět	Autor	Datum
Můžu se zeptat, co tam chceš upravovat za text? jpg je formát pro obrázek. Jestli máš text v jpg, po… MaSo 26.02.2008 12:56	MaSo	26.02.2008 12:56
Windows, Linux - například. :-D touchwood 26.02.2008 12:57	touchwood	26.02.2008 12:57
Potřebuješ OCR software. Nejlepší je ABBYY FineReader finereaderpro eden z nejznámějších a nejkvali… Kráťa 26.02.2008 12:59	Kráťa	26.02.2008 12:59
Nemušíš instalovat software, na to stačí online služba: ascii.php EDIT: pardon, přehlídl jsem, že v… Ynd0r 26.02.2008 12:59	Ynd0r	26.02.2008 12:59
Já už se u notifikačního e-mailu lekl, že OCR někdo poskytuje on-line, tak sem rychle běžím a on je… Kráťa 26.02.2008 13:10	Kráťa	26.02.2008 13:10
www.free-ocr.com Meteleskumbleskum 11.05.2013 11:57	Meteleskumbleskum	11.05.2013 11:57
Díky 586x. Převedlo to bezchybně i veškerou diakritiku. To nemá chybu! [http://pc.poradna.net/file/… Kráťa 11.05.2013 12:30	Kráťa	11.05.2013 12:30
A dost obstojně to vzalo i útok internetem [http://www.q3.cz/images/550_utok_internetem_tn.jpg ] /… Kráťa 11.05.2013 12:39	Kráťa	11.05.2013 12:39
Tak to je ale dokonalý. A o té stránce se hodí vědět, převádí moc dobře. Potkan007 11.05.2013 12:44	Potkan007	11.05.2013 12:44
::) mif 26.02.2008 13:03	mif	26.02.2008 13:03
haf,haf - nevim jak jsi k tomu souboru přišel/a a jestli jsi to mohl/a ovlivnit, ale pokud to jde, s… AZOR 26.02.2008 13:43	AZOR	26.02.2008 13:43
přitakal bych. pokud to skenuju a dopředu počítám, že budu potřebovat zpět vyrazit psaná data, nikdy… lední brtník 27.02.2008 00:01	lední brtník	27.02.2008 00:01
Kráťa - musím říci, že v poslední době zapracovala i Recognita a nejlepší software založený na tomto… Redmarx N 26.02.2008 23:07	Redmarx N	26.02.2008 23:07
cus chci nejakej program co mi prevede jpeg z PC do wordu... potrebuju si oskenovany text upravit a… JPEG do DOC 12.12.2011 19:11	JPEG do DOC	12.12.2011 19:11
Třeba ABBYY Fine Reader. Ale formát JPG není zrovna ideální pro rozpoznávání textu. host 12.12.2011 19:16	host	12.12.2011 19:16
Proč není JPG ok pro rozpoznávání textu? Komprese? Nebo v čom je problém? Redsnake 11.05.2013 13:15	Redsnake	11.05.2013 13:15
Neřekl bych, že jpg je nevhodný, ale faktem je, že se jedná o jeden z nejméně vhodných formátů. Dův… Flash_Gordon 11.05.2013 13:22	Flash_Gordon	11.05.2013 13:22
Takže abych tomu rozuměl, OCR má u jpg problém rozpoznat kontury textu a potom logicky má problém i… Redsnake 11.05.2013 13:56	Redsnake	11.05.2013 13:56
OCR zna dalo by se rici jen dve barvy, cernou a bilou. Pokud ti z principu JPG diky ztratove kompres… RedMaX 11.05.2013 15:13	RedMaX	11.05.2013 15:13
Ano tak to bylo mysleno. Jpg nielen rozmazava ale dokonca vytvara artefakty v okoli pismen, viz napr… MM.. 11.05.2013 15:20	MM..	11.05.2013 15:20
ok, už to chňápu:) Díky, zas jsem o něco chytřejší. To OCR online je super, asi využiju. poslední Redsnake 11.05.2013 15:31	Redsnake	11.05.2013 15:31
Já používám ABBYY a jsem nadmíru spokojen... lukinpark 12.12.2011 19:26	lukinpark	12.12.2011 19:26
Ked uz sme u tych OCR tak treba spomenut i open source tesseract-ocr. poihu 12.12.2011 19:51	poihu	12.12.2011 19:51

Můžu se zeptat, co tam chceš upravovat za text? jpg je formát pro obrázek. Jestli máš text v jpg, použij na jeho úpravu nějaký grafický editor, třeba PhotoFiltre.

Windows, Linux - například.

Potřebuješ OCR software. Nejlepší je ABBYY FineReader
finereaderpro

eden z nejznámějších a nejkvalitnějších OCR nástrojů pro převod naskenovaného psaného nebo ofoceného textu s velmi nízkým procentem chyb do elektronické podoby. Rozpoznat lze dokonce i text vyfocený digitálním fotoaparátem. Podporuje všechny scannery s TWAIN rozhraním. Umožňuje věrný převod naskenované stránky do editovatelného textu včetně...

Nemušíš instalovat software, na to stačí online služba:
ascii.php

EDIT: pardon, přehlídl jsem, že v tom jpg má být text. Na to potřebuješ OCR (viz Kráťa).

Já už se u notifikačního e-mailu lekl, že OCR někdo poskytuje on-line, tak sem rychle běžím a on je tu edit://...
Pro tazatelku. Pokud jde jen o nějaký nápis (ne třeba oskenovaný dokument), je na to lepší, co píšou kolegové nade mnou (editor na obrázky).

www.free-ocr.com

Díky 586x. Převedlo to bezchybně i veškerou diakritiku. To nemá chybu!

[http://pc.poradna.net/file/view/13966-prilis-zluto ucky-kun-gif]

prilis-zlutoucky-kun.gif 10.42 KiB

A dost obstojně to vzalo i útok internetem

/I
J [NF-'O
UPC Česká republika, a.s. N C"f-`--
ı>.O.Bøx 53 Qg ,
Pnhn-żšżkøv ž. E311..
130 Il Í
ˇ 13 -63- 2089
KI2Y=2I0f W-< “ “
Dﬂlﬂb
Klientské centrum
V Ostravě dne 10.3.2009
Stížnost
Já, Kızyszınf ulh hyáıhn nn vnvšnvsızći v oxznvê - Hnıváınáøh, zz ıhnıø nhøi øznáxniı,
že má sousedka Miroslava Visková se dopouští trestné činnosti, a to tim, že má intemet od
Telefoniky 02 a vysílá elektrické vlny přes moji zeď a ty mi působí vážné zdravotní
problémy. Sousedka těmito elektrickými vlnami narušuje mé zdravi, působí to špatné věci, je
to jako laser a není možno se před tím schovat. Výše jmenovaná má přilehlý byt k mému bytu
a pouští mi el. zařízení ( internet), který mi vadi, jde mi to do hlavy, do čela, obličeje, do
kolen a do zad. A já tím trpim nespavostí a nemohu v klidu spát a vůbec ani bydlet. Seděl
jsem vkuchyni na židli, střelilo mi do zad,jako by mě střelil kulkou a ten denjsem musel
okamžitě opustit byt, protože jsem se bál o mé zdraví. Za hodinu jsem se vrátil do bytu a věšel
jsem prádlo a stál v koupelně na vaně a ona mi pustila paprsky do srdce a zůstalo mi špatně.
Málem jsem se vyvrátil, vybulil jsem se a spadl. Jednou jsem žehli prádlo a pustila mi do
obličeje, kdy jsem pocítil velké pálení obličeje a začala mě okamžitě nesnesitelně bolet hlava.
Proto jsem se rozhodl opustit byt jelikož jsem už dál tu bolest nesnesl. Stal se ze mě
bezdomovec.
Taky mi pustila do a to už jsem nemohl ani chodit. Píše se, že internet škodí zdravi, člověku
ubližuje,ale ve skutečnosti internet zabíjí.
Začal jsem v celé této věci podnikat kroky k nápravě a sepsal jsem petici, kde mi lidé dali svůj
podpis a to je také přílohou k mé stížnosti. Byl jsem si stěžovat na Magistrátu města Ostravy,
kde jsem řekl, že vysílají do oči, hlavy prostě do celeho lidského organismu po celé Ostravě.
Tam mi řekli, že sejedná o trestný čin omezování svobody s následkem ubližování na zdraví.
Dozvěděl jsem se, že ty vlny v intemetu působí nějaká kostka, ale vy víte nejlépe co to působí
a ničí lidské zdraví celoplošné, a pokud S tím nic neuděláte tak Vás bude trestně stíhat Policie
ČR, protože mi to řekli.
Doufám, že mé žádosti vyhovíte, kladně to vyıˇˇešíte, protože to působí na každého člověka
A taky byl u mě můj známý, který mi pomáhal sekat dřevo, a taky byl zasażen vlnou od
sousedky. A měl velké bolesti hlavy a začal se škrabat po celé hlavě.
A taky chci říct, že nastala internetová válka. Bydlel jsem na ubytovně Nl-I v Ostravě -
Zábřehu a slyšel jsem jak barák proti baráku vysílá vlny z internetu. A taky jsem zažil, když
jsem bydlel na ubytovně JARENA a taky byly probly v každém bytě kde hrály. Já mám
revma a slyším prostě všechno, a kam cestou jdu, nebo jedu autobuse, trolejbusem všude i na
zastávkách MHD. Revma má 30% obyvatelstva a trpí jako já. Soused mi pustil na cestu
Z internetu až mi to bralo dech. Jednou jsem byl na nádraží a pustil mi taky až jsem nemohl
dýchat a jak jsem vešel do haly, tak jsem až chytil dech. Zkrátka hrají všude!!!. internetu
přibylo jako hřibů po dešti.
Udělejte S tím něco na celém Ostravsku a pokud to neuděláte hned, protože to nejde, tak to
alespoň vzkažte po intemetu nebo napište, aby nevysílalì vlny na lidi.
S pozdravem Kızysztof Vi-‹

Tak to je ale dokonalý.
A o té stránce se hodí vědět, převádí moc dobře.

haf,haf - nevim jak jsi k tomu souboru přišel/a a jestli jsi to mohl/a ovlivnit, ale pokud to jde, snaž se použít bezztrátovou kompresy pro takovéto obrázky z textem - tedy BMP ci RAW

přitakal bych.
pokud to skenuju a dopředu počítám, že budu potřebovat zpět vyrazit psaná data, nikdy nepoužiju "fotoformát" .jpg se ztrátovou kompresí, ale dám přednost obrázku s případnou bezeztrátovou kompresí (.gif, .png), ve stupních šedi, 16-64 "barev", cca 100dpi pro snímání.
protože ocr softy často pochází z anglo-us a mají nejlepší účinnost na omezenější znakovou sadu bez nabodeníčků, háčků, kroužků atd., snažil bych se jim lehce vyjít vstříc. jak rozumným bezztrátovým formátem image předlohy, tak zároveň slušným kontrastem (především volba zaostření pro zvýraznění kontur, dále gamma a kontrast, a je rozumné omezit barevnou hloubku textu na max.64-128 barev)

Kráťa - musím říci, že v poslední době zapracovala i Recognita a nejlepší software založený na tomto enginu dosahuje stejné přesnosti rozpoznání jako Finereader - Omnipage 16.

AZOR - no o BMP bych se az zase tak nezminoval. Kdyz tak RAW nebo TIFF. Jinak ale neni problem ani s JPEG, ale musi mit nalezite parametry, komprese na minimalně 85% nekomprimovaneho.

JPG je bitmapový obrázek, tudíž když to otevřeš a je tam text nebo třeba nějaká krásná děva, tak pro ten soft je to prostě vždycky obrázek. Úprava teda v bitmapovém editoru, ale samozřejmě nikoliv, že by si psal znaky na klávesnici, ale kreslíš jiné obrázky, třeba v podobě znaků.
Druhá možnost je to co ti radí Kráťa, použít OCR software a převést bitmapu na znaky. To pracuje tak, že když máš v tom JPG nakreslené písmeno K, tak ono to srovnává s nějakým vzorem a zjistí, že se to podobá K, tak do textového editoru napíše K. Z toho je jasný, že téměř nikdy nedosáhneš stoprocentního přepsání, občas to nějaký znak nepozná. U slušného kontrastního obrázku se dosahuje správnosti nad 95%. Aby si ji dosáhl, musíš splnit nějaké podmínky, např. jak tu bylo už zmíněno, obrázek nesmí být příliš komprimovaný nebo např. by měl mít rozlišení 300 dpi a vyšší - podle velikosti písmen.

cus chci nejakej program co mi prevede jpeg z PC do wordu... potrebuju si oskenovany text upravit a ty online verze mi nefungujou ci co.... dik...

Třeba ABBYY Fine Reader. Ale formát JPG není zrovna ideální pro rozpoznávání textu.

Proč není JPG ok pro rozpoznávání textu? Komprese? Nebo v čom je problém?

Neřekl bych, že jpg je nevhodný, ale faktem je, že se jedná o jeden z nejméně vhodných formátů.

Důvodem je způsob, jakým pracuje jpg - ukládá podobné barvy do oblasti pod stejnou barvou a toto není pro detekční analýzu příhodné.

Nejlepší formát je BMP nebo PNG (pomiňme teď vlastní velikosti).
Zlepšit vlastnosti jpg pro textovou analýzu je možné zvětšením rozlišení a snížením komprese.

Takže abych tomu rozuměl, OCR má u jpg problém rozpoznat kontury textu a potom logicky má problém i s rozpoznáváním textu? Tak to bylo myšleno?

OCR zna dalo by se rici jen dve barvy, cernou a bilou. Pokud ti z principu JPG diky ztratove kompresi "rozmazne okraje pisma na sedou", bude dosahovat o neco horsich vysledku nez format s neztratovou kompresi, ktery nic nerozmazne.

Ano tak to bylo mysleno. Jpg nielen rozmazava ale dokonca vytvara artefakty v okoli pismen, viz napr. http://upload.wikimedia.org/wikipedia/commons/6/6d /Sego_lily_cm-150.jpg
Je to kvoli tomu ze jpeg kompresia vzdy rozdeli obrazok na male stvorce a pre kazdy stvorec sa snazi najst vhodny jpeg "obrazec". Pre pismena logicky neexistuju presne obrazce ale len take vselijake s artefaktami. Cim vyssia kompresia je nastavena tym vacsie stvorceky a tym silnejsie artefakty.
P.S. a neni to kvoli podobnym farbam, artefakty vzniknu aj pri kompresii ciernobieleho obrazca (ktory mal originalne len farby 0,1)

ok, už to chňápu:)
Díky, zas jsem o něco chytřejší.
To OCR online je super, asi využiju.

Já používám ABBYY a jsem nadmíru spokojen...

Ked uz sme u tych OCR tak treba spomenut i open source tesseract-ocr.

Zpět do poradny Odpovědět na původní otázku Nahoru