Předmět Autor Datum
seznam.cz a google.com :-) Mam na PDA Win Mobile 6.5 a taky teda pripojeni na net za pausal atohle…
RedMaX 25.11.2010 20:02
RedMaX
skus translate.google.com ale tie prekladace su vsetky len priblizne, informacne (a ked clovek cita…
MM.. 25.11.2010 22:34
MM..
lenost programatoru :-D nevim, ze uz nekdo nemohl napsat prekladac, kterej nebude umet jen otrocky s…
RedMaX 25.11.2010 23:04
RedMaX
To neni o lenosti ale o tom ze by ten program musel ten text chapat. Lebo od toho zavisi volba sprav…
MM.. 25.11.2010 23:22
MM..
naucit pocitace chapat text je zatim jeste hudba vzdalene budoucnosti :) K tomu, aby chapal text, se…
merlouska 26.11.2010 01:44
merlouska
pochopit slang neni problem pomocou fuzzy logiky. Ani velky slovnik neni problem, milion slov dnesne…
MM.. 26.11.2010 02:16
MM..
V tom podstatném souhlasím s MM a merlouskou. Jenom dodávám : dokonalý překladač NIKDY nebude existo…
hynajs 26.11.2010 11:22
hynajs
Nevím, jak pro němčinu, ale pro angličtinu je super javový KODi slovník.
vlk56 26.11.2010 09:20
vlk56
Představy o automatických překladačích jsou trochu zkreslené. To, co nabízí Google Translate, není…
wasek 26.11.2010 12:56
wasek
1% jakých textů ? Z čeho lze takové číslo vypočítat ? Ano, slov v daném jazyce je konečně mnoho, kon…
hynajs 26.11.2010 13:19
hynajs
no jo, slysel jsem, ze eng - spa, eng - ger, atd. ma mnohem lepsi vysledky nez preklady do cestiny.…
Redmarx N 26.11.2010 13:27
Redmarx N
Neni to tak jednoduche zistit ten kontext. Az by si to zacal programovat tak by si to zistil :)
MM.. 26.11.2010 14:35
MM..
tj, kdyby to bylo tak jednoduche, tak uz davno dokonale prekladace mame :)
merlouska 26.11.2010 15:10
merlouska
Zjistit kontext určitě není jednoduché, ale vzhledem k výsledkům, kterých dosahuje Google Translate…
wasek 26.11.2010 15:16
wasek
Předpokládejme, že nějaký text dáme deseti dobrým překladatelům. Vznikne deset dobrých překladů - al…
hynajs 26.11.2010 18:08
hynajs
dle me ale neni teoretickej duvod, aby se robot (program) nemohl chovat jako clovek. Jiste vypocetni…
RedMaX 26.11.2010 20:10
RedMaX
pretoze neni v ludskych moznostiach naprogramovat dokonale cely svet (nikto na to nema ani chut ani…
MM.. 26.11.2010 20:17
MM..
dle me ale neni teoretickej duvod, aby se robot (program) nemohl chovat jako clovek Bez teorie : p…
hynajs 26.11.2010 20:29
hynajs
s tim MS to je fakt. :-D:-) --- jo pral, me by slo algoritmizovat lehce a mohl by za me chodit do…
RedMaX 26.11.2010 21:11
RedMaX
Chovanie ludi niekedy ide algoritmizovat, napr. na vstup das "budu drahsie cigarety" a na vystupe ma…
MM.. 26.11.2010 21:12
MM..
Malé porovnání češtiny a angličtiny [http://pc.poradna.net/file/view/4535-cz-en-porovna ni-gif] poslední
Kráťa 28.11.2010 23:39
Kráťa

skus translate.google.com ale tie prekladace su vsetky len priblizne, informacne (a ked clovek cita co z toho leze tak sa puci od smiechu). Ked to chces vediet poriadne tak sa nauc nemecky a chod na aspon 3roky zit do D, potom budes mat jediny pouzitelny automaticky prekladac na svete. Ten co je v hlave :) Ono tam totiz nejde o slovicka ale o vazby a zauzivane veci (frazy atd). Lebo napr. to co je u nas jednym slovom maju v D viac slov a kazde znamena nieco ine (a ty nechapes preco, ked u nas na to vsetko je jedno slovo) a ked mas v slovniku u jedneho nasho slova 5 nemeckych slov, alebo naopak, tak nebudes vediet ktore sa tam ma spravne pouzit atd. Hlavne u nemciny je to hodne vyrazne toto. ..alebo napr. v nemcine davanie predpony na koniec vety v otazke (alebo v rozkazovacom sposobe), tak to ti so slovnikom jaksi neklapne :)

lenost programatoru :-D nevim, ze uz nekdo nemohl napsat prekladac, kterej nebude umet jen otrocky slova, ale bude pouzivat i fraze a skladani slov. 3-[ (Pravda asi by to mylo hodne radek kodu a vetveni, ale aspon by bylo jak prakticky vyuzit CUDA a Fermi. ;-)

To neni o lenosti ale o tom ze by ten program musel ten text chapat. Lebo od toho zavisi volba spravneho slova. Na tom to pada uz desatrocia. Nemozes programu vysvetlit cely svet, a ze co to je Lenin a preco za nim bude nasledovat spravidla neslusne slovo apod. :-D (a keby to ten PC konecne pochopil tak by asi urobil velku francuzku BSOD revoluciu :-D)

P.S. ale to skladanie slov prekladace vedia brat do uvahy, teraz som testol translate.google.com a priblizne to vedel (sice nesedelo tykanie-vykanie ale tu predponu vedel spravne spracovat)
Len s obycajnym slovnikom to musi clovek lepit sam tu predponu

naucit pocitace chapat text je zatim jeste hudba vzdalene budoucnosti :) K tomu, aby chapal text, se musi naucit gramatiku daneho jazyka, navic mu musi byt predlozena tak, aby rozumel. A vem si, jak dlouho ses gramatiku ucil ty :-) A to je lidsky mozek podstatne vykonnejsi nez pocitac ;-)
Vem si ten klasickej vtipnej priklad - Tvoje oči září = Your eyes september. Jak on ma poznat, jestli tim homonymem "září" se mysli mesic v roce nebo treti osoba od slovesa zarit? K tomu se potrebuje naucit jednak vyznamy tech slov a jednak kontexty. A navic musi byt ten cesky slovnik spravne provazany s tim druhym (napr. anglickym).
No a zrovna cestina je navic (nejen) na jakekoli pocitacove zpracovani docela desnej jazyk :-) Viz tahle citace:

Slovník 50 000 nejfrekventovanějších slov pokrývá v češtině 90,5 %, v angličtině dokonce 99.3 %.
Slovník 300 000 nejfrekventovanějších slov pokrývá zhruba 97.6 % češtiny. U anglického jazyka je to dokonce 100 %.
Pro pokrytí téměř 100 % českého textu je potřeba slovník 1 500 000 nejfrekventovanějších slov.
Tuto velikost slovníku nutného pro pokrytí českého textu způsobuje obrovské množství ohebných tvarů českých slov. Potencionálně lze od jednoho slovesa odvodit až 300 tvarů, pro podstatné jméno 20 tvarů a pro přídavné jméno 200 tvarů.

A o tom to je. Tohle je ten hlavni problem. Jednodussi a rozsirenejsi jazyky uz jsou v pocitacovem zpracovani mnohem dal nez cestina, ktera a) je slozita, b) se ji venuje malo lidi, protoze ji taky malo lidi mluvi (ve srovnani napr. s anglictinou ci nemcinou a podobnymi jazyky).
Tohle uz neni ani tak o programovani (a uz vubec ne o lenosti programatoru :-D), jako spis o tom, aby lingviste ve spolupraci s informatiky dali dohromady nejaka pravidla pro cestinu tak, aby to pochopil i ten trouba, co umi jen jednicky a nuly.
A to jeste mluvim o spisovnem jazyku. Nespisovny, hovorovy, vulgarni jazyk.. to uz snad ani nejde. Nedokazu si predstavit pocitac, ktery by pochopil vetu typu: "hej vole, moh bys prinyst mliko a votevrit vokno? dikes" :D

pochopit slang neni problem pomocou fuzzy logiky. Ani velky slovnik neni problem, milion slov dnesne PC zvlada lavou zadnou. Gramatika je pre programatora uplna brnkacka, za 3dni to musi mat hotove.
Problem je len ten kontext, napr. to tvoje oči září, ale to je este dost jednoduche to zvlada aj translate.google.com spravne (ptz. vie ze za "tvoje oci" musi nasledovat sloveso a september neni sloveso). Ale su pripady kedy to spravne slovo zvolit nevie. Napr. mam to na haku ti translate.google.com prelozi ako I have it on the hook :)

P.S. typicke priklady vid napr. oddych.sk :-)
P.S. a toto je skvely priklad preco vobec nejde urobit rozpoznavanie reci
watch
:-D

V tom podstatném souhlasím s MM a merlouskou.
Jenom dodávám : dokonalý překladač NIKDY nebude existovat, pokud zůstanou jazyky jazyky a algoritmy algoritmy.
Jsem v práci, narychlo dva příklady :

- vidy ( koupit x nakoupit ) v češtině ( i slovenštině ) lze sice snad dobře algoritmicky definovat, ale jejich reálné používání je nepravidelné a jejich definici neodpovídá ( jdu nakoupit)
- překladač NIKDY nepřeloží poezii Dylana Thomase ( dosaďte si libovolného básníka ) do češtiny (slovenštiny) tak, aby zůstala poezií

Co je a není poezií NELZE (naštěstí) algoritmem vyjádřit, stejně jako se dívka, která se odmítne se mnou líbat, nerozhodla algoritmicky. Algoritmus bych lehce změnil, takhle se musím více snažit s nejistým výsledkem :.(

Představy o automatických překladačích jsou trochu zkreslené.

To, co nabízí Google Translate, není strojový překlad. Funguje to na trošku jiném principu. Překlady mezi jednotlivými jazykovými páry jsou prováděné na základě databáze přeložených textů, které provedla skutečná lidská bytost. Pro jazykové páry, jako jsou angličtina-francouzština, angličtina-španělština apod. mají takových textů k dispozici nepředstavitelná kvanta, a díky tomu se výsledná kvalita překladu víceméně blíží správnému překladu. Samozřejmě záleží také na vytvoření správného algoritmu (slovanské jazyky jsou např. hodně ohebné), ale to není zas takový problém.

U Google Translate záleží hlavně na kvalitě zdrojové databáze a na jejím rozsahu. Tipoval bych, že pro jazykový pár angličtina-čeština je k dispozici tak 1 % textů, co jsou k dispozici třeba pro španěltina-angličtina. Pro němčina-čeština to bude možná ještě o trošku horší než pro angličtina-čeština.

1% jakých textů ? Z čeho lze takové číslo vypočítat ?
Ano, slov v daném jazyce je konečně mnoho, konečných variací z nich vytvořených do určité délky tedy taky.
Teoreticky může taky nějaký nadgramatik rozhodnout, zda daná variace do databáze patří či nikoli.
Už tady (mimo evidentních gramatických nesmyslů nebo smyslů) záleží na citu jednoho konkrétního jedince v dané chvíli.
Ale co je horší : určité variaci z jednoho jazyka může odpovídat více variací z jiného jazyka.
Navíc jednou odpovídat může, jednou nikoli. Překládat Ježíšovo kázání na hoře je asi něco jiného než fotbalové zpravodajství.
Chceme přiřazení po stroji : to není a nebude algoritmicky možné.

no jo, slysel jsem, ze eng - spa, eng - ger, atd. ma mnohem lepsi vysledky nez preklady do cestiny. :-/

ja teda nevidim duvod proc by to naprogramovat neslo, vzdyt jde jen o preklad, nikoli myslenku, takze ano, pokud reknu jedno slovo, ktere ma v anglictine vic vyznamu, tak se prekladac trefit nemuze, ale treba z nekolika vet by uhodnout spravne mel, proste v predchozi vete pouzit ta a ta slova, to znamena, ze vyznam dalsiho slova bude v kontextu s predchozimi. ;-)

Zjistit kontext určitě není jednoduché, ale vzhledem k výsledkům, kterých dosahuje Google Translate např. u překladu z němčiny do angličtiny, si myslím, že to není nemožné. Mám s tím zkušenost - německé stránky si překládám do angličtiny a není problém tomu rozumět.

Taky je u Google Translate zajímavé, že to má lepší výsledky ve směru čeština-angličtina než obráceně – asi mají v tomto směru víc materiálu než obráceně (oni totiž podle všeho používají získané přeložené texty pouze jednosměrně, což je správné).

Pokud mají pro nějakou kombinaci velmi málo materiálu, tak to přesměrují přes angličtinu. Když se třeba překládá z češtiny do korejštiny, tak to přeloží nejdřív do angličtiny a pak až do korejštiny, takže tomu odpovídají výsledky.

Předpokládejme, že nějaký text dáme deseti dobrým překladatelům. Vznikne deset dobrých překladů - ale pravděpodobnost, že by dva byly shodné, je mizivá.
Samozřejmě pokud algoritmus dá dohromady jeden překlad a pokud má k dispozici bohatou databázi, deset verzí taky zplodí.
Ale verze dobrého překladatele bude mít něco, co dobrý čtenář pozná : osobitý styl.
U poezie nebo povídky určitě, ale taky u sportovní reportáže.
Databázi lze obohacovat, algoritmy zlepšovat, ale jejich produkt nemůže nést pečeť ročního období, oblíbený výraz dívky atd.

Aby bylo jasno, programováním se živím a baví mě.
Ale překladač může nejvýš pomoci, nikoli pořádně přeložit.

dle me ale neni teoretickej duvod, aby se robot (program) nemohl chovat jako clovek. Jiste vypocetni vykon, aby to bylo v mnoha smerech tu zatim neni, ale jedna vec (jazyk) ??? (je mi jasny, ze se programatori neflakaj a ze je to asi v tuhle chvili stale nad jejich sily (a nad vypocetni sily ???), ale urcite to bude. :-) )

Chovanie ludi niekedy ide algoritmizovat, napr. na vstup das "budu drahsie cigarety" a na vystupe mas do 3dni vykupene obchody s cigaretami :-D Alebo if(prsi) otvor_dazdnik()

Vseobecne je teoreticky mozne urobit program ktory by sa sam ucil, samozrejme je nutne dat mu na zaciatok nejake zakladne znalosti a uz aj to je dost narocne. Umela inteligencia je cely vedny obor, zaobera sa tym XY univerzit, v roznych oblastiach, armada vypisuje kadejake sutaze (napr. auto ktore jazdi samo po pusti a po ceste cez krizovatky atd apod a vyherca mal milion $ ci kolko) apod. Stale sa v tejto oblasti "skuma" resp. definuje a analyzuje ze jak vlastne sa ludia spravaju a preco a jak sa to da analyticky popisat. Zlozito, napr. tie neuronove siete, ale aj to neni spasa (je to zname uz desatrocia a vyuzitie to ma zatial len relativne obmedzene). Samozrejme ale ze sposobom if(prsi) otvor_dazdnik() je tak komplexna vec ako myslenie ludi nerealizovatelna :)

Zpět do poradny Odpovědět na původní otázku Nahoru