Science Café Revue
Zdroj média: Unsplash.com

Překladatelství je oblast, kde zatím počítač člověka nenahradí

S jazykovědcem Karlem Olivou o tom, jaký je rozdíl mezi překladačem a překladatelem, o korektoru české gramatiky v MS Word a také o tom, že lenost je důležitou hybnou silou (nejen) ve vývoji jazyka.

O češtině se říká, že je to jeden z nejsložitějších jazyků. Je to pravda?
Složitost jazyka je dosti relativní pojem, záleží, jak pro koho. Například většina dětí se češtinu naučí velmi dobře a rychle.

A co cizinci, kteří mají jiný rodný jazyk?
Pak se musíme podívat, odkud cizinec pochází. Pro Slováky je čeština určitě lehká, problém tak může být spíše v její přílišné podobnosti slovenštině – ty dva jazyky se mohou plést. Pro další slovanské národy s výjimkou Bulharů a Makedonců, kteří nemají pády, je čeština asi celkem snadná. Pokud se ovšem česky chce naučit někdo, kdo nemá vtělený slovanský systém skloňování, časování a slovesných vidů, může to skutečně být ořřříšek – i s tím „ř“.

Vy sám mluvíte řadou cizích jazyků. Je čeština z hlediska své dynamiky unikátní, nebo je v něčem podobná jiným jazykům?
Některými jazyky se slušně domluvím a jinými mluvím na úrovni rodilých mluvčích, protože jsem dlouho žil v příslušném jazykovém prostředí. V tak­ové abstraktnější rovině jazykového chování shledávám velké paralely hlavně mezi češtinou a němčinou, třeba jazyková kreativita a jazykové vtipy jsou velmi podobné. Myslím, že to souvisí se středoevropskou mentalitou, kulturou, životním stylem.

Je hravost pro vývoj jazyka důležitým faktorem?
Určitě. Druhým je lenost. To je dle mého hlavní motor jazykového vývoje, ať už jde o lenost mluvidel nebo lenost myslet. To druhé je samozřejmě nebezpečné, protože to vede k tomu, že jazyk není tak precizní a smazává některé významové distinkce. Příkladem lenosti mluvidel je například slovo „český“. Přídavná jména ke jménům obyvatelským se vytvářejí tak, že se přídavné jméno odvozuje příponou „-ský“, která v případech, kdy jméno země končí na „-ch“, způsobí změkčení tohoto „ch“ na „š“, takže je třeba „Kazach“ > „kazašský“, „Vlach“ > „vlašský“. Mělo by tedy systémově být „Čech“ > „češský“. A předpokládá se, že tak to skutečně bylo ještě ve 13. století. Ovšem vyslovovat „-šs-“ není jednoduché, takže si to lidé kvůli pohodlné výslovnosti a tedy vlastně lenosti postupně zkomolili na „český“. A podobných případů existuje řada.

Jaké jsou aktuální trendy v češtině? Předpokládám, že jde hlavně o zkracování slov či zjednodušování gramatiky.
Trendem, který trvá už několik desítek let, je samozřejmě otevírání se světu v podobě přebírání řady slov z cizích jazyků. To je přirozená věc, kterou je potřeba vidět v kontextu toho, že nepřebíráme primárně slova, ale věci do života – ve velice širokém porozumění slovu „věc“, tedy činnosti, hmotné i nehmotné věci – pro něž je potřeba najít pojmenování. Je tedy přirozené, že pokud jsme něco přijali z anglicky mluvícího prostoru, jako třeba věci spojené s výpočetní technikou nebo ekonomickou činností, tak přijmeme anglické slovo, pokud z Francie, třeba řadu věcí okolo jídla a pití, tak spolu s tím přijmeme i francouzské slovo a podobně.

V souvislosti s tím mě napadá: dočkáme se někdy toho, že bude existovat jeden univerzální jazyk, kterým bude mluvit celý svět?
Pokud ano, tak to rozhodně nepůjde rychle. Přejímání slov je proces, který fungoval v jazycích vždycky. Dnes ovšem žijeme v době velkého sociálně-ekonomického pohybu, svět se neustále zrychluje, přicházejí nové vynálezy a co včera bylo „trendy“, je dnes již „out“. V 15. či 16. století se člověk narodil v určitém soci­álním, ekonomickém a technologickém prostředí a v podstatě ve stejném i zemřel. To je dnes výrazně jiné.

Zatím se tedy musíme vypořádat s tím, že existuje množství různých jazyků. Jakým způsobem fungují překladače, které nám pomáhají rozdíly mezi jazyky překonávat? Ptám se mimo jiné i proto, že vaší hlavní doménou je matematická lingvistika, tedy propojení matematiky a jazykovědy.
První generace masově užívaných překladačů používaly jako svůj základ takzvaný dvojjazyčný korpus, tedy soubor textů v jednom jazyce a jejich překladů v jazyce druhém, a při překladu statisticky vyhodnocovaly, jaký je nejpravděpodobnější překlad určité větné konstrukce vzhledem k tomu korpusu. Dnes se užívají neuronové sítě, které sice fungují na stejném korpusovém základě, ale mají velmi složitou strukturu učení se toho, jak něco přeložit, což výsledky podstatně zlepšilo.

Může být počítačový překlad stejně kvalitní jako od skutečného lidského překladatele?
Moje zkušenost je taková, že všechny, i ty nejlepší softwary vám dají pouhou představu toho, o čem text je, a tedy jestli se vyplatí investovat do překladu od skutečného lidského překladatele. Dobrý překlad není totiž možné vytvořit jenom na základě znalosti jazyků. Dobrý překlad musí být vždy založen na tom, že textu porozumíte a budete vědět, o čem se v něm jedná. Tohle je něco, co počítače zatím ještě neumějí a otázkou je, jak dlouho bude trvat, než se to naučí – možná deset let a možná se to nenaučí nikdy…

Existují způsoby, jak matematicky kvantifikovat obtížnost jazyka?
Pokud vám jde o formální potvrzení toho, že jeden jazyk je obtížnější než druhý, tak to pokládám spíše za nepravděpodobné, zdá se totiž, že z hlediska formální složitosti jsou si všechny přirozené jazyky velmi podobné. Pokud ale jde o neformální složitost naučení se určitým jazykům, pak je najít rozdíly naopak snadné. Obrazně řečeno, jsou jazyky, jejichž učení je podobné výstupu v Himálájích: člověk na začátku pozvolna a celkem pohodlně stoupá, už po krátké době se domluví, ale postup je čím dál tím těžší a dostat se na úplný vrchol dá zabrat. To je například angličtina – na začátku to jde rychle, ovšem dojít až do cíle, naučit se jazyk opravdu dobře, je těžké a je to ještě daleko. Naopak například čeština je spíše podobná nějaké stolové hoře: na začátku musíte ostře stoupat, to znamená naučit se skloňovat a časovat, ale když to zvládnete, už jste téměř na rovince, umíte skoro všechno a další postup je relativně snadný.

Podílel jste se také na tvorbě textového korektoru v textovém procesoru MS Word. Na čem je založen?
Nejprve jsme hledali zákonitosti, které v jazyce fungují a jejichž porušení by mohlo indikovat chybu. Časem jsme ale zjistili, že to je slepá ulička a že se musíme zaměřit na jevy, které signalizují, že něco ve větě je určitě špatně. Začali jsme objevovat nový svět, protože jazykověda se celou dobu své existence vždy zabývala fenomény, které se v jazyce vyskytují, tím, jak se něco v určitém jazyce vyjádří, a my jsme museli použít obrácený postup, hledali jsme, co je v češtině určitě za všech okolností vyloučené. Objevovali jsme „krásné zrady“, třeba to, kdy opravdu stoprocentně platí, že když místo „i“ napíšu „y“, tak je větná konstrukce gramaticky chybná – to totiž neplatí zdaleka vždy: často má po změně věta sice úplně jiný význam, ale ryze gramaticky je v pořádku. Byla to fantastická tvůrčí práce.

Jak dlouho jste na korektoru pracovali?
Začali jsme v lednu 1993 a první skutečně provozuschopnou verzi jsme Microsoftu odevzdali v roce 2005, takže zhruba dvanáct let. Samozřejmě v průběhu času byla práce někdy více a někdy zase méně intenzivní, ale i tak je to kus života.

Karel Oliva

Jeden z předních českých lingvistů, zabývá se matematickou lingvistikou a formální syntaxí. V letech 2003–2016 byl ředitelem Ústavu pro jazyk český Akademie věd.

 

Tereza Mašínová

Tereza vystudovala mikrobiologii na Přírodovědecké fakultě Univerzity Karlovy. Působí v Laboratoři environmentální mikrobiologie na Mikrobiologickém ústavu Akademie Věd, kde se zabývá ekologií mikroorganizmů v lesních ekosystémech. Věnuje se také popularizaci vědy, je vítězkou souteže FameLab a s nadšením prednáší a píše o různých (nejen) biologických tématech.

  •  
      

Staňte se fanoušky

Přidejte se k nám na sociálních sítích.

Zapojte se do distribuce novin

Staňte se „Science Friendly“ kavárnou a nabídněte vašim hostům Science Café Revue. Pro více informací napište na info@screvue.cz

Inzerujte v novinách a na webu

Zviditelněte se pomocí jedinečného konceptu novin a webu Science Café Revue. Více informací na emailu inzerce@screvue.cz

Nejnovější