Hlavní navigace

Problém angličtiny aneb když jazykem nevládnete

6. 5. 2019

Sdílet

 Autor: © Olivier le Moal - Adobe Stock
Často se na AIW zaměřujeme na novinky v oblasti rozpoznávání přirozeného jazyka, kontextuálního vyhledávání a podobě – zkrátka oblasti, kde AI a ML hraje prim. Jenže mají svou nevýhodu: obvykle jsou totiž stavěny na anglický jazyk.

V květnovém čísle Computerworldu naleznete jako přílohu také náš AI World, a v něm rozhovor s velmi šikovnými studenty z ČVUT, kteří založili startup Alquist: ten se umístil jako druhý na soutěži Alexa Prize od Amazonu (dvakrát po sobě) a obdržel tak velmi prestižní ocenění mezi konverzační umělou inteligencí.

I tito pánové z České republiky však, samozřejmě, chatbota programovali specificky na použití v anglickém jazyce.

Proč?

Lokální čeština, globální angličtina

Na důvody není těžké přijít: jde o hlavní jazyk mnoha stovek milionů lidí (když počítáme Indii, tak miliard) a jako druhý jazyk pro další stovky milionů až miliardy lidí.

I proto je angličtina hlavní jazyk současného vědeckého poznání. Slavně to v 16. století řekl Karel V. Habsburský, císař Svaté říše římské: K Bohu mluvím španělsky, k ženám italsky, k mužům francouzsky a ke svému koni německy. Dnes je situace velmi odlišná, pro naprostou většinu světa je základem komunikace, která se neodehrává v jejich rodné zemi, angličtina. Naprosto běžné je to i v globálních firmách, třeba v telekomunikacích – manažeři běžně bývají cizinci, a se svými podřízenými musí mluvit anglicky.

V zásadě nejde o nic špatného, takovýto globální jazyk komunikaci značně usnadňuje.

Problém však je u těch, kteří angličtinu neovládají. Další velmi rozšířené jazykové skupiny – němčina, francouzština, ruština, čínština a podobně – jsou na tom ještě relativně dobře; mají dostatečné množství mluvčích, a především potenciálních zákazníků na to, aby se o ně firmy zajímaly. Ostatně, to je dobře vidět třeba u filmů nebo videoher: v angličtině jsou téměř všechny, do francouzštiny, němčiny a podobně je přeložena naprostá většina těch významnějších.

U češtiny je to poněkud méně. Něco přes 10 milionů není moc vysoké číslo, a tudíž obzvláště co se týče třeba kontextového vyhledávání nebo rozpoznávání řeči musíme spoléhat právě na angličtinu.

příloha_ovladnete_sva_data

Je zcela možné, že se dočkáme češtiny třeba pro Alexu nebo Siri. Nebo, možné – ono je to, na rovinu, téměř jisté. Jen to nebude hned, nebude to tak funkční jako v angličtině a především přídavků, uživatelských aplikací, bude to češtiny přeložených mnohem méně, a hlavně na tom staví současné IoT.

Nezbytné nutné je proto smířit se s dvěma věcmi: v globalizovaném světě dneška si s jedním jazykem člověk vystačí jen těžko. Druhý – ať už jde o jakýkoliv rozšířenější – výrazně zjednodušuje komunikaci. A za druhé, neméně důležitě, bychom si jako Češi měli být vědomi, že je u nás řada úspěšných startupů v IT oblastech – jen budou z většiny komunikovat v angličtině, protože český trh je zkrátka příliš malý.

Byl pro vás článek přínosný?