3 nejlepší AI: Jak fungují česky a jak s nimi pracovat

Čeština není jednoduchý jazyk. Ale nástroje AI se opravdu snaží, aby vyhověly i nám, česky mluvícím. Někdy vám připadá, že to, co by vygenerovala v angličtině, je přesně to ončo, co jste chtěli. Ale v češtině to prostě drhne. Není to o tom, že by umělá inteligence doslovně překládala. Text skládá dle požadovaného jazyka. Jen je potřeba vědět, jak na to.

Stalo se vám to taky. Zadáte do umělé inteligence jednoduchý úkol, třeba napsat e-mail klientovi. Za dvě vteřiny vypadne text, který začíná slovy: „Vážený kliente, v dnešní dynamické době je klíčové implementovat robustní řešení…“ Zkusíte to přeložit do angličtiny, zadat to znovu a najednou to funguje skvěle. Jenže vy potřebujete pracovat česky.

Většina lidí si myslí, že AI text z angličtiny prostě „překládá“. Není to pravda. Tyto modely skládají text přímo v jazyce, ve kterém píšou, jen to dělají statisticky.

Proč je čeština pro AI zátěžový test

Za většinou trapasů v češtině stojí dvě technické věci.

První věc je tokenizace.

Modely nečtou slova, ale menší kousky textu, takzvané tokeny. V angličtině je jedno slovo často jeden token. Protože modely byly trénovány primárně na angličtině, jejich tokenizéry jsou optimalizované pro ni.

V češtině se slova kvůli skloňování a diakritice častěji rozpadají do více částí (tokenů). Praktický dopad je krutý: když pracujete s AI v češtině, vyčerpáte svůj limit paměti zhruba 2x až 3x rychleji než rodilý mluvčí v Americe. Paměť modelu se prostě dříve zahltí.

Druhá věc je regrese k anglické syntaxi. Odborné lingvistické analýzy ukazují, že i když model píše česká slova, někdy skládá věty jako v angličtině, jen přehází slova. V praxi to leze ven přes trpný rod, nepřirozený slovosled, šablonové spojky a celkově sterilní tón.

Tady nepomůže napsat do promptu jednoduché „piš česky“. Pomůže jedině specifikace stylu. Musíte zadat: „Piš přirozenou češtinou, vyhni se trpnému rodu a používej pestrou větnou stavbu typickou pro českou publicistiku.“

Odborná literatura potvrzuje, že čeština je pro modely těžší hlavně kvůli morfologii. Skloňování, volný slovosled a bohaté tvary zvyšují riziko, že model sice bude působit plynule, ale udělá chybu v drobnosti.

Tři věci, které se v češtině kazí nejčastěji a dají se snadno odhalit, jsou:
→ Negace a výjimky: Jeden zápor navíc a význam se zcela otočí.
→ Podmínky: Slova jako pokud, jen když, kromě, výjimkou je.
→ Právní a administrativní formulace: Věta zní plynule, ale posune právní význam.

Jak porovnávat AI a jejich češtinu

Když si zadáte do Googlu, která AI je nejlepší, tak vám vyjedou výsledky toho, co prošlo testy v angličtině na globální úrovni. Právě proto se dnes modely netestují jen celosvětově, ale používají se testy jako BenCzechMark, nebo CUS QA, což je benchmark na regionálně ukotvené otázky připravené rodilými mluvčími z Česka a Slovenska.

Představte si to tak, že se AI učí jazyky z obrovské globální učebnice, kde je většina stránek anglicky a na češtinu zbylo jen pár poznámek pod čarou. Model pak působí jako sebevědomý cizinec. Slova sice zná, ale plete si pády a věty skládá podle anglické logiky. Běžné globální testy tuto „českou neohrabanost“ vůbec neodhalí.

Proto odborníci vytvořili BenCzechMark. To je vůbec první přísný zátěžový test navržený čistě pro naši mateřštinu. Tato zkouška netestuje, jestli AI umí tupě přeložit větu. Testuje takzvané české chytáky, na kterých modely nejčastěji bourají: složité skloňování, skryté zápory, podmínky nebo typické administrativní formulace, kde jediné špatné slovo otočí význam věty naruby.

Co se vlastně srovnává?

U velkých značek se často plete „model“ a „produkt“. V konečném produktu rozhodují i vrstvy okolo: nástroje, integrace, práce se soubory, vyhledávání, schopnost pojmout dlouhý kontext, multimodalita, nebo takzvané směrování (router).

→ U OpenAI (ChatGPT) je to popsané explicitně. O generaci GPT-5 se mluví jako o systému s routerem, který směruje dotazy do různých režimů podle toho, co úloha zrovna potřebuje. To v praxi vysvětluje, proč stejná aplikace někdy odpoví neuvěřitelně rychle a jindy mnohem hlouběji uvažuje.

→ U Googlu (Gemini) je zásadní jejich technický report, který stojí na multimodálním zpracování a práci s velmi dlouhým kontextem. V praxi to znamená, že vedle psaní odpovědí umí držet pohromadě obrovské množství vstupů.

→ U Anthropicu (Claude) je užitečné sledovat dokumentaci o vícejazyčné podpoře. Kladou zde důraz na schopnost psát lidsky a držet robustní výkon napříč jazyky.

Kdo v čem exceluje

Odborná praxe jde proto po nejlepším nástroji pro konkrétní úkol. Pojďme se podívat, kdo vyhrává v reálných situacích.

1. Claude: Král české stylistiky a copywritingu

Když jde o češtinu a přirozený tón, začne vyhrávat. Společnost Anthropic k jeho vývoji přistoupila jinak. Trénovala ho s obrovským důrazem na empatii, nuance a přirozenost prostřednictvím takzvané Constitutional AI. Pro běžného uživatele to znamená jednu zásadní věc, a to, že Claude má mnohem menší tendenci sklouzávat k onomu pověstnému „AI zápachu“. Zatímco jiné modely milují prázdná slova jako v dnešní dynamické době, klíčový aspekt nebo fascinující, Claude dokáže psát civilně.

Sama společnost Anthropic ve své dokumentaci k vícejazyčné podpoře otevřeně přiznává, že výkon umělé inteligence se napříč různými jazyky přirozeně liší, a doporučuje testovat konkrétní jazyk přímo na reálných úlohách. A právě v těchto praktických testech Claude u češtiny září. Je to volba číslo jedna tam, kde jde o přepis do lidštiny a jemné jazykové korektury. Pokud mu dáte sterilní, úřednický text, neudělá to, že by jen strojově vyměnil pár slov za synonyma. On pochopí kontext, změní rytmus vět a uhladí syntax tak, aby výsledek zněl, jako by ho napsal zkušený český copywriter.

→ Typické použití, které šetří čas: E-maily, blogy, texty na web, korektury, přepisy formálního sterilního textu do přirozeného stylu, jazykové uhlazení bez ztráty významu.

→ Situace ze života: Potřebuju napsat text, který nepůsobí strojově.

Nejčastější chyba: Zadání je vágní. Vznikne hezky znějící text, který je významově rozmazaný. Vezmete hned první výstup a použijete ho. Bez kontroly tónu, bez ukázky stylu, bez omezení.

Ověřený postup: Do modelu se vloží dvě krátké ukázky vlastního dobrého textu. Model dostane úkol popsat váš styl, slovník a rytmus bez přepisování obsahu. Teprve pak se zadá nový text a zadefinuje se, co je zakázané (šablonové fráze, trpný rod, sterilní spojky). Claude drží lidský tón ze všech modelů nejlépe.

2. ChatGPT: Analytik, logik a programátor

ChatGPT je hrubá výpočetní síla. Jeho nejsilnější zbraní není psaní líbivé beletrie, ale nekompromisní logika a práce s daty. Odborná komunita a materiály od OpenAI mluví o tomto modelu jako o systému vybaveném „routerem“. Ten umí rozpoznat, jaký typ úlohy po něm chcete, a podle toho váš dotaz automaticky nasměruje do správného režimu. To v praxi vysvětluje, proč na něco odpoví bleskově a jindy se u složitějšího úkolu na pár vteřin zamyslí.

Jeho modely excelují v takzvaném chain-of-thought uvažování. Pokud před něj postavíte komplexní problém, on si ho interně rozpadne na sérii logických kroků a ty postupně vyřeší. Kde ChatGPT v češtině ztrácí body za svůj formální a občas šablonovitý sloh, tam drtivě vyhrává díky nástrojům jako Advanced Data Analysis. Můžete do něj nahrát rovnou celou tabulku v Excelu a on se v ní začne chovat jako zkušený datový analytik. Najde anomálie, vyčistí data, zkontroluje chyby nebo rovnou napíše funkční kód. Začne prostě excelovat všude tam, kde potřebujete strukturované uvažování a přesnost nad emocemi.

→ Typické použití, které šetří čas: Analýza dat, práce s tabulkami a exporty, třídění, kontrolní seznamy, logické scénáře, programování, tvorba Excel maker.

→ Situace ze života: Chci, aby mi AI udělala pořádek v datech z e-shopu/blogu.

Nejčastější chyba: Snažíte se data zkopírovat jako text a nalepit je do chatu. Ztratí se struktura, přibydou chyby a kontrola padá.

Ověřený postup: Data se předají jako soubor (.CSV nebo .XLSX), ne jako zkopírovaný text. Model dostane jasné zadání, co je úspěch (například najít propady, najít anomálie, navrhnout aktualizace pro SEO). Výstup se vynutí ve formátu, který jde mechanicky ověřit (tabulka, konkrétní filtry).

Pokud si nejste jistí, jak naučit AI psát jako vy, přečtěte si o tom náš další článek.

3. Gemini: Polykač dokumentů a videí

Gemini má jednu specifickou vlastnost, kterou technologicky dává konkurenci na frak: masivní kontextové okno, které pojme až 2 miliony tokenů. Technický report od Googlu k modelu Gemini je primárně postavený právě na schopnosti pracovat s obrovským množstvím vstupních dat bez toho, aby model „zapomněl“, co četl na začátku. V praxi to znamená, že vedle běžného psaní odpovědí umí pojmout 50stránkové PDF, technický manuál nebo celou účetní knihu, udržet v paměti souvislosti a vy v nich pak můžete libovolně vyhledávat.

Navíc je Gemini od samého základu postavené jako multimodální model. To znamená, že když do něj nahrajete 3 hodiny trvající video z YouTube, on si ho jen mechanicky nepřepíše do textu, ale reálně „vidí a slyší“, co se v něm děje. Přidejte k tomu fakt, že je napřímo integrovaný do ekosystému Google Workspace, takže umí tahat data z vašich Google Dokumentů, Gmailu nebo Disku, a získáte ultimátního rešeršistu pro ty nejtěžší a nejobjemnější úkoly. Zejména u zpracování dlouhých zápisů z porad nebo rešerší napříč celým internetem je aktuálně bezkonkurenční.

→ Typické použití, které šetří čas: Dlouhá PDF, dlouhé zápisy, rešerše přes velké množství podkladů, vyhledávání v rozsáhlém materiálu nebo shrnutí záznamu z porady na videu.

→ Situace ze života: Mám 100stránkový manuál a potřebuju z něj vytáhnout 3 konkrétní věci.

Nejčastější chyba: Chcete shrnutí celého dokumentu najednou a pak věříte výsledku, i když se nikde neukáže opora v textu. (Nebo použijete ChatGPT, který se u tak velkých PDF často zacyklí a začne si vymýšlet).

Ověřený postup: Požadavek se neformuluje jako vyprávěj, ale jako vyhledej a cituj. Místo prosby o shrnutí celého dokumentu rozdělte text na kapitoly. U každé chtějte tři věci: Co tvrdí. Na čem to stojí. Co z toho plyne. Výstup musí obsahovat přesné místo v dokumentu a doslovnou citaci krátkého úryvku.

Rychlé shrnutí:
Claude (Anthropic)
→ Výhoda: Drží nejpřirozenější lidský tón a nepoužívá prázdné korporátní fráze.
→ Čeština: Zvládá lidský tón v češtině ze všech modelů nejlépe, chápe naše nuance a text od něj zní, jako by ho psal zkušený český editor.
ChatGPT (OpenAI)
→ Výhoda: Umí si problém interně rozpadnout na kroky a excelentně pracuje s nahranými daty.
→ Čeština: Často skládá české věty podle anglické logiky (takzvaná regrese k anglické syntaxi) a jeho texty bývají velmi formální a šablonovité.
Gemini (Google)
→ Výhoda: Obří paměť (kontextové okno), do které se vejde neuvěřitelné množství podkladů najednou, aniž by zapomněl začátek.
→ Čeština: Je to spolehlivý čtenář. Neumí sice napsat tak čtivý blog jako Claude, ale bez problému chroustá obří české texty, smlouvy nebo dlouhé zápisy a neztrácí v nich nit.

Co si z toho vzít pro svoji práci

AI nemá „názor“, má jen statistiku. Pokud zní jako úředník, je to proto, že v českých tréninkových datech je formální jazyk nejčastější. Vy ji z toho musíte vytrhnout pevným zadáním role (např. „Chovej se jako drzý startupista“).

Zároveň je fér říct nahlas, že regionální znalosti jsou samostatná disciplína a často i slabina. Benchmark CUS QA ukazuje, že i moderní a špičkové modely mají obrovskou mezeru v regionálně ukotvených otázkách (a že automatické hodnocení často nesedí s lidským posouzením). To je velmi praktická zpráva: u lokálních českých tvrzení je vždy bezpečnější chtít oporu ve zdroji, nebo ještě lépe, dodat text s fakty přímo do vstupu.

A pokud jde do tuhého a potřebujete vyřešit extrémně složitý logický úkol (třeba kód), použijte takzvaný „anglický most“. Zadejte prompt v angličtině, ale přikažte: „Analyze this in English to ensure logical accuracy, but output the final response in Czech.“ (Analyzuj to anglicky pro zachování logiky, ale výsledek mi napiš česky). Tento postup prokazatelně snižuje chybovost u mnoha modelů.

Checklist pro spolehlivé zadání

Používat dnes jen jeden nástroj, třeba jen ChatGPT, je zbytečné omezení. Je to jako používat v kuchyni jen jeden nůž. Odborná praxe se posouvá k rozdělení rolí: jeden nástroj na psaní (Claude), jeden na analýzu (ChatGPT) a jeden na velké podklady (Gemini). Důvod není víra ve značku, důvod je typ úlohy.

Aby se z AI stal váš pracovní nástroj a ne jen loterie s hezkými větami, zkuste si zvyknout na tento checklist návyků, které reálně zvyšují spolehlivost:

Zadání má mít strukturu: Cíl, vstupy, omezení a formát výstupu. (Když jde o instrukce v češtině, struktura zadání pomůže nejvíc, ne slohovka).

U češtiny vždy popište styl: Nestačí jen říct, ať píše česky.
U lokálních tvrzení a faktů: Vždy chtějte oporu v podkladu.
U dlouhých dokumentů: Funguje režim vyhledej a cituj, nikoliv režim shrň všechno.
U dat: Funguje práce s nahraným souborem a kontrolovatelný výstup (formát, který jde ověřit). Čím více je úloha kontrolovatelná, tím méně prostoru má model na kreativní vyplňování (halucinace).
Testujte na malém vzorku: Teprve pak úkol škálujte na celý dokument.

Související články

Naučte AI psát jako vy: 12 promptů pro digitálního klona

Jak upravit AI text, aby zněl jako, že ho napsal člověk

5 chytrých nástrojů, které zjednoduší každodenní práci

Promptování: Příklady správně položených otázek