7 tipů na prompt pro série: Jak vytvořit s AI stejné obrázky

Víte, jak vygenerovat stejné obrázky v AI pro celou sérii? Pokud potřebujete udělat komiks, dva porovnávací vizuály, nebo více scén s vaším maskotem, narazíte. A co když chcete sami sebe přenést do různých póz? Tak si pojďme ukázat, jak přestat hrát s umělou inteligencí ruletu, jak napsat na série správný prompt a jak zařídit, abyste nestrávili milion času klikáním na generovat znovu.

Co se v článku dočtete

Proč AI nedokáže udržet pozornost?
4 univerzální principy napříč nástroji
Jaké funkce vám v nástrojích reálně pomohou?
Praktický postup: Krok za krokem ke konzistentní sérii
Tři případové studie: Jak to vypadá v praxi
Jak z jedné fotky udělat sérii v různých pózách
Nejčastější chyby, které spolehlivě rozbijí vaši sérii

Když už se vám povede vygenerovat v ChatGPT nebo Gemini krásný obrázek a ta postava tam je přesně to, co potřebujete, máte radost. Jenže pak potřebujete tu samou osobu nebo produkt použít znovu v jiné póze. Třeba pro karusel na sítě, ilustrace na blog nebo do e-booku. A tady narazíte do zdi.

Použijete v podstatě ten samý text, ale výsledek? Na druhém obrázku vypadá vaše postava spíš jako její vzdálená sestřenice, na třetím má najednou jinou barvu očí a na čtvrtém se moderní fotka záhadně změní na olejomalbu. Umělá inteligence totiž automaticky neví, že na sebe mají obrázky navazovat. Každý nový pokus je pro ni čistý list papíru.

Zatímco většina lidí to řeší tak, že frustrovaně mačká tlačítko Generovat znovu a modlí se k náhodě, vy na to půjdete jinak. Pokud chcete ze systému dostat stejné obrázky z AI, čistý text zkrátka nikdy nebude stačit. Musíte modelu nastavit tvrdé mantinely a dát mu vizuální předlohu.

Máte dokonalou fotku čtyř lidí z rodinné dovolené, všichni se krásně smějí a nikdo nemrknul. Jenže za nimi je nepořádek nebo zvědavý turista. Přečtěte si náš článek s návodem, jak upravovat fotky pomocí AI.

Proč AI nedokáže udržet pozornost?

Abyste mohli s AI pracovat profesionálně, musíte pochopit základní logiku toho, jak a proč se modely pletou.

Většina dnešních generátorů obrázků používá postup, kde se obraz postupně skládá z náhodného základu (šumu) a vaše textové zadání (prompt) ho směruje k výsledku. Jednotlivé generace však nejsou automaticky svázané, pokud nepoužijete reference nebo jiné kotvy. Každý nový obrázek začíná nanovo. Proto nevyhnutelně dochází k takzvanému odplouvání identity (Identity Drift).

V praxi to znamená, že naprosto stejný popis postavy vám dá pokaždé trochu jiný obličej, účes nebo tělesné proporce. Právě proto dnes vznikly speciální platformní nástroje a funkce, které se zaměřují výhradně na to, aby si model vybraný subjekt nebo styl pamatoval napříč všemi obrázky.

Tři pilíře konzistence

Co vlastně musíte držet na uzdě? Když se řekne „chci sérii obrázků“, musíte si přesně definovat, co má sérii spojovat. Jinak budete přistupovat k produktům a jinak ke komiksu.

A. Konzistence identity (Kdo nebo co tam je): Zde bojujete o to, aby měla postava stále stejný tvar obličeje, účes a proporce, nebo aby měl váš produkt naprosto stejné logo, zakřivení hran a materiál.

B. Konzistence stylu (Jak to vypadá): Série musí vypadat, jako by ji fotil jeden fotograf nebo kreslil jeden ilustrátor. Řeší se barevná paleta, textura, typ osvětlení (např. měkké ranní světlo vs. tvrdý neon), filmové zrno nebo typ tahů štětcem.

C. Konzistence kompozice (Kde to stojí): Stejný záběr kamery, stejný úhel, stejné rozložení prázdného prostoru pro váš text. Toto odlišuje sérii, která vypadá jako profi kampaň, od série, která působí jako náhodně stažené fotky z fotobanky.

Jestli se chcete naučit, jak vytvořit obrázky s AI a získat 6 hotových šablon, přečtěte si náš další článek.

4 univerzální principy napříč nástroji

Ať už používáte ChatGPT, Gemini, Midjourney nebo Leonardo, tyto čtyři principy fungují všude.

1. Zadání je technická specifikace, ne poezie

Amatéři píší zadání jako básně: „Nádherná, úžasná, magická žena kráčí epickým podzimním lesem.“ Profesionál ho píše jako technický zadávací list. Stálost nevzniká tím, že přidáte více přídavných jmen. Vzniká tím, že přesně popíšete, co má zůstat stejné, a natvrdo zakážete jakékoliv nechtěné úpravy (např. „žádné další prvky v pozadí“).

2. Síla prvků, které se nikdy nemění

Invariant je odborný výraz pro prvek, který tvoří pilíř vaší série a nesmí se pohnout ani o milimetr. Vaše textové zadání musí tyto pevné body zabetonovat.

→ U postavy: Tvar hlavy, specifická barva očí, typ brýlí, přesný styl a barva oblečení.

→ U produktu: Tvar, materiál (např. matný eloxovaný hliník), dominantní barva. Tento blok textu s popisem invariantů si uložte stranou a vkládejte ho neměnný do každého dalšího generování.

3. Vzor je vždy silnější než text

Lidský jazyk je pro popis vizuálu tragicky nepřesný. Slovo „modrá“ má pro AI milion odstínů. Referenční obrázek funguje jako pevná vizuální kotva. Pokud chcete udržet stejnou tvář nebo specifický styl kresby, čistý text obvykle nestačí. Nahraná obrazová reference zvedne kvalitu výsledku o úroveň výš.

4. Rozvržení a pózy neukecáte

Pokud chcete, aby postava seděla v přesně definované póze, textem to často nedokážete jasně vysvětlit. Zde přichází na řadu kontrolní signály, takzvaný ControlNet. Tento postup najdete typicky ve světě Stable Diffusion a pokročilejších nástrojů kolem něj, kam nahrajete takzvané vodítko (přesný obrys, pózu či mapu hran). Generování se pak řídí tímto vodítkem a kompozice fotky zůstane naprosto identická.

Jaké funkce vám v nástrojích reálně pomohou?

Nemusíte se učit složité technické pojmy. Stačí vědět, že v lepších generátorech máte k dispozici tři hlavní „záchranné brzdy“, které udrží vaše obrázky pohromadě:

→ „Kopírka na obličej a styl“ (nástroj Midjourney): Midjourney to má vymyšlené nejlépe. Má v sobě zabudované dva speciální příkazy. Když do zadání připíšete zkratku –cref (odkaz na postavu) a nahrajete fotku svého hrdiny, AI mu z ní prostě „obkreslí“ obličej a oblečení na všechny další obrázky. Pokud použijete zkratku –sref (odkaz na styl), model si nevezme obličej, ale „nasaje“ z fotky její náladu – například to, že obrázek vypadá jako malovaný vodovkami nebo focený na polaroid.

→ Tajemné slovo „seed“ (Rodné číslo obrázku): V návodech na internetu často narazíte na radu: „Použij stejný seed.“ Co to vůbec je? Každý obrázek, který AI vygeneruje, dostane v systému své unikátní rodné číslo (seed). Když zadáváte nový obrázek a přidáte k němu toto číslo z předchozí fotky, AI se bude snažit držet podobného rozložení věcí na scéně. Ale pozor. Není to zázračná lepicí páska. Jakmile v textu změníte, že postava už nestojí, ale běží, samotné číslo (seed) vám nepomůže a tvář se stejně zdeformuje. Nahraná fotka jako vzor (viz bod výše) funguje vždycky stokrát lépe.

→ Když potřebujete naprostou přesnost (Trénink modelu na míru): Dejme tomu, že máte e-shop a potřebujete do AI dostat váš konkrétní produkt (třeba lahvičku parfému s přesným logem). Tady vám nahrání jedné fotky jako vzoru stačit nebude, AI vám totiž tvar i nápis vždycky trochu poplete. Zde přichází na řadu „trénink na míru“. Znamená to, že nahrajete zhruba 20 reálných fotek vašeho parfému ze všech stran do AI nástroje, a model se váš produkt doslova „nabifluje“ nazpaměť. Vytvoří si pro něj něco jako vlastní razítko, a když pak napíšete „vygeneruj můj parfém na pláži“, už si ho nikdy nesplete.

Praktický postup: Krok za krokem ke konzistentní sérii

Zahoďte chaos a začněte tvořit s jasným plánem.

Krok 1: Vytvořte si bibli vašeho stylu

Než vygenerujete první ostrou fotku, napište si pravidla vaší série. Zapište barevnou paletu, typ osvětlení (např. měkké denní světlo), texturu a zakázané prvky (bez neonů, žádný komiksový styl).

Krok 2: Vytvořte Výchozí portrét

Vygenerujte si nejdříve dokonalý portrét na jednoduchém pozadí s neutrálním výrazem. Tuto fotku budete následně nahrávat jako hlavní referenci pro všechny další scény (když postava běží nebo sedí v autě).

Krok 3: Dvě šablony pro rozdělené zadání

Pro udržení stálosti je nejlepší oddělit pravidla od samotného děje.

Pokročilá šablona (s XML značkami): Zní to trochu „ajťácky“, ale například vývojáři z Anthropic doporučují ohraničovat text pomocí značek (např. < >). Tyto značky nejsou žádná povinná programovací syntaxe, bez které by to nefungovalo. Jde čistě o způsob, jak text vizuálně oddělit, aby v tom model neměl zmatek:

<pravidla_stylu> [Vložte vaši bibli stylu] </pravidla_stylu> <postava> [Vložte vaše Invarianty a odkaz na nahranou referenci] </postava> <scena> [Žena sedí v moderní kavárně, pije espresso a dívá se z okna.] </scena>

Stručná, běžná šablona (pro rychlé použití): Pokud nechcete používat závorky, stačí držet pevnou strukturu odstavců:

Styl: Minimalistická plochá vektorová ilustrace, pouze 3 barvy (žlutá, modrá, bílá), bílé pozadí. Předmět: [Popis maskota/produktu podle vaší Karty postavy]. Akce: [Postava ukazuje na graf].

Krok 4: Ladění pouze po jednom kroku

Iterovat znamená postupně upravovat věci krok za krokem. Pokud v zadání změníte barvu košile, lokaci a typ světla najednou, AI se zhroutí a vyhodí úplně jiný obrázek. Měňte proměnné (např. jen pozadí) striktně po jedné.

Tři případové studie: Jak to vypadá v praxi

Abyste si to dokázali představit, ukážeme si postup na třech reálných situacích.

A. Maskot značky v 10 scénách

Problém: Potřebujete lišku v 10 různých pracovních situacích (s počítačem, na telefonu, s kávou).
Řešení: Vygenerujete perfektní „katalogovou“ fotku lišky. Tuto fotku nahrajete do nástroje, do svého vlákna, do podkladů. Váš prompt zůstává pevný v popisu lišky, měníte vždy jen poslední větu: „drží hrnek s kávou“, „píše na notebooku“. Tvář a styl srsti zajistí referenční obrázek.

B. Produkt v e-shopu ve 3 prostředích

Problém: Máte fotku pleťového krému a potřebujete ho na mramorovém stole, v lese a v koupelně, aniž by se zdeformovalo logo.
Řešení: Zde samotný text selhává, protože AI má tendenci produkty deformovat. Profesionál použije techniku Inpainting (označí pozadí a změní jen to, zatímco krém zůstane nedotčený) nebo použije zmíněný ControlNet, který uzamkne přesný tvar lahvičky.

C. Ilustrace pro článek (série 6 obrázků)

Problém: Potřebujete 6 ilustrací k textu, které musí mít stejný layout a jednotný grafický tón.
Řešení: Využijete takzvanou stylovou referenci (Style Reference). Nahrajete ukázkovou vektorovou grafiku a do zadání natvrdo vložíte invariant: „Stejný layout s objektem uprostřed, velký negativní prostor nahoře, izometrický pohled.“ Zbytek necháte na AI.

Jak poznat, že série drží a kdy už se rozpadá?
Jak zkontrolovat, že vaše snaha přináší ovoce? Zde je rychlý checklist.
→ Checklist identity (Postavy a produkty): Zkontrolujte nos a oči (u lidí se rozpadají nejdříve). Zůstal stejný účes a barva oblečení? Nedeformovalo se u produktu logo nebo tvar víčka?
→ Checklist stylu: Když dáte 6 obrázků vedle sebe do mřížky, nepraští vás žádný do očí jiným kontrastem nebo saturací barev? Působí světlo na všech vizuálech konzistentně (např. vrhá stejné stíny)?
→ Checklist kompozice: Když obrázky rychle proklikáte za sebou, „neskáče“ hlavní objekt divoce z rohu do rohu? Je zachována podobná vzdálenost kamery (např. polodetail)?

Jak z jedné fotky udělat sérii v různých pózách

Běžné textové modely totiž neumí vzít váš konkrétní obličej a beze změny ho „naroubovat“ do nové akce. Pokud chcete mít na fotkách z umělé inteligence skutečně svůj obličej, máte dnes dvě reálné cesty:

Cesta 1: Rychlá kopírka obličeje (Midjourney)

Pokud máte alespoň trochu slušnou fotku, kde se díváte do kamery, naprosto tady září nástroj Midjourney. Použijete k tomu už zmíněný příkaz pro odkaz na postavu (zkratka –cref).

V praxi to vypadá tak, že nahrajete své selfie a napíšete zadání: „Žena sedí v moderní kavárně, pije cappuccino a usmívá se, přirozené denní světlo.“ Na konec přidáte odkaz na svou fotku. Midjourney vygeneruje úplně novou scénu, novou pózu i nové oblečení, ale pokusí se na ni maximálně věrně přenést vaše rysy. Není to vždy na 100 % bezchybné (občas vás AI trochu přikrášlí), ale pro příspěvky na sociální sítě je to dnes nejoblíbenější a nejrychlejší metoda.

Cesta 2: Váš osobní AI fotograf (Trénink na míru)

Pokud potřebujete skutečně bezchybné profilovky na web nebo firemní materiály a jedna referenční fotka nestačí (protože vás AI z boku už nepozná), musíte přejít na profesionálnější úroveň. Říká se tomu „trénink na míru“.

Funguje to tak, že modelu nenahrajete jednu fotku, ale 10 až 20 svých reálných fotek z různých úhlů, v různém světle a s různými výrazy. AI si vás chvíli „studuje“ a pak si vytvoří váš osobní, uzamčený model. Od té chvíle už nepotřebujete nahrávat žádné ukázky. Do systému prostě jen píšete: „Vygeneruj mě v modrém obleku v kanceláři,“ nebo „Vygeneruj mě, jak čtu knihu v parku.“ Model přesně ví, jak vypadáte zepředu i z profilu, a výsledek vypadá k nerozeznání od reálného focení ve studiu.

Tip z praxe: Pokud do AI nahráváte své fotky pro tvorbu profilovek, o čemž pojednáváme v dalším článku, vyhněte se fotkám, kde máte velké sluneční brýle, klobouky nebo výrazné stíny přes obličej. Čím čistší a neutrálnější fotky systému dodáte, tím lépe se s vámi naučí pracovat v jiných situacích.

Nejčastější chyby, které spolehlivě rozbijí vaši sérii

Vyhněte se těmto amatérským pastem, které vám zničí celodenní práci:

Pokus o dokonalý text přímo z AI: Lidé hned na začátku narazí na bannery a nápisy. Když má být text stoprocentně správně, často je lepší vygenerovat čistý vizuál bez textu a typografii doplnit až v grafickém editoru (Canva, Photoshop). Doporučuje to i OpenAI, aby se zabránilo kreativnímu „ujíždění“ modelu.
Příliš mnoho umělecké volnosti: Parametr stylizace (v Midjourney) vám dává možnost nechat AI volnou ruku. Vysoká hodnota sice znamená na pohled hezčí obrázek, ale zato naprostou ztrátu detailů z vašeho zadání.
Změna slovníku: Když na prvním obrázku píšete „filmové světlo“ a na druhém „světlo jako z kina“, pro AI jsou to dva různé světy. Texty doslova kopírujte.
Absence zákazů: OpenAI výslovně doporučuje přidávat do zadání explicitní restrikce (např. „žádné další prvky v pozadí“, „žádný nepořádek na stole“). Tím drasticky snížíte odplouvání od původního stylu.
Pokus o fixaci kompozice pouhým textem: Pokud potřebujete, aby postava držela ruku přesně v úhlu 45 stupňů, text na to nevyzraje. Tady musí přijít na řadu vložení vodítka přes ControlNet.

Vytvořit stálou sérii pomocí AI není o talentu na psaní hezkých příběhů. Je to o disciplíně a budování přísných textových a vizuálních mantinelů. Přestaňte se modlit k tlačítku „Generovat“ a začněte svým modelům dávat skutečně pevná zadání.

Související články

Prompty pro AI obrázky, které fungují + 6 hotových šablon

Virální prompty pro AI: 7 trendů, které musíte vyzkoušet

7 tipů krok za krokem: Jak vytvořit profilovku pomocí AI

Jak upravit fotku pomocí AI: 14 konkrétních návodů a promptů