Prompty pro AI obrázky, které fungují + 8 hotových šablon

Poezie stranou. Promptování není malířství. Když potřebujete vygenerovat obrázek pomocí AI, musíte přemýšlet jako fotograf, ne jako básník. Nepotřebujete znát tajuplné formule, stačí se držet doporučení, jak vrstvit popis, aby výsledek stál za to.

Potřebujete fotku na blog, ilustraci do prezentace nebo náhledovku na YouTube. Napíšete prompt: „Krásná fotka kočky na gauči.“ A vypadne vám plastová, přesvícená obluda, která má šest prstů a oči jako z hororu.

Zkusíte to znovu: „Realistická, nádherná, ultra detailní fotka kočky, 8K, trending on ArtStation.“ Výsledek je o chlup lepší, ale pořád to vypadá jako laciná grafika z videohry.

V praxi se pořád dokola opakuje stejný trapas. Někdo ladí jen slova a diví se, že výsledek pokaždé ujede jinam. Jiný člověk ladí jen páčky v rozhraní a diví se, že to vypadá prázdně a bez nápadu. Pojďme si ukázat, jak ty stroje zkrotit.

Chcete pomocí AI pouze upravovat (rodinné) fotografie? Přečtěte si náš další článek.

Proč magická slova nefungují

Než začneme psát prompty, musíme vyhodit z hlavy představu, že AI je umělec. Není. Text to image modely berou text a hledají v něm vizuální signály, které se dají poskládat do jedné scény.

Věty typu udělej to hezké nebo vymysli něco cool nemají skoro žádnou informaci, kterou by šlo převést do světla, materiálu, perspektivy a kompozice.

Co naopak funguje dokonale, je popis rozdělený do 4 konkrétních vrstev:
→ Subjekt. Co přesně je hlavní objekt a jaké má rozpoznatelné znaky.
→ Prostředí. Kde se to odehrává a z čeho je scéna poskládaná.
→ Kompozice. Jaký je záběr, perspektiva, ohnisko, hloubka ostrosti.
→ Styl. Jaké médium, jaký typ fotografie nebo ilustrace, jaká atmosféra.

Tahle logika odpovídá i tomu, jak OpenAI doporučuje prompt skládat do vrstev a dávat informace, které jsou vizuálně čitelné.

Praktický rozdíl je brutální:

Špatně: Kočka na gauči. (Informací je málo.)

Správně: Rezavá kočka se škrábancem na nose (subjekt), sedí na sametové pohovce (prostředí), večerní světlo z lampy, detailní záběr, mělká hloubka ostrosti (kompozice), filmový look (styl). Tohle už je skoro storyboard. Ne proto, že by šlo o dlouhý text, ale proto, že každá část nese vizuální význam.

Zajímavost, která vám ušetří nervy:
Jedno slovo „light“ často udělá větší rozdíl než deset přídavných jmen o stylu. Důvod je prostý. Modely byly trénované na obrovském množství fotek a světlo je největší nosič fotografického dojmu. Proto se v doporučeních pro prompting pořád vrací světlo, kompozice a konkrétní vizuální popis. Když prompt neobsahuje světlo, model si ho vymyslí. A většinou špatně.

Přestaňte dělat pět změn naráz

Než začnete generovat nový obsah, musíte modelu vysvětlit, kdo jste. Tahle část se dobře sdílí, protože je to reálný obraz frustrace.

Špatný prompt: Krásný moderní obývák, luxusní, útulný, hodně detailní.

→ Krok jedna (přidá neměnné prvky): Obývák 4×5 metrů, jedno okno vlevo, dřevěná podlaha světlý dub, bílá zeď bez obrazů, pohled z rohu místnosti.

→ Krok dva (doplní kompozici a světlo): Širokoúhlý záběr 24mm vzhled, perspektiva v úrovni očí, měkké denní světlo z okna vlevo, jemné stíny, přirozené barvy.

→ Krok tři (doplní styl a materiály): Skandinávský minimalismus, lněná sedačka, černé kovové nohy stolu, matné povrchy, fotorealistická interiérová fotografie.

Teprve tady se začíná ladit. Po jedné změně. Například jen barva sedačky, jen typ osvětlení, jen perspektiva. Původní kód náhody, se kterým AI začínala, zůstává stejný, aby bylo vidět, co změna udělala. Tohle je nejrychlejší cesta, jak si ušetřit nervy a zároveň neztratit kontrolu.

Šablony: 6 situací, které denně řešíte

Vezměme si ty nejčastější úkoly, se kterými se potýkáte, a podívejme se, jak na ně jít strukturovaně.

1. Produktová fotka nevypadá jako bazar

Nejčastější problém je nečitelný produkt, rušivé pozadí a světlo, které vypadá jako náhodný blesk. Osvědčený recept je popsat scénu jako fotostudio a být konkrétní v osvětlení a kompozici. V dokumentacích k promptování se opakuje, že světlo a rozvržení prvků jsou nosič kvality, protože to jsou vizuální signály, které model umí napodobit.

Prompt šablona: Studiová produktová fotografie, produkt X, materiál matný plast nebo kartáčovaný kov, jemné odlesky, měkké boční světlo, neutrální pozadí barva Y, stín měkký pod objektem, produkt uprostřed, fotografická přesnost, bez textu.

2. Interiér nemění dispozici a okna

Nejčastější problém je, že model začne předělávat realitu. Přidá okno, posune dveře, zvětší místnost. Osvědčený recept je začít neměnnými prvky jako omezením a opakovat je hned na začátku promptu. U nástrojů, které umí referenční obrázek, se to řeší ještě líp. Ten vzor pak používá jako vodítko, aby další vygenerované obrázky vypadaly podobně. Třeba aby měly stejnou barevnost, stejný typ kresby nebo stejnou atmosféru. Adobe tomu říká reference image a používá se hlavně na udržení jednotného vzhledu napříč sérií.

Prompt šablona: Místnost X krát Y, okno na pravé stěně, dveře vlevo, podlaha dub, bílé stěny, zachovat dispozici. Návrh interiéru ve stylu japandi, lněné textilie, matné dřevo, měkké denní světlo. Záběr z rohu, perspektiva v úrovni očí.

3. Portrét nevypadá jako figurína

Nejčastější problém je plastová pleť a mrtvý výraz. Tady pomáhá mluvit o věcech, které ve fotce reálně existují. Mikro detaily, nedokonalosti, odlesky v oku, typ světla. OpenAI ve svém návodu zdůrazňuje, že konkrétní popis scénických prvků a světla zvyšuje kontrolu nad výsledkem víc než obecné přídavky typu ultra detail.

Prompt šablona: Portrétní fotografie osoby ve věku X, přirozená pleť, jemné póry, drobné pihy, lehká asymetrie úsměvu, odlesk v očích, měkké světlo z okna z boku, pozadí jednoduché rozostřené, záběr od hrudi nahoru, 85mm vzhled, mělká hloubka ostrosti, přirozené barvy, bez glamour retuše, bez textu.

Chcete mít dokonalou profilovou fotku na Linkedin, do CV nebo na web? Přečtěte si náš článek s návodem, jak vytvořit profilovku pomocí AI

4. Ilustrace pro děti drží konzistentní styl

Nejčastější problém je, že každý vygenerovaný obrázek vypadá jinak. Osvědčený recept je držet pevný stylový popis a neměnit slovník. Když se mění slova, mění se vzhled. U Midjourney se dá jednotnější vzhled série podpořit tím, že se drží stejné startovací číslo náhody. U Gemini se konzistence řeší jinak. Totiž umí pracovat s obrázkem jako vstupem a pomocí textu ho upravovat, což je praktická cesta, jak držet stejnou postavu nebo scénu.

Prompt šablona: Ilustrace postavy jméno postavy, stálé znaky: oválný tvar hlavy, pihy na nose, krátké mikádo, zelené brýle, žlutý svetr. Styl plochá vektorová ilustrace, paleta tři barvy A B C, jednoduché pozadí. Scéna tentokrát: situace X. Zachovat identitu postavy, neměnit obličej ani brýle, bez textu.

5. Pozvánka počítá s textem bez nesmyslů

Text v obrázku se u některých modelů zlepšil, ale praxe u běžných kampaní pořád často končí dvěma fázemi. Nejdřív čistý vizuál s místem pro text, potom sazba v editoru, třeba v Canvě. OpenAI přímo doporučuje říct explicitně, zda text má nebo nemá být, a tím se vyhnout náhodným nápisům.

Prompt šablona: Plakátový vizuál pro událost typ X, moderní minimalistický styl, velká čistá plocha nahoře pro nadpis, grafické prvky dole, žádné písmo ani loga, kompozice na výšku, vysoký kontrast, bez textu.

6. Reels cover zůstane čitelný i na mobilu

Nejčastější problém je přeplácanost. Pomáhá popsat hierarchii prvků a negativní prostor. A hlavně poměr stran. U Midjourney je poměr stran jasně popsaný jako parametr, který mění tvar obrázku, a tím i kompozici.

Prompt šablona: Thumbnail pro video na téma X, jeden hlavní objekt výrazný a jednoduchý, pozadí čisté, silueta čitelná v malém, prostor vlevo pro nápis, bez nápisu, dramatické světlo, vysoký kontrast, bez drobných detailů, bez watermarku.

Pokud si nejste jistí, jak správně promptovat, přečtěte si o tom náš další článek. A pro pokročilé tu máme další článek o vychytaných technikách.

Ovladače a páčky: Bez nich to nepůjde

Jazyk promptu (slova) je jen polovina úspěchu. Druhou polovinou jsou takzvané ovladače generování.

1. Tajemství jménem SEED (vaše kotva)

Seed je číslo, které určuje náhodný start obrázku. Představte si, že generátor obrázků na začátku zamíchá balíček karet. Seed je číslo, které říká, jak přesně se ten balíček zamíchá. Stejné číslo znamená stejné míchání. Jiný číslo znamená jiné míchání.

Praktický dopad je jednoduchý: Při ladění se seed nemění. Při hledání nápadu se seed mění.

2. Dává smysl brát parametry jako páčky

Midjourney má vedle samotného textu promptu ještě parametry. Ty se píšou až na konec a fungují jako krátké technické instrukce, které mění chování generování. Jinými slovy, text popisuje scénu, parametry řídí, jak moc to bude divoké, stylizované nebo konzistentní. Dvě páčky se v praxi řeší nejčastěji:

→ Chaos: Tohle je ovladač rozptylu. Čím je vyšší, tím víc se jednotlivé výsledky liší mezi sebou a tím míň je to předvídatelné. Když se hledá nápad, chaos se zvedá. Když se ladí jeden konkrétní výsledek, chaos se stáhne dolů, aby šlo poznat, co udělala změna v promptu.

→ Stylize: ohle je ovladač toho, jak moc si Midjourney prosadí vlastní estetiku. Vyšší hodnota obvykle znamená víc modelové krásy a víc stylové jednotnosti, ale zároveň menší poslušnost vůči přesnému zadání. Nižší hodnota bývá doslovnější. Když výsledek vypadá až moc genericky líbivě, často pomůže stylize ubrat a přidat konkrétní detaily reality do promptu, aby se model neměl kam schovat.

U Gemini se lidé často snaží dosáhnout podobné kontroly trochu jinou cestou. Místo toho, aby řešili konkrétní pojmenované parametry jako v Midjourney, opírá se to víc o dvě věci. Jednak o přesnější popis scény, hlavně světlo, kompozici a neměnné prvky.

A pak o práci s referenčním obrázkem, kdy se vychází z jednoho výchozího vizuálu a dělají se řízené úpravy. Tím se konzistence drží i bez toho, aby člověk hledal ekvivalent chaos nebo stylize.

3. Poměr stran

Poměr stran není kosmetika. Mění kompozici, tedy i to, co model upřednostní. Midjourney popisuje, že výchozí poměr je čtverec a změna poměru mění šířku a výšku obrazu. U Gemini a dalších nástrojů to funguje stejně v principu, jen se to nastavuje jinak. Poměr stran rozhoduje o tom, kolik prostoru má scéna do šířky nebo do výšky. Tím pádem se mění kompozice, tedy co se vejde do záběru, jak velký bude hlavní objekt, kolik zůstane pozadí, kde vznikne volné místo pro text.

4. Funguje používat negativní prompt jako pojistka proti typickým chybám

Zvláštní ruce, divné povrchy, přepálené detaily, náhodné nápisy nebo logo, které tam nikdo nechtěl. Negativní prompt je na tohle jednoduchá brzda. Je to krátký seznam věcí, které se v obrázku nemají objevit. Praktický dopad: Negativní prompt se vyplatí držet krátký a opakovatelný. Ne jako román, spíš jako filtr pro jeden typ obrázků.

Rychlý slovník, který reálně řídí výsledek
Zapomeňte na zbytečná adjektiva. Tady jsou slova, která modely opravdu poslouchají:
→ Kompozice a záběr: close up (detail), wide (široký záběr), top down (pohled shora), eye level (v úrovni očí).
→ Světlo (To nejdůležitější!): soft (měkké), diffuse (rozptýlené), golden hour (zlatá hodinka), studio (studiové), high contrast (vysoký kontrast).
→ Materiály a textury: matný, lesklý, zrno papíru, film grain (filmové zrno).

Osvědčená kostra promptu

Napříč nástroji se liší názvy páček, ale principy zůstávají. Kdo zná dokumentaci k parametrům, má větší kontrolu než člověk, který sbírá magické fráze.

Začne fungovat opakovatelná kostra:

Nejdřív jedna věta zadání – co má být na obrázku.
Potom subjekt s detaily, prostředí a akce nebo póza.
Potom kompozice, záběr a perspektiva.
Potom světlo a barevnost.
Potom styl, médium a reference typu editorial photo, watercolor illustration, 3D render.
Potom technická část podle nástroje. Poměr stran, seed, stylize, chaos a podobně. U Midjourney dokumentace výslovně říká, že parametry patří na konec promptu.
Potom negativní prompt jako krátký filtr.
A nakonec ladění po jedné změně.

Když se upraví pět věcí najednou, nejde poznat, co pomohlo. Když se upraví jen jedna, je hned vidět, jestli zabralo světlo, kompozice nebo styl. Takhle se z generování stane opakovatelný postup, ne loterie.

Související články

7 tipů na prompt pro série: Jak vytvořit s AI stejné obrázky

Jak upravit fotku pomocí AI: 14 konkrétních návodů a promptů

7 tipů krok za krokem: Jak vytvořit profilovku pomocí AI

Promptování: Příklady správně položených otázek

Prompty pro AI obrázky, které fungují + 6 hotových šablon