Pokrok v oblasti umělé inteligence se promítá dovětšiny oblastí dnešního života, umění nevyjímaje. Málokdo si ještě pár let zpátky dokázal představit, že bychom díky zadání pár klíčových slov dokázali vygenerovat obraz, který jakoby vzešel z rukou slavného umělce.
Princip rozptylu
Rozptyl (angl. diffusion) je principem generování obrazových děl. Později zmíněné programy, které se tvorbou zabývají, pracují tak, že rozpoznávají význam mezi obrazem a textem, tj. klíčovými slovy, která si žadatel zadá.
V praxi to funguje tak, že si spustíte program a v anglickém jazyce popíšete, jaký obraz chcete. Pokud jste milovníkem ovoce, můžete zadat např. "jablka a hrušky v míse na stole s ubrusem a karafou červeného vína".
Cvičení dělá mistra
Možná vás to překvapí, ale i programy, které za vytvářením obrazů stojí, musely poměrně hodně trénovat.
Neuronová síť programu, která je jakýmsi mozkem celého procesu, trénovala malby na obrovské databázi obrázků, které byly popsány klíčovými slovy. Tyto databáze mají nespočet příkladů (např. později zmíněný program DALL·E 2 má k dispozici čtyři stovky milionů snímků, Midjourney deset milionů a Stable Diffusion až dvě miliardy).
DALL·E 2, Midjourney, Stable Diffusion
Na trhu jsou v současné době dostupné tři programy ve fázi beta testování, a to DALL·E 2 od firmy OpenAI, jejímž vlastníkem je Elon Musk, dále program od Midjourney a v neposlední řadě i Stable Diffusion od firmy Stability AI.
Pokud byste měli zájem si vyzkoušet generování obrazu, doporučujeme Midjourney, který je částečně zdarma pro každého, kdo pracuje s komunikační službouDiscord.
V čem je háček?
Bezpochyby se nejen v oblasti umělé inteligence, ale i v oblasti grafických editorů a počítačové grafiky jako takové dosáhlo obrovského pokroku. Bohužel to ale není tak bezproblémové, jak se může zdát. Některé překážky jsou zanedbatelné, jiné poměrně závažné.
Jestliže je vám blízký styl drsných obrazů plných sexuality a násilí (jako např. Francisco de Goya), programy vám bohužel tak lehce neposlouží. Mají v sobě zabudovaný anticenzurní prvek, který zablokuje jakoukoli nahotu nebo násilí. Šikovný "jazykář" ale tuhle záležitost dokáže obejít zadáním vícera klíčových slov.
Další problém nastává v oblasti autorského práva. Zadáte-li si v pokynech něco jako "přístav při východu slunce ve stylu Moneta", dostanete obraz ve stylu Monetova impresionismu. Dříve nebo později se nepochybně setkáme s různými žalobami skrze různé falsifikáty a napodobeniny, obzvláště v situacích, kdy budou vygenerovaná díla nabízena k prodeji.
Ryan Murdock, inženýr pro strojové učení za firmu Adobe tvrdí, že dobrá dostupnost a obrovské množství vizuálního obsahu nových programů může znamenat konec fotobank a podobných služeb.
Fabian Stelzer zase upozorňuje na nebezpečí šíření dezinformací. Sám si to vyzkoušel tak, že nechal programem vygenerovat falešné fotografie z fingovaného přistání na Měsíci v šedesátých letech v Hollywoodu.
Jsou programy při takovém množství zádrhelů přínosem?
Po přečtení výše zmíněných "háčků" si možná kladete otázku, jestli jsou programy vůbec v něčem dobré. Za nás rozhodně ano! Proč?
Odpovědí je především ušetřený čas. Každý zručnější uživatel grafických editorů od firmy Adobe si dokáže napodobeninu vytvořit sám, ale vynaložený čas na taková díla je enormní. Zde do programu zadáte pár klíčových slov (v Midjourney jich můžete zadat opravdu dost) a než dopijete kávu, máte dílo na světě.
Další světlou stránkou je samotný technologický pokrok. Je to krok kupředu, který v momentě, kdy bude mít vychytané všechny legislativní záležitosti, bude nezpochybnitelným přínosem např. v oblasti ilustrací knih a propagačních plakátů (nejen k výstavám či představením, ale i k besedám o prevenci závažných onemocnění apod.).