Vzhledem k tomu, že se považuji za "evangelizátora" použití generativní umělé inteligence v byznysové praxi, řada lidí se mě při rozhovorech ptá, jaké služby a jakým způsobem skutečně sám používám.
Rozhodl jsem se proto napsat, sám bez AI ;-), tento příspěvek na blog, který na tyto otázky odpoví.
Nejčastější službou, kterou používám je ChatGPT. Používám ho ve free verzi, tedy v tuto chvíli je to model (Large Language Model) 3.5. Vyhovuje mi rozhraní a výstupy považuji za dostatečné. Navíc po prvních "zácpách" v provozu je tento model dostupný po většinu dne bez omezení. V případě použití LLM verze 4 je potřeba si předplatit službu ChatGPT Plus za 20 USD/měsíčně.
Službu používám primárně v angličtině, ze zvyku, ale mám vyzkoušené, že interakce v češtině nabízí dostatečně kvalitní výstupy. Můj primární zájem je vytváření ideí, tzv. divergent ideation při řešení jakéhokoli problému. Je to jako bych měl několik spolupracovníků, kdykoli k dispozici, kterým vysvětlím problém a požádám je o návrhy řešení (Generate). Model v této bezplatné verzi vytvoří většinou 10 návrhů z nichž ve většině případů 3-4 jsou zajímavé a proto požádám doplňujícími dotazy o jejich rozpracování (Elaborate), na které získám detailnější popis, tzv. convergent ideation. Neznamená to, že nemám své ideje, ostatně většinou model nepřijde s něčím zcela převratným, ale při tomto kreativním myšlení je důležité mít rychle další názor. V případě, že mám ideu, kterou model nepřinesl, exaktně ho požádám o to zda vidí jako řešení problému moji ideu (Evaluate). Ta lze dále diskuzí rozpracovávat. Tímto způsobem pracuji s modelem asi tři měsíce, 2-3 týdně, a jsem navýsost spokojen. Pro použití musíte mít vytvořen účet a díky tomu si model pamatuje všechny konverzace, které jste s ním vedli a můžete se tak k nim kdykoli vrátit. Záběr mých projektů je velmi široký a tudíž mě nepřestává udivovat schopnost modelu během několika vteřin přijít s něčím, na čem jsem přemýšlel třeba několik hodin. Nevedu s modelem filozofické diskuze a ani se ho nesnažím nachytat na neznalostech konkrétních věcí, které byly mnohokrát popsány. Nesdílím s ním ani osobní informace, i když je mi jasné, že všechny konverzace jsou archivované a pravděpodobně dále využívané firmou OpenAI, která za ChatGPT stojí. Často také poskytuji zpětnou vazbu, když už za model nic neplatím :-)
Druhou oblastí, na kterou ChatGPT používám je korekce delších anglických textů. Text stačí v "uvozovkách" zkopírovat a chtít opravit (Correct). Ideální je také na začátku popsat účel textu. Je to článek na web, dopis, CV apod. Model pak podle toho volí "konstrukci" vět. Chcete li tedy vypadat před obchodními partnery velmi profesionálně, je toto, ideální nástroj. Limitem samozřejmě není angličtina. Četl jsem, že někdo textem v čínštině oblafl také tamní soudruhy.
Když jsme se dostali k textům, nemohu nezmínit službu Jasper. Jasper sice nevytrénoval vlastní LLM, ale používá ChatGPT s velmi smysluplně vytvořeným rozhraním pro generování textů, vlastními šablonami a dalším. V tomto rozhraní si na rozdíl od komunikačního rozhraní ChatGPT můžete nastavit všechny parametry, které ke zdárnému výsledku potřebujete, tedy délku textu, brief - popis tématu a například jakým tónem má text vyznívat (jako Hemingway ;-)), cílovou skupinu čtenářů atd. Jasper je integrován s překladatelskou službou DeepL a vytváří tak výsledky také v češtině. Jasper je ideální tool pro toho, kdo potřebuje často vytvářet originální content (Jasper má garanci, že je plagiarism free). Jasper není zadarmo, ale s cenou cca 80 USD/měsíc se určitě vyplatí. Používá ho pravidelně pár mých známých a dlouhodobě vyjadřují velkou spokojenost.
Poslední službou, kterou občas používám je Stable Diffusion. Je to opět placená služba, která umí z popisného textu vygenerovat obrázek. Moc ovšem nedoporučuji přímo rozhraní na jejich webové stránce, ale speciálně vytvořenou nadstavbu, která se jmenuje Dream Studio . Existuje ještě starší verze Dream Studio Lite, která je podle mě ještě povedenější. U této služby bych se zastavil neboť není zcela jednoduché, bez jisté znalosti, dostat uspokojivý výsledek. A vzhledem k tomu, že se jedná o službu placenou, podělím se o svou zkušenost. V rozhraní nastavujete řadu parametrů, kdy "Style" je jeden z těch srozumitelnějších a není třeba vysvětlovat. Dalším je prompt. Prompt používá 9 kategorií klíčových slov, kterými jsou: Subject, Medium, Style, Artis, Website, Resolution, Additional details, Color, Lighting. Sepsat správně prompt znamená mít, či nemít odpovídající výsledek. Vytvářením promptů pro Stable Diffusion by šel zabrat celý samostatný blog. Doporučím proto internet. Na toto téma existuje řada tutorialů, videí atd. Tam je vysvětlena také modifikace negativním prompt. Pokud jde o použití obrázku, ten bych doporučil vždy, kdy je to jen trochu možné, doberete se dříve odpovídajícímu výsledku. Obrázek je vlastně takový mustr, který zjednoduší pochopení, co vlastně chcete. K obrázku se váže Image strength, tedy jakým způsobem se má obrázek do výsledku promítnout. Smysluplné jsou hodnoty kolem 40-50%. 100% znamená, že dostanete v podstatě vygenerovaný ten samý obrázek :-). V pokročilém nastavení doporučuji držet hodnoty, které jsou defaultně nastaveny, tedy Prompt strength min. 5 a množství iterací nazvané Generation steps alespoň 40. Seed number je důležité číslo, které odkazuje k již vygenerovanému obrázku a je dobré, když chcete upravovat něco co jste rozdělali. Seed number je uvedeno v detailu u popisu obrázku.
Tato fotka mé holčičky byla použita jako výchozí obrázek pro vygenerování obrázku s těmito parametry:
Style: Cinematic
Prompt: Dog with sun glasses and small hat, blur background, little bit backlight, very artistic
Image strength: 50%
Ostatní parametry defaultně
Seed number tohoto obrázku: 1122906507, výsledný: 137606630
Jeden z výsledných obrázků pak vypadá takto
Kdybych chtěl větší fotorealističnost obrázku, změnil bych Style na Realistic a Generation steps na 50.
Tyto tři služby jsou tedy těmi, které prakticky používám a mohu je vřele doporučit. Existuje však řada dalších, o které jsem jen zavadil při jedné, dvou příležitostech nebo jsem jen o nich četl a ty bych si doporučit nedovolil, byť samozřejmě mohou být podobně zajímavé.
Doplnění dne 15.8. Jasper používá místo ChatGpt nově model Claude 2 od společnosti Anthropic.