ChatGPT, Bing, Bard nebo Claude? Srovnání nejpoužívanějších velkých jazykových modelů

Hovoříme-li o umělé inteligenci, ve většině případů máme na mysli velké jazykové modely (LLM). Tyto pokročilé systémy jsou hnacím motorem většiny aplikací založených na AI a existuje pouze několik základních modelů, které vyvinula „hrstka“ organizací. Každá z těchto společností poskytuje přímý přístup ke svým modelům prostřednictvím chatbotů.

OpenAI vyvinula modely GPT-3.5 (volně dostupná verze) a GPT-4, které pohánějí ChatGPT a vyhledávač Bing od Microsoftu (k přístupu lze využít prohlížeč Edge). Google má naopak celou řadu modelů, které se skrývají pod označením Bard. Společnost Anthropic je autorem modelů Claude a Claude 2.

Placená verze ChatGPT-4 využívá pluginy k propojení s internetem a dalšími aplikacemi a i když většina z nich nemá příliš vysokou užitnou hodnotu, určitě stojí za to některé vyzkoušet (obzvláště plugin Wolfram). Code Interpreter je extrémně výkonná verze ChatGPT, která umí spouštět programy v jazyce Python. 

Bing, který je mixem GPT-4 a 3.5, dokáže mimo jiné generovat/zobrazovat obrázky a číst dokumenty ve webovém prohlížeči (v režimu Sidebar). Bing je připojen k internetu, a i když jeho používání přináší mnoho “podivností” (viz náš tutoriál Bing), jeho možnosti jsou obrovské.

Bard od společnosti Google je poháněn různými základními modely, z nichž nejnovějším je model PaLM 2, ale jeho výsledky jsou zatím spíše zklamáním (ze všech zmíněných modelů nejvíce halucinuje). Bard má schopnost spouštět omezeně kód a interpretovat obrázky (včetně extrakce textu z obrázků).

Společnost Anthropic nedávno zveřejnila model Claude 2. Claude je mimořádný díky velkému kontextovému oknu. Dokáže uchovat v aktivní paměti téměř celou knihu nebo více PDF souborů. 

Využití AI pro generování textu

Nejlepším nástrojem pro generování textu (v AJ i v ČJ) je momentálně model GPT-4. Ten lze využít zdarma prostřednictvím Bingu (v „kreativním režimu“) nebo zakoupením předplatného ChatGPT Plus za 20 dolarů měsíčně. Claude 2 následuje těsně na 2. místě a je zatím přístupný zdarma (pro registraci z ČR nutno použít VPN).

Tvoření konceptů:

Koncepty blogových příspěvků, propagačních materiálů, projevů, přednášek, vědeckých článků či pohádek pro děti zvládají velké jazykové modely většinou velmi dobře. Kvalita výstupu ale vždy záleží na kvalitě vstupního zadání – promptu (doporučujeme projít si naše tutoriály).  

Příklad: LLM v roli popularizátora vědy

Pozn: Bard v této ukázce halucinuje, technologie se k léčbě AIDS zatím nepoužívá

Vylepšení vlastních textů

Poskytněte vybranému modelu svůj text a požádejte o vylepšení obsahu, struktury nebo o doporučení, jak jej vylepšit pro konkrétní účel/publikum. Požádejte např. o vygenerování deseti návrhů v radikálně odlišných stylech, o přidání důrazu na konkrétní tvrzení či přidání příkladů.  

Příklad: Vylepšení textu

Pomoc s úkoly

AI dokáže udělat věci, na které nemáte čas. Využijte ji jako asistenta na psaní e-mailů, vytváření šablon pro projektové žádosti nebo pro psaní závěrečných zpráv. 

Příklad: Napiš email

AI a „halucinace“

V rámci snahy uspokojit vaše požadavky může AI velmi snadno „halucinovat“ a generovat přesvědčivý, ale zcela falešný obsah. Pokud vygenerovaný text uživatel převezmete pro další použití, je za správnost obsahu zcela zodpovědný. Proto je nezbytně nutné faktickou správnost vygenerovaných textů vždy kriticky zhodnotit a zkontrolovat (týká se obzvláště referencí a citací u modelů, které nejsou přímo propojené s internetem). Bing obecně halucinuje méně než ostatní modely, díky připojení může skutečně poskytovat relevantní fakta. 

Příklad: Reference

Poznámka: Všechny reference jsou vyhalucinované

Poznámka: Všechny reference jsou vyhalucinované

Poznámka: Odkazy jsou funkční, ale vedou k jiným studiím (shoda v tématu)

Poznámka: První studie opravdu existuje, ale je DOI je špatně. Zbytek vyhalucinován.

Poznámka: Všechny reference jsou vyhalucinované

Riziko halucinací lze zmenšit správným používáním a porozuměním limitů jazykových modelů. Je důležité si uvědomit, že AI se sama nevysvětluje, jen vás přesvědčuje, že to dělá. Pokud se zeptáte, proč něco napsala, dá vám přesvědčivou odpověď, která je zcela vymyšlená. Když se zeptáte na její myšlenkový proces, nezkoumá své vlastní akce, jen generuje text, který zní, jako by to dělala. 

Generování nápadů a kreativita

Navzdory všem svým limitům jsou jazykové modely ideálním nástrojem pro generování nápadů. S vhodným vedením můžete AI “donutit” být velmi kreativní. I v této kategorii v současnosti nejlépe obstojí GPT-4. 

Příklad: Test kreativity

Práce s dokumenty a daty

Od analýzy dat až po zpracování rozsáhlých textů, AI může výrazně zvýšit vaši produktivitu a efektivitu, zejména se jedná o tyto dva klíčové nástroje: Code Interpreter a Claude 2.

Práce s daty a kódem: Advanced Data Analysis (dříve Code Interpreter)

Jedná se o verzi GPT-4, která umožňuje nahrávat soubory různých formátů a nechat model psát a spouštět kód, přičemž následně umožní stahovat výsledky v mnoha formátech. Může být použit k přímé analýze dat (i když budete potřebovat dostatečné znalosti o statistice a datech, abyste mohli ověřit jeho práci), k vytváření různých druhů souborů, webových stránek a dokonce i her (v současné době chystáme tutorial).

Pro seznámení s Code Interpreter doporučujeme následující zdroje:

OpenAI ChatGPT-4 Code Interpreter – (nejen) analýzy dat snadno a rychle

Code Interpreter: 10 praktických příkladů

Práce s dokumenty: Claude 2 a Bing Sidebar

Pokud se vaše práce týká rozsáhlých textů, zejména PDF formátu či práce s více dokumenty naráz je Claude 2 ideální volbou. 

Bing Sidebar je další užitečný nástroj pro práci menšími dokumenty a webovými stránkami. Jako součást prohlížeče Edge umí „vidět“, co máte v prohlížeči právě otevřeno a umí s těmito informacemi dále pracovat (i když velikost kontextového okna je omezená).

Využití AI pro práci s textem může zahrnovat různé úkoly, jako je například požádání o shrnutí složitých akademických článků nebo položení následných otázek k materiálu: jaké jsou důkazy pro tento přístup? Jaké byly použity metody? Jaké jsou závěry autorů?

Závěrem

Rychlý technologický pokrok v oblasti umělé inteligence znamená, že nástroje, které máme dnes k dispozici, jsou pravděpodobně ty nejméně pokročilé, jaké kdy budeme mít. Během posledních měsíců jsme byli svědky překotného vývoje této technologie a není pochyb o tom, že již dnes lze tohoto mini-průvodce považovat za zastaralého.

Co se ale nemění jsou zejména tyto dvě skutečnosti:

1) AI je skvělý nástroj, ale ne vždy je to ten správný nástroj
Přestože umělá inteligence může přinést mnoho výhod, je důležité pečlivě zvážit, zda je to opravdu správný nástroj pro účel, ke kterému ho plánujete použít. Každá AI má své slabiny a omezení, které mohou ovlivnit její vhodnost pro konkrétní účel.

2) Etické otázky použití AI
V souvislosti s použitím umělé inteligence existují řada etických otázek, kterých byste měli být vědomi. AI může být použita k porušení autorských práv nebo k manipulaci. Jakým způsobem je konkrétní model AI sestaven a kdo těží z jeho používání, jsou často složité otázky, které nejsou v tuto chvíli zcela jasné.

Závěrem je nutno zopakovat, vy jako uživatel jste vždy zodpovědný za etické použití těchto nástrojů.

֍֍֍

Text je upraveným a kráceným překladem článku profesora Ethana Mollicka: How to Use AI to Do Stuff: An Opinionated Guide – přečte si originál zde

Náhled na detail srovnávací tabulky

Akademikům i studentům doporučujeme video-tutoriály prof. Mollicka: Practical AI for Instructors and Students a blog k AI nástrojům: One Useful Thing