OpenAI nedávno oznámila svůj model GPT-4o, nový vlajkový model enginu, který pohání ChatGPT, svého slavného chatbota s umělou inteligencí, který byl poprvé uveden na trh v roce 2022. Tento novější model posouvá interakci mezi člověkem a počítačem na zcela novou úroveň tím, že se zdá být rychlejší a rychlejší. mnohem přirozenější.
V GPT-4o ‚o‘ znamená ‚omni‘, protože kombinuje text, obrázek a zvuk do jednoho modelu. I když nedochází k žádnému zlepšení v oblasti inteligence a uvažování oproti modelu GPT-4 Turbo, existuje spousta nových aktualizací. Je navržen tak, aby poskytoval rychlejší, lidštější reakce a dokonce dokáže simulovat emoce. Je také podstatně rychlejší při porozumění vizuálním a zvukovým vstupům. V tomto hlubokém ponoru se podíváme na funkce, které GPT-4o nabízí, a na to, jak změní způsob, jakým komunikujeme s asistenty AI. Tak se k nám přidejte a můžeme začít!
GPT-4o je výrazně rychlejší
Model GPT-4o umožňuje ChatGPT přijímat vstupy v různých formách, včetně zvuku, textu, obrázků nebo jejich kombinací. Může také poskytovat odpovědi v různých formátech. Co je na něm však nejpůsobivější, je rychlost, s jakou vám poskytuje odpovědi.
U nového modelu trvá ChatGPT jen asi 320 milisekund nebo ještě méně, než reaguje na zvukové vstupy, což se blíží době, kterou člověk potřebuje k odpovědi v konverzaci. Kromě toho je výkon GPT-4o podobný GPT-4 Turbo, pokud jde o použití angličtiny nebo psaní kódu.
Také si vede mnohem lépe, když reaguje na textový vstup v jiných než anglických jazycích a je podstatně levnější v API, protože je mnohem efektivnější než jeho předchůdce.
Má také nové rozhraní navržené tak, aby usnadnilo a zpřehlednilo interakci.
Je multimodální
Stávající hlasový režim ChatGPT se skládá ze tří modelů. První přijímá textový vstup a poskytuje výstup ve stejném formátu, zatímco druhý převádí zvukový vstup na text, který přijímá ChatGPT a poskytuje textový výstup. Poslední model převádí text na zvuk.
Tento návrh však vede ke ztrátě informací, protože model nemůže přímo interagovat se zvukovým vstupem nebo přítomným výstupem, který má emocionální prvky. S GPT-4o vytvořil OpenAI jediný multimodální model, který dokáže porozumět různým typům vstupů a přímo zpracovat požadovaný výstup.
V současnosti podporuje 50 jazyků a bude k dispozici také jako API.
Dokáže simulovat lidské emoce
Když byl ChatGPT poprvé oznámen, jednou z největších nevýhod AI chatbota pro mnoho lidí bylo, že nedokázal poskytnout emocionální reakce. S GPT-4o může ChatGPT simulovat lidské emoce a poskytovat vhodné reakce, které takové emoce integrují.
V ukázkách sdílených OpenAI je chatbot vidět, jak se směje, zpívá a dokonce ukazuje sarkasmus, když je o to požádán. To je mnohem víc, než co v současnosti umí jakýkoli jiný chatbot s umělou inteligencí, a interakce s uživateli bude mnohem příjemnější. Podle OpenAI nový model umožní ChatGPT také detekovat nálady uživatele a na základě těchto informací poskytovat adekvátní reakce.
V kombinaci se schopností používat vizuální vstupy je schopnost poskytovat emocionální reakce jednou z nejpůsobivějších funkcí, které nový model nabízí.
Nový model dokáže uložit větší množství informací
Díky GPT-4o může ChatGPT nyní lépe porozumět obrázkům, jako jsou grafy a fotografie, a také ukládat více informací o uživateli. To se také promítá do odpovědí, které mohou obsahovat větší kusy textu, což se může hodit v několika případech použití.
Můžete například požádat chatbota, aby nyní přeložil větší kusy textu a může vám pomoci s živým překladem. Protože může používat vizuální a zvukové vstupy spolu s textovými vstupy, můžete jej použít ke shromažďování informací ze snímků obrazovky, fotografií a dalších obrázků.
Vzhledem k tomu, že dokáže uložit větší množství informací, aniž by je uživatelé museli opakovat, umožňuje GPT-4o uživatelům účastnit se konverzací tam a zpět s chatbotem AI. S větším množstvím informací mohou uživatelé očekávat, že konverzace budou propracovanější.
Záruky v novém modelu
Stejně jako stávající modely GPT je i GPT-4o navržen s ohledem na určitá bezpečnostní opatření, aby byla zajištěna bezpečnost. Tréninková data byla filtrována a po trénování bylo upraveno, jak se model chová. OpenAI také vyhodnotila model AI v několika parametrech, jako je kybernetická bezpečnost a přesvědčování, aby se zabránilo nechtěným incidentům.
Kromě toho vývojáři využili pomoci více než 70 odborníků v různých oblastech, jako jsou dezinformace a sociální psychologie, aby identifikovali a zmírnili rizika, která by se mohla objevit nebo zvýšit s novým modelem. Budou také nadále monitorovat používání chatbota z hlediska budoucích rizik a v případě potřeby provádějí požadovaná opatření.
Pro začátečníky OpenAI zpřístupní pouze omezený výběr předvoleb hlasových modelů. Bude také brát v úvahu uživatelskou zpětnou vazbu pro vylepšení modelu a zajištění naprosté bezpečnosti.
Dostupnost GPT-4o
Doposud byly k dispozici dvě verze ChatGPT – bezplatná verze běžící na GPT 3.5 a placená verze, která běžela na GPT 4.0 a stála 20 $ měsíčně. Ten má přístup k většímu jazykovému modelu, který mu umožňuje zpracovávat větší množství dat.
GPT-4o bude k dispozici pro bezplatné i placené uživatele a očekává se, že bude zaveden na zařízení v nadcházejících týdnech. Na mobilních zařízeních bude k dispozici prostřednictvím stávající aplikace, která bude aktualizována, a kromě webové verze pro desktopové uživatele bude k dispozici také nová desktopová aplikace pro macOS (verze pro Windows přijde později v tomto roce).
Aby bylo možné rozlišit mezi bezplatnými a placenými uživateli, OpenAI nabídne placeným uživatelům pětkrát větší kapacitu, než jaká bude nabízena uživatelům zdarma. Jakmile vyčerpáte svůj limit, budete přepnuti zpět na ChatGPT 3.5.
Oznámení OpenAI týkající se GPT-40 přichází jen jeden den před výroční konferencí Google I/O Developer Conference, kde se očekává, že Google učiní svá vlastní oznámení týkající se AI. OpenAI také slíbilo, že další oznámení se chystají, takže nemůže být pochyb o tom, že konkurence mezi těmito dvěma rivaly se teprve začíná přiostřovat.
I když nevíme, kdy OpenAI odhalí více změn ve svém modelu AI, víme, že GPT-4o míří do zařízení, na kterých běží ChatGPT globálně. Držte tedy palce a počkejte, až se aktualizace objeví na vašem zařízení. Do příště!
Napsat komentář