Další model umělé inteligence se připojil k moři modelů umělé inteligence a tento je opět od OpenAI. OpenAI již letos vydala GPT-4o, která měla být efektivnější než GPT-4. Stále to však bylo poměrně drahé a mohlo to vydělat docela peníze, zejména pro vývojáře, kteří potřebují volat model AI přes API pro své aplikace opakovaně během dne.
V důsledku toho se vývojáři obrátili na levnější malé modely AI od konkurentů, jako je Gemini 1.5 Flash nebo Claude 3 Haiku.
Nyní OpenAI uvádí na trh GPT-4o mini, jejich dosud nejhospodárnější model, se kterým také vstupuje do malého modelového prostoru AI. Zatímco GPT-4o mini je jejich nejlevnější model, nedosahuje tak nízkých nákladů snížením inteligence; je chytřejší než jejich stávající model GPT-3.5 Turbo.
Podle OpenAI dosáhl GPT-4o mini 82 % v MMLU (Measuring Massive Multitask Language Understanding), čímž překonal mnoho modelů; toto jsou příslušná skóre různých modelů: GPT-3.5 Turbo (70 %), Claude 3 Haiku (75,2 %) a Gemini 1.5 Flash (78,9 %). GPT-4o dosáhl v tomto benchmarku 88,7 %, přičemž Gemini Ultra se může pochlubit nejvyšším skóre – 90 % (nejedná se však o malé modely AI).
GPT-4o mini je dnes k dispozici uživatelům ChatGPT Free, Team a Plus a také vývojářům. Pro uživatele ChatGPT v podstatě nahradil GPT-3.5; GPT-4o mini bude model, na který se konverzace jako výchozí použije, jakmile vám dojdou bezplatné dotazy GPT-4o. Vývojáři budou mít stále možnost používat GPT-3.5 prostřednictvím API, ale nakonec bude zrušeno. Uživatelé ChatGPT Enterprise získají přístup ke GPT-4o mini příští týden.
Jak bylo uvedeno výše, GPT-4o mini se zaměřuje na pomoc vývojářům najít pro jejich aplikaci model s nízkou cenou a latencí, který je také schopný. Ve srovnání s jinými malými modely vyniká GPT-4o mini v úlohách uvažování v textu i vidění, matematickém uvažování a kódování a také v multimodálním uvažování.
V současné době podporuje jak text, tak vizi v API, s podporou textových, obrazových, obrazových a zvukových vstupů a výstupů na plánu budoucnosti.
GPT-4o mini má kontextové okno 128 000 tokenů pro vstup a 16 000 tokenů pro výstup na požadavek, přičemž jeho znalosti sahají až do října 2023. Dokáže také zpracovat neanglický text poměrně levně.
Napsat komentář