Na výroční konferenci I/O v Kalifornii učinil Google několik oznámení týkajících se umělé inteligence, včetně nových modelů a upgradů stávajících. Jedním z nejzajímavějších oznámení byl Project Astra – multimodální asistent, který funguje v reálném čase a kombinuje schopnosti Google Lens a Gemini poskytovat vám informace z vašeho okolí.
Jak Project Astra funguje? Na konferenci Google předvedl ranou verzi Project Astra, která funguje jako chatbot založený na kameře a dokáže shromažďovat informace z vašeho okolí pomocí kamery na vašem zařízení. Jako multimodální asistent umělé inteligence může používat zvuk, video a obrázky jako vstupy a na jejich základě poskytovat potřebný výstup. Běží na modelu Gemini 1.5 Pro, díky čemuž je neuvěřitelně výkonný.
Chatbot analyzuje objekty a okolí v reálném čase a dokáže velmi rychle odpovídat na dotazy, takže je docela podobný lidskému asistentovi nebo milovanému JARVISovi Tonyho Starka. Project Astra také pracuje s nositelnými zařízeními, jako jsou chytré brýle, což znamená, že existuje velký potenciál pro integraci chatbota AI do různých zařízení.
Project Astra může lépe porozumět kontextu, ve kterém se používá, rychleji zpracovávat informace a uchovávat je pro rychlejší vyvolání. Jeho řečové schopnosti jsou také mnohem vylepšené ve srovnání s dřívějšími modely Gemini, takže zní přirozeněji a lidsky.
Co dokáže Project Astra? V krátké ukázce, kterou Google předvedl, se zdá, že Project Astra může pomoci dosáhnout hodně. Dokáže pozorovat a chápat objekty a místa prostřednictvím objektivu kamery a mikrofonu a poskytovat vám o nich informace. Můžete například namířit telefon na kus kódu a prodiskutovat jej s chatbotem nebo jej požádat, aby identifikoval objekt a jeho použití.
Podobně díky schopnostem určování polohy může Project Astra poskytovat informace o vaší lokalitě pouhým pohledem na vaše okolí. Může také uchovávat informace, které se mu zobrazují, což může být docela užitečné, pokud chcete najít nesprávně umístěné položky, jak bylo ukázáno v ukázce, když to uživateli pomohlo najít brýle.
Můžete také požádat asistenta AI o kreativní nápady, stejně jako u Gemini v telefonu. Můžete jej například požádat, aby vymyslel text písně, název hudební skupiny nebo cokoliv jiného. Projekt Astra má v zásadě za cíl být univerzálním asistentem umělé inteligence, který vám může poskytovat informace v reálném čase velmi konverzačním způsobem.
Kdy bude Project Astra k dispozici? Dosud společnost Google neoznámila dostupnost projektu Astra. Verze zobrazená v ukázce je raným prototypem, ale Google naznačil, že tyto funkce mohou být integrovány do stávající aplikace Gemini v pozdější fázi.
S Project Astra se Google snaží vést vývoj asistentů AI, aby se stali ještě užitečnějšími a snadněji se používají. Google však není jediný, kdo tento cíl sleduje. OpenAI také nedávno oznámila GPT-4o, díky čemuž je ChatGPT multimodální, což zvyšuje jeho schopnosti a efektivitu. Nový hlasový režim ChatGPT (brzy bude vydán) může také využívat video vstup z kamery zařízení při interakci s uživateli.
Právě teď je rozdíl mezi těmito dvěma v tom, že GPT-4o bude brzy k dispozici na všech zařízeních s ChatGPT, zatímco Project Astra se očekává, že bude k dispozici jako Gemini Live někdy v budoucnu, i když v současné době neexistuje žádné datum vydání. Vzhledem k tomu, že ChatGPT poháněný GPT-4o byl k dispozici dříve, se teprve uvidí, zda projekt Astra od Googlu bude dost dobrý, aby konkuroval populárnějšímu chatbotu OpenAI.
Napsat komentář