Uvedení OpenAI’s Sora otevřelo dveře aplikacím pro generování videa s umělou inteligencí, které dokážou vytvářet krátké klipy z textových výzev. Nyní se do boje vrhl také Google, když tento týden na výroční konferenci I/O Developer Conference oznámil svou vlastní aplikaci AI pro generování videa, Veo.
Nicméně, stejně jako mnoho dalších nově oznámených nástrojů AI, nový generátor videa zatím není k dispozici pro veřejné použití. Google má v plánu umožnit umělcům a tvůrcům vyzkoušet tento nástroj prostřednictvím crowdsourcingových cvičení, což může pomoci jej vylepšit. Zde je to, co jsme se dozvěděli o Google Veo.
Co umí Veo?
Google Veo dokáže generovat 1080p videa, která trvají déle než minutu, a můžete je také upravovat pomocí písemných pokynů. Může zajistit, že snímky jsou vizuálně konzistentní a uživatelé mohou použít jednu výzvu nebo řadu výzev, které vytvářejí příběh. Nástroj může zahrnovat filmové efekty, jako jsou letecké záběry, a vytvářet vysoce detailní scény.
Při vytváření videí pomocí Veo můžete dosáhnout realismu, surrealismu a dokonce animace. Kromě toho vám umožňuje používat filmařské příkazy a rozumí pojmům jako „letecký snímek“ a „časosběr“. Ve srovnání s dřívějšími generátory videa s umělou inteligencí, které Google oznámil, nabízí Veo větší kontrolu a zároveň poskytuje kvalitnější videa.
Veo také podporuje maskované úpravy, které umožňují provádět úpravy konkrétních částí videa. Můžete tak učinit zahrnutím oblasti masky do výzvy a obrázky lze také použít spolu s textovými výzvami ke generování videí.
V takovém případě použije poskytnutý obrázek jako referenci a vygeneruje video ve stejném stylu, jako je následující video, které bylo vygenerováno pomocí obrázku alpak na sobě pletených svetrů a výzvy Alpacas dancing to the beat
.
Jak Veo funguje?
Modely video AI musí správně porozumět výzvě, kterou poskytují, a kombinovat tyto informace s dostupnými referencemi. Veo bylo navrženo tak, aby bylo výjimečně dobré v porozumění přirozenému jazyku a vizuálním prvkům, což mu umožňuje přesně generovat videa, včetně těch s několika detaily.
Z tohoto důvodu vám může výzva typu „like“ Timelapse of a common sunflower opening, dark background
poskytnout velmi kvalitní video.
Podle Googlu Veo vylepšuje jiné nástroje pro generování videa, které společnost oznámila dříve, jako je Lumiere, VideoPoet, WALT atd., a to pomocí využití komprimovaného latentního videa. Na rozdíl od těchto nástrojů je Veo trénováno na podrobné video titulky, což pomáhá AI lépe porozumět výzvám.
Google uvádí, že generátor videa se spoléhá na latentní difúzní transformátory, které zajišťují konzistenci a brání postavám a předmětům v blikání a přeskakování mezi scénami. Používá také latentní obrazy, což jsou komprimované reprezentace videa, díky nimž je efektivnější a pomáhají zlepšit výkon. Díky tomu může Veo generovat vysoce kvalitní videa za kratší dobu.
Videa, která vygenerujete pomocí Veo, budou opatřena vodoznakem pomocí SynthID společnosti Google, které používá k identifikaci obsahu generovaného umělou inteligencí, podobně jako to dělá Sora od OpenAI prostřednictvím standardu Coalition for Content Provenance and Authenticity (C2PA).
Kromě toho existují procesy kontroly zapamatování a bezpečnostní filtry, které pomáhají snížit rizika zkreslení, autorských práv a ochrany soukromí. Navzdory těmto technologiím a procesům Veo stále potřebuje určité zlepšení, protože pozadí má stále tendenci se posouvat a velmi detailní oblasti se nezdají příliš dobře poskládané. To je důvod, proč Google umožňuje testování pouze několika tvůrcům.
Jak můžete používat Veo?
Jak bylo uvedeno výše, Veo není v současné době k dispozici pro veřejné použití a Google umožňuje nástroj vyzkoušet pouze několika vybraným tvůrcům. Mohou si to vyzkoušet pomocí VideoFX, dalšího experimentálního nástroje dostupného v Google Labs, kde jsou přítomny všechny produkty Google, které jsou v testování.
Pokud jste tvůrci a chcete vyzkoušet Veo,
- Navštivte web Google Labs a přidejte se do pořadníku.
- Zadejte své údaje a odešlete je.
- Počkejte, až Google váš příspěvek zkontroluje. Pokud to uzná za vhodné, budete si moci Veo vyzkoušet.
Google Veo je nejnovější z dlouhé řady videogenerátorů poháněných umělou inteligencí oznámených společností Google a zdá se, že jde o dosud nejvýkonnější. To vám umožní nejen vytvářet videa pomocí různých stylů a efektů, ale také snadno upravovat vytvořená videa.
Vysvětlili jsme, jak se mohou tvůrci zařadit do čekací listiny a vyzkoušet si nástroj na vlastní kůži, ale není ani slovo o tom, zda bude Veo veřejně spuštěno. Google pouze naznačil, že některé funkce tohoto nástroje by se mohly dostat do šortek YouTube, takže se máme na co těšit.
Napsat komentář