D-ID, společnost za Deep Nostalgia, vám umožňuje vytvářet videa generovaná umělou inteligencí z jediného obrázku • TechCrunch

Izraelská společnost AI DĚLALkterá poskytla technologii pro projekty jako Deep Nostalgia, se spouští novou platformu kde uživatelé mohou nahrát jeden obrázek a text a vytvořit video. S tímto novým webem tzv Studio kreativní realitySpolečnost se zaměřuje na sektory jako firemní školení a vzdělávání, interní a externí komunikace společností, produktový marketing a prodej.

Používání platformy je velmi jednoduché: Uživatelé mohou nahrát obrázek přednášejícího nebo vybrat jeden z předem vytvořených přednášejících a zahájit proces vytváření videa. Placení uživatelé mají přístup k prémiovým moderátorům, kteří jsou „výraznější“, protože mají lepší výrazy obličeje a pohyby rukou než výchozí. Poté mohou uživatelé buď napsat text ze skriptu, nebo jednoduše nahrát zvukový klip něčí řeči. Uživatelé si pak mohou vybrat jazyk (platforma podporuje 119 jazyků), hlas a styly jako veselý, smutný, vzrušený a přátelský.

Algoritmy společnosti založené na AI vygenerují video na základě těchto parametrů. Uživatelé pak mohou video distribuovat kdekoli. Firma tvrdí, že algoritmu trvá vygenerování klipu pouze polovinu doby trvání videa, ale v našich testech trvalo vygenerování minutového videa několik minut. To se může změnit v závislosti na typu přednášejícího a zvoleném jazyce.

„Pandemie COVID-19 zrychlila potřebu digitálního obsahu po celém světě. Velkým problémem organizací je tvorba vzdělávacího obsahu. Čtení dokumentů a procházení prezentací může být suché a nudné. Navíc musí utratit tisíce dolarů za najmutí herců a vytvoření vzdělávacích videí. Takže používáme naši umělou inteligenci k vytváření prezentujících a lektorů, aby znovu představili lidi a udělali obsah poutavější a efektivnější,“ řekl Gil Perry, generální ředitel D-ID, v rozhovoru pro TechCrunch.

Perry poukázal na mnoho případů použití této technologie – od vícejazyčné zprávy od generálního ředitele zaměstnancům až po personalizovaná přání uživatelům organizace.

D-ID spustilo studio k testování v polovině srpna, aby odstranilo chyby před veřejným spuštěním. A i když je jejím hlavním cílem vyhovět společnostem všech velikostí, společnost to vidí velký zájem od tvůrců na platformě.

Vytváření urážlivých deepfake videí je riziko. To je důvod, proč izraelská firma zavedla zábrany, jako je filtrace nadávek a rasistických poznámek, stejně jako rozpoznávání obrázků, aby se zabránilo používání tváří slavných lidí. Používá se Rozhraní API pro moderování textu Microsoft Azure k odstranění sexuálních poznámek a urážlivého jazyka ve video scénářích. D-ID uvedl, že podmínky používání platformy zakazují uživatelům vytvářet politická videa. V případě porušení některého z těchto pravidel může společnost pozastavit účet porušovatele a odstranit jeho video z knihovny.

Společnost D-ID získala v březnu 25 milionů dolarů ve financování série B vedené společností Macquarie Capital – s celkovým počtem 47 milionů dolarů k dnešnímu dni. Až dosud se společnost spoléhala na to, že ostatní používají její API k vytváření obsahu – Deep Nostalgia je toho zářným příkladem – s klienty jako Modelez, Warner Bros. a indická aplikace pro krátké video Josh. Nyní společnost rozšiřuje své produkty, které vydělávají peníze, uvedením zásuvného modulu PowerPoint spolu s touto samoobslužnou platformou. Plug-in přidává k balíčku interaktivního prezentéra, takže uživatelé nemusí pouze číst snímky. Mohou si vybrat mezi různými avatary, hlasy a jazyky – stejně jako samoobslužná platforma. Ale v tuto chvíli neexistuje žádné ustanovení, že byste měli vlastního prezentujícího.

Při uvedení na trh si uživatelé budou moci zdarma zaregistrovat 14denní zkušební účet a vytvořit až pět minut 720p videa generovaného umělou inteligencí. Poté mohou platit 49 dolarů měsíčně za přístup k 15 minutám full HD videa generovaného umělou inteligencí, pluginu PowerPoint a e-mailové podpoře.

Spoluzakladatelé D-ID Eliran Kuta, Gil Perry a Sella Blondheim

Uživatelé mohou také nahrávat své vlastní zvukové klipy pro hlasové klonování. Společnost navíc pracuje na nástroji, který uživatelům umožní nahrávat vlastní záběry, aby AI naučila být výraznější, aby mohla lépe napodobovat osobu ve videu. Všechny tyto funkce budou omezeny na podnikovou úroveň společnosti.

Zatímco společnost čelí konkurenci jako Rephrase.ai a Soul Machines v oblasti videa generovaného umělou inteligencí tvrdí, že sotva existují společnosti, které tvrdí, že generují vysoce kvalitní videa z jednoho obrázku.

Perry řekl, že cílem D-ID není omezit se na firemní školení, komunikaci a marketingová videa. Má také ambice usnadnit překlad videohovorů v reálném čase a klonovat prezentující – díky tomu se na videu místo vás objeví avatar, když budete diktovat zvuk.

Společnost také zvažuje, že se stane klíčovým hráčem ve vývoji web3/metaverse. „Vzhledem k tomu, že máme zkušenosti s generováním videí z jednoho obrázku. Přemýšlíme o způsobech, jak vytvořit digitální avatary pro metaverse,“ řekl Perry.

Leave a Comment

Your email address will not be published.