Google inwestuje w AI-kreatywność: Veo 3 tworzy filmy z dialogami i efektami dźwiękowymi.


Google zaprezentował sztuczną inteligencję do generowania filmów z audio
Firma Google stworzyła Veo 3 - sztuczną inteligencję, która może generować filmy i włączać do nich audio. To nowe narzędzie konkuruje z generatorem filmów Sora od OpenAI, ale wyróżnia się możliwością synchronizacji audio z wideo.
Ellie Collins, wiceprezydent ds. produktów Google DeepMind, wyjaśniła, że Veo 3 działa z zapytaniami tekstowymi i wizualnymi, zapewnia precyzyjną synchronizację ruchu warg oraz realistyczną fizykę. Narzędzie jest dostępne dla użytkowników planu Ultra od Google za 249,99 USD miesięcznie, a także dla platformy korporacyjnej Google Vertex AI.
Firma Google zaprezentowała także Imagen 4 do tworzenia obrazów wyższej jakości na podstawie zapytań użytkowników oraz narzędzie Flow do tworzenia filmów. Te nowości pojawiły się w kontekście rosnącej popularności w zakresie obrazów i generatywnej sztucznej inteligencji wideo.
Historia Google z generatorami obrazów ma swoje wyzwania. W zeszłym roku firma ponownie uruchomiła Imagen 3 z powodu problemów, a współzałożyciel Sergey Brin przyznał, że miało to miejsce z powodu niewystarczających testów. Ponadto Google zaktualizowało swój generator filmów Veo 2 i zaprezentowało model generacji muzyki Lyria 2 dla twórców i biznesu.
Czytaj także