Generator tekstu na wideo Google Lumiere jest obsługiwany przez sztuczną inteligencję

Google (NASDAQ: GOOGL) ogłosił nowy model sztucznej inteligencji (AI), zaprojektowany do generowania realistycznych filmów z funkcjami edycji w czasie rzeczywistym.

Badacze Google, nazywani „Lumiere”, opisują nową ofertę jako model dyfuzji w czasie i przestrzeni, umożliwiający przekształcanie tekstu i obrazów w filmy. Lumiere wykazuje biegłość w syntezowaniu filmów w ramach oferty, którą eksperci branżowi określają jako „najnowocześniejszą”.

Filmy generowane przez sztuczną inteligencję były krytykowane za brak realizmu, ograniczenia danych, stronniczość i precyzyjną kontrolę, co budzi wątpliwości co do przyszłości oferty.

„Wprowadzamy Lumiere — model dyfuzji tekstu na wideo, przeznaczony do syntezy filmów przedstawiających realistyczny, różnorodny i spójny ruch — co stanowi kluczowe wyzwanie w syntezie wideo” – czytamy w artykule.

Jednak Google próbuje rozwiązać ten problem, wprowadzając architekturę czasoprzestrzenną U-Net, która pozwala określić czas trwania filmu. Poprzednie modele generacji wideo generowały klatki kluczowe przed przystąpieniem do tymczasowej superrozdzielczości, co było procedurą obarczoną kilkoma wadami.

„Wdrażając zarówno przestrzenne, jak i (co ważne) czasowe próbkowanie w dół i w górę oraz wykorzystując wstępnie wytrenowany model dyfuzji tekstu na obraz, nasz model uczy się bezpośrednio generować wideo o pełnej liczbie klatek na sekundę i niskiej rozdzielczości poprzez jego przetwarzanie w wielu skalach czasoprzestrzennych” – wyjaśniono w raporcie.

Przypadki użycia nowego modelu Google obejmują edycję wideo, malowanie i generowanie stylizowane, ale nadal ma on swoje wady. Chociaż Lumiere oferuje filmy w pełnej rozdzielczości, generowane filmy mają niską rozdzielczość, ale jego wszechstronność daje mu przewagę nad innymi graczami z branży.

Porównania z generatorami wideo, takimi jak Pika i Runway, stawiają Lumiere na czele stawki, a pierwsi testerzy wychwalają tę ofertę jako przyszłość generowania wideo.

Badacze Google przeszkolili Lumiere, korzystając z prawie 40 milionów napisów tekstowych i wideo, ale dokładne źródła zbiorów danych nie są znane, ponieważ kwestie praw autorskich w dalszym ciągu zagrażają przyszłości powstającej technologii.

Rozwiązanie problemu praw autorskich AI

Odkąd generatywna sztuczna inteligencja stała się głównym nurtem, kilku twórców sztucznej inteligencji zostało postawionych przed sądem za naruszenie praw autorskich twórców podczas szkolenia ich dużych modeli językowych (LLM). Google, Meta (NASDAQ: META), OpenAI i Anthropic przedstawiają swoją obronę prawną przed sądami w całych Stanach Zjednoczonych, zaprzeczając jakimkolwiek nadużyciom i argumentując dozwolony użytek.

Opracowano kilka teorii mających na celu rozwiązanie problemów związanych z prawami autorskimi sztucznej inteligencji, w tym proponowaną integrację modeli z technologią blockchain. Google twierdzi, że będzie chronić użytkowników sztucznej inteligencji przed roszczeniami dotyczącymi praw autorskich pochodzącymi od osób trzecich, ponosząc odpowiedzialność za ryzyko prawne.

Aby sztuczna inteligencja (AI) działała zgodnie z prawem i prosperowała w obliczu rosnących wyzwań, musi zintegrować korporacyjny system blockchain, który zapewni jakość wprowadzanych danych i własność, umożliwiając im bezpieczeństwo danych, a jednocześnie gwarantując niezmienność danych. Sprawdź relacje CoinGeek na temat tej powstającej technologii, aby dowiedzieć się więcej, dlaczego łańcuch bloków korporacyjnych będzie podstawą sztucznej inteligencji.

Obejrzyj: Sztuczna inteligencja potrzebuje blockchainu

Autor : BitcoinSV.pl

Źródło : Google Lumiere text-to-video generator is powered by AI – CoinGeek

Author: BitcoinSV.pl
CEO