China stellt fortschrittliche Text-zu-Video-KI-Modelle vor

(German.china.org.cn) Dienstag, 06. August 2024

China präsentiert mit Vidu und Ying zwei fortschrittliche Text-zu-Video-KI-Modelle, die den Wettbewerb mit dem amerikanischen Sora aufnehmen und die rasante Entwicklung des Landes im KI-Sektor unterstreichen. Diese Innovationen bieten beeindruckende Videoerzeugungskapazitäten und könnten die globale KI-Landschaft nachhaltig verändern.

Foto von VCG

Im Rahmen einer neuen Entwicklung im Bereich der künstlichen Intelligenz (KI) hat China mehrere einheimische Text-zu-Video-KI-Modelle vorgestellt und damit einen Meilenstein für den raschen Fortschritt des Landes in wichtigen neuen KI-Bereichen gesetzt. Diese Modelle sollen mit Sora konkurrieren, einem bekannten KI-Modell, das von der US-amerikanischen Firma OpenAI entwickelt wurde.

Vor kurzem wurde das chinesische Text-zu-Video-KI-Modell Vidu den Nutzern zur Verfügung gestellt, das die Kernfunktionalitäten der Generierung von Videos und Bildern aus Text bietet. Es bietet den Nutzern die Wahl zwischen Vier-Sekunden- und Acht-Sekunden-Videoclips mit einer Auflösung von bis zu 1080P. Vidu, das erstmals auf dem Zhongguancun-Forum im April 2024 angekündigt wurde, gilt als das erste chinesische Produkt, das mit den Fähigkeiten von Sora vergleichbar ist.

Darüber hinaus hat ein anderes chinesisches KI-Unternehmen, ChatGLM, vor kurzem sein Text-zu-Video-KI-Modell Ying auf den Markt gebracht, das auf der Grundlage von Texteingaben Videos mit einer Auflösung von 1440x960 erzeugen kann. Das Ying-Modell basiert auf der neuesten Generation von CogVideoX und wurde auf der Grundlage dieses Modells weiterentwickelt. Nach den Informationen, die ChatGLM der Global Times mitteilte, kann Ying jetzt einen Sechs-Sekunden-Videoclip innerhalb von 30 Sekunden erstellen.

Medienberichten zufolge hat Vidu nach mehr als dreimonatigen Verbesserungen nun neue Funktionen wie die Konsistenz von Zeichen zu Video, Anime-Stil und die Erzeugung von Videos mit Text und Spezialeffekten. Außerdem kann Vidu innerhalb von 30 Sekunden einen Vier-Sekunden-Clip erstellen.

Die Fähigkeiten von Vidu reichen in Bezug auf Komposition, Erzählung und Beleuchtung fast an das Niveau von Kinofilmen heran. Darüber hinaus kann es filmreife Spezialeffekte wie Rauch, schillernde Lichteffekte und CG-Effekte erzeugen.

Die schnelle Entwicklung Chinas im aufstrebenden KI-Sektor wurde von Wang Jingtao, dem stellvertretenden Direktor der chinesischen Cyberspacebehörde, auf der 12. Internet-Sicherheitskonferenz und KI-Konferenz am Mittwoch unterstrichen. Er erklärte, dass es in China inzwischen über 180 öffentlich verfügbare generative KI-Modelle gibt und die Zahl der registrierten Nutzer 564 Millionen übersteigt.

Die Entwicklung dieser KI-Modelle wird in China tatkräftig unterstützt. So wird zum Beispiel die Rechenleistung von ChatGLMs Ying-Modell von der Beijing AI Public Computing Platform unterstützt. Die Regierung unterstützt die Forschung und Entwicklung von ChatGLM umfassend, einschließlich industrieller Investitionen, Rechenleistung, Demonstrationsanwendungen und Fachkräften.

Folgen Sie uns auf Facebook und Twitter!

German.people.cn, die etwas andere China-Seite.