¡Acaba de suceder! El modelo de vídeo nacional llegó al número uno mundial, le dio una lección a Google Veo y además ganó dinero.

El modelo de generación de videos nacional ha alcanzado por primera vez la cima mundial.

Justo ahora, en la última lista de clasificación de una organización independiente, Artificial Analysis, SkyReels V4 ha obtenido el primer lugar mundial en “Generación de videos a partir de texto (incluyendo audio)”.

Ha superado a Veo 3.1 de Google y también a Kling 3.0.

Lo más importante es que esta lista no es una evaluación realizada por los propios fabricantes, sino que se basa en resultados de evaluaciones a ciegas de una gran cantidad de usuarios reales.

Esto marca que, en la categoría más difícil y también más valiosa de “video y audio generados a partir de texto”, los modelos nacionales ya están en la delantera.

El 27 de febrero, cuando se presentó por primera vez la vista previa de SkyReels V4, ya ocupaba el segundo lugar a nivel mundial.

En menos de un mes, SkyReels V4 dio un paso adelante y directamente alcanzó el primer puesto.

SkyReels V4 no solo es más potente, sino que ya está reescribiendo la clasificación global de modelos de video.

Esto significa que la tecnología de video AI de China ha tomado la delantera en el mundo.

En el Foro Zhongguancun 2026, SkyReels-V4 será lanzado oficialmente con gran impacto, y su API ya está disponible (skyreels.ai).

Enlaces:

En otras modalidades, SkyReels V4 también ha mostrado un rendimiento destacado, ocupando el segundo lugar en “de texto a video (sin audio)”.

Hablar solo de datos no basta, hay que ver las capacidades en acción. A continuación, echemos un vistazo a qué tan impresionante es realmente el video AI que ocupa el primer lugar mundial.

Prueba práctica: Rey de los cortos de AI

Para Kunlun Wanwei Tiangong AI, SkyReels está comenzando su transición hacia un sistema completo de generación de videos multimodales, soportando entrada de texto, imágenes, videos y audio.

Es el primer modelo base de video en el mundo que soporta simultáneamente entradas multimodales, generación conjunta de audio y video, y tareas unificadas de generación, reparación y edición.

Cada una de las siguientes seis áreas de prueba muestra lo aterrador que puede ser este modelo.

Generación de cortos de AI: dos imágenes + un diálogo, creando directamente cortos de nivel cinematográfico.

Solo necesitas subir dos imágenes de personajes y escribir un diálogo.

SkyReels-V4 puede generar directamente un video de 15 segundos, en 1080p, 32FPS.

La calidad visual, las expresiones de los personajes y la sincronización de los labios son casi sin rastro de AI.

Ya sea con rostros orientales o occidentales, el resultado es extremadamente natural.

Truenos retumbantes, arena y polvo en la estepa, Gongsun Qiao y Qin Qiong en épica batalla—

Desde texto simple hasta video completo con audio, incluso sin experiencia previa, cualquiera puede crear contenido cinematográfico fácilmente, logrando realmente “filmar lo que quiera, cuando quiera”.

Lo más importante: casi no hay sabor a AI.

Y aún más, esta vez no es “primero crear la imagen y luego pegarle el sonido”.

SkyReels-V4 está diseñado específicamente para procesar simultáneamente imágenes y sonidos.

Referencia en múltiples cuadros: nueve imágenes, que finalmente aseguran la coherencia del personaje y la trama.

Una de las actualizaciones más importantes de SkyReels-V4 es la referencia en múltiples cuadros.

Puedes proporcionarle hasta 9 cuadros clave.

Él rellenará las acciones, tomas y transiciones intermedias basándose en esas 9 imágenes.

Esto es muy importante y muy práctico.

Antes, al hacer cortos de AI, los errores más comunes eran dos:

  • Que en un segundo la cara fuera una, y en el siguiente, “cambiar de rostro” abruptamente;
  • Que en una escena todavía estuvieran en un lugar, y al girar la cabeza, saltaran a otro mundo.

La mejora más útil de SkyReels-V4 en esta ocasión ha sido resolver estos problemas, sin duda, el rey de los cortos de AI.

Ejemplo de instrucciones: “El joven con camiseta de rayas azules en @imagen-1 corre continuamente hacia adelante, con varias esquinas en el camino, siguiendo la toma; luego la cámara cambia a @imagen-2, donde el joven, con el torso desnudo, sigue corriendo y gira rápidamente; después, en @imagen-3, muestra una expresión de sorpresa; finalmente, en @imagen-4, él gira un dial a la derecha, y una gran nube de humo ocupa toda la escena.”

Este control de video es simplemente increíble.

El estilo también es completamente uniforme. Para este tipo de cortos, no hay ni rastro de AI.

Por ejemplo, este clip que se asemeja a un monstruo “sin rostro”.

Basándose en la historia del anime en @imagen-1, se desarrolla de forma natural en orden de arriba a abajo, de izquierda a derecha, generando un cortometraje animado.

Las escenas de combate son muy fluidas, y los cambios de primer plano son muy coherentes.

Este tipo de animación de estilo fantasioso tampoco presenta dificultad.

Gracias a la capacidad de SkyReels-V4 para generar audio y video sincronizados, que los personajes hablen con labios sincronizados ya no es un problema.

Edición de video todo en uno**: edita con la boca.**

Lo más impresionante es que no solo genera videos, sino que también puede modificarlos directamente, convirtiéndose en una herramienta de postproducción definitiva.

Puedes pedirle que realice tres tipos de tareas:

Primero, agregar elementos a la escena.

Poner un sombrero en la cabeza del personaje, colocar flores en la habitación, o insertar un nuevo personaje en la escena original.

Añade el gorro de punto azul de @imagen_1 en la cabeza del bailarín central en @video_1.

Con una sola instrucción, el sombrero aparece en la cabeza de la chica.

Y lo más sorprendente: desde cualquier ángulo, el resultado es perfecto.

Es realmente impresionante.

Segundo, modificar las acciones de los personajes.

Hacer que los nuevos personajes bailen junto a los originales, o reprogramar sus movimientos.

Por ejemplo, agregar el personaje con disfraz de peluche colorido de @imagen_1 en la escena de baile urbano en @video_1, colocándolo en la pista junto al bailarín. El personaje debe imitar los movimientos del bailarín con un estilo de baile exagerado y juguetón.

No solo se añade el personaje, sino que también puede bailar en sincronía con el original.

Esta capacidad de comprensión en generación de videos es simplemente increíble.

Tercero, realizar limpieza directamente.

Eliminar subtítulos, marcas de agua, logos, eliminar transeúntes, animales, o cualquier elemento no deseado.

Esta capacidad de edición basada en una comprensión profunda del video por parte del modelo es extremadamente potente.

Antes, tenías que alternar entre Premiere, After Effects y varias herramientas de AI para completar estas tareas; ahora, todo puede hacerse con un solo modelo, SkyReels-V4.

En otras palabras, generación de videos, inserción de elementos, edición de personajes y limpieza de escenas se están integrando en un marco de edición universal.

Este gran avance consiste en unificar la generación, interpolación, extensión y edición de videos en una misma interfaz, permitiendo que la generación a partir de texto, la creación a partir de imágenes, la extensión de videos, la interpolación de cuadros clave y las ediciones parciales o globales se manejen bajo un mismo sistema.

Avance técnico: ¿Por qué puede competir de tú a tú con Seedance 2.0?

Tras ver los resultados, analicemos qué tan sólida es realmente la tecnología detrás de SkyReels-V4.

El mes pasado, cuando la vista previa de SkyReels V4 alcanzó el segundo lugar en la clasificación global de modelos, ya realizamos un análisis detallado. — Tras el impacto de Seedance 2.0, otro competidor chino alcanzó la cima en la lista AA, sin rastro de AI.

En menos de un mes, desde ser el segundo en la lista previa hasta coronarse en primer lugar en la versión definitiva, esa velocidad en el mundo de la IA es como hacer trampa en un juego, o en términos de IA, como “SkyReels-V4”.

El impulso de SkyReels-V4 no se basa en pequeños ajustes.

Principalmente ha resuelto dos viejos problemas del AI de video.

El primero: “La calidad visual es buena, pero la lógica no cuadra”.

Por ejemplo, que el agua fluya hacia arriba, que un vaso flote en el aire, o que los movimientos se rompan al girar.

Para solucionar esto, SkyReels-V4 en su entrenamiento ya no solo evalúa si la imagen se parece, sino también si es correcta.

En términos simples, se le añadió un sistema de puntuación más estricto:

  • La imagen debe ser atractiva, los movimientos coherentes, y el audio sincronizado con los labios y el ritmo.
  • Cuando algo no encaja, se vuelve a entrenar repetidamente.

Este proceso se denomina en la publicación académicaaprendizaje reforzado multimodal completo.

Por otro lado, el equipo introdujo un mecanismo de aprendizaje por etapas, que, en función de la resolución, duración, complejidad de la tarea y dificultad de los datos, guía al modelo desde tareas simples hasta complejas, mejorando continuamente su control en escenarios de generación de alta dificultad.

Puedes entenderlo así: antes, los profesores solo miraban si la apariencia era buena; ahora también evalúan la lógica, los movimientos y la expresión.

Antes solo se fijaban en las calificaciones; ahora también observan el proceso de aprendizaje y mejoran la enseñanza.

El segundo problema: “Los personajes no recuerdan”.

Si proporcionas varias imágenes clave, SkyReels-V4 puede rellenar los pasos intermedios.

Si le das nueve imágenes de la trama, puede mantener la cara, la vestimenta y el estilo del escenario de los personajes de manera coherente.

Esto es crucial para los cortos de AI.

Antes, lo que más distraía era que los personajes parecían diferentes en cada escena.

Un protagonista con barbilla puntiaguda en el primer episodio, y en el segundo, con cara cuadrada, haciendo que los espectadores salieran de la historia.

Ahora, con la referencia en una cuadrícula de nueve cuadros, los personajes permanecen consistentes, los escenarios son coherentes, y los cortos de AI han pasado de ser solo entretenimiento a algo que se puede seguir con atención.

Estas dos capacidades llevan la coherencia y el control en la generación de videos a un nivel muy alto, y convierten a SkyReels-V4 de una simple herramienta de generación en una verdadera máquina de producción de cortos.

El informe técnico de SkyReels-V4 ya está disponible.

Informe técnico:

Prueba en la práctica: llega el Netflix chino de IA

Lo que realmente importa no son solo las clasificaciones, sino que este modelo ya se está usando en negocios reales.

DramaWave: el Netflix de IA de Kunlun Wanwei.

La tecnología de SkyReels-V4 soporta directamente la plataforma de cortos DramaWave, de Kunlun Wanwei.

Hasta enero de 2026, con DramaWave y FreeReels como núcleo, la plataforma de cortos de Kunlun ha superado los 80 millones de usuarios activos mensuales, con ingresos anuales (ARR) que superan los 480 millones de dólares, y un ingreso mensual de 40 millones de dólares.

Estas cifras no son solo en PPT, sino que corresponden a usuarios reales pagando por contenido producido con IA.

Recientemente, DramaWave lanzó el plan de apoyo a la creación “Millón de dólares·AI para comenzar cortos”, atrayendo a creadores de todo el mundo. Además, la nueva herramienta propia de Kunlun, SkyAnime, también se lanzó para potenciar a los creadores y mejorar su eficiencia creativa.

Ya hay cerca de mil obras en la sección de cortos de IA en DramaWave, con una producción mensual superior a 30.

Tomemos como ejemplo el cortometraje AI “¡Robo de entradas! Me transfiero a un apocalipsis de no-muertos”, producido con SkyAnime, con un costo inferior a 20,000 dólares, y que tras su lanzamiento generó más de 100,000 dólares en un solo día, acumulando millones de reproducciones.

Este es un ciclo completo de “tecnología → producto → comercialización” perfectamente validado.

De “generación de fragmentos” a producción industrial de videos en toda la cadena.

El significado de SkyReels-V4 va mucho más allá de “puede generar un video atractivo”.

Para la industria de cortos de IA, la mayor dificultad que resuelve es la coherencia de los personajes.

Antes, los cortos generados por IA cambiaban de rostro en cada toma, lo que hacía difícil que los espectadores se involucraran.

La capacidad de referencia en cuadrícula de SkyReels-V4 mantiene la coherencia del personaje en toda la serie, logrando un nivel de calidad que permite “ver con atención”.

Para toda la industria de IA en cine y televisión, esto representa un avance cualitativo.

Proporciona una base unificada para generación de videos en juegos, música y contenido.

Es importante destacar que SkyReels-V4 no es un producto aislado.

También existe la plataforma de creación musical AI Mureka, cuyo modelo O1 es el primer modelo de inferencia musical en el mundo que incorpora la tecnología de cadena de pensamiento (CoT). La versión V8 continúa mejorando en timbre, técnica de interpretación y expresión emocional, con usuarios en más de 100 países.

La capacidad de video de SkyReels-V4 y la de música de Mureka conforman un ciclo completo de creación, desde imágenes hasta sonido, desde música de fondo hasta voces humanas.

Una misma empresa que posee los mejores modelos de video y música a nivel global, algo muy raro en el mundo.

Una marca puede crear un anuncio completo con una sola frase, un músico independiente puede convertir una canción en un MV de alta calidad, y una institución educativa puede transformar automáticamente un curso en un video didáctico con explicaciones, música y animaciones — no son solo ideas, sino realidades en marcha.

Todo en AGI

Al revisar la trayectoria de Kunlun Tiangong en el campo de los grandes modelos de video, se puede ver que el ascenso de SkyReels-V4 no es casualidad, sino el resultado de una estrategia cuidadosamente planificada y de una explosión de innovación a nivel estratégico.

  • En febrero de 2025, se lanzó SkyReels-V1 de código abierto, el primer modelo chino para creación de cortos AI, entrenado con millones de datos de cine y televisión, soportando 33 microexpresiones y más de 400 combinaciones de movimientos.
  • En abril de 2025, se lanzó SkyReels-V2, el primer modelo mundial para generación de películas de duración infinita usando el marco de difusión forzada (Diffusion Forcing).
  • En enero de 2026, se liberó SkyReels-V3, que soporta entrada de 1 a 4 imágenes de referencia para generación de videos con múltiples personajes.
  • En febrero de 2026, se presentó la vista previa de SkyReels-V4, alcanzando el segundo lugar en la clasificación global de Artificial Analysis.
  • En marzo de 2026, SkyReels-V4 alcanzó oficialmente el primer puesto mundial.

De V1 a V4, no solo se trata de añadir parámetros. Cada generación ha corregido una deficiencia clave.

Con una media de una gran actualización cada 3-4 meses, este ritmo de iteración en el campo global de videos AI es casi sin precedentes.

Este ritmo de innovación continua, junto con el liderazgo de Mureka en música AI, los avances en modelos de lenguaje grande y razonamiento multimodal de la serie Skywork, y la implementación comercial de la plataforma de cortos DramaWave, están construyendo un ecosistema completo de IA que abarca “potencia computacional—modelos—aplicaciones”.

Este es el resultado más convincente desde que en 2023 Kunlun Wanwei estableció su estrategia central de “Todo en AGI y AIGC”.

El momento de la “gran unificación” en la creación de videos AI

Al mirar hacia la primavera de 2026, el campo de generación de videos AI ha experimentado cambios radicales en solo un año.

Desde la primera ola impulsada por Sora, pasando por la competencia entre modelos como Veo, Kling y Seedance, hasta que SkyReels-V4, con su capacidad integral de referencia multimodal, generación conjunta de audio y video, marco de tareas unificado y aprendizaje reforzado multimodal, ha llegado a la cima mundial — estamos presenciando el inicio de una nueva era.

En esta era, la creación de videos ya no es un privilegio exclusivo de equipos profesionales, sino una forma de expresión accesible a todos con creatividad.

La dirección tecnológica que representa SkyReels-V4 — usar un solo modelo, en una sola operación, para completar todo el proceso desde la concepción en texto hasta el producto final en audio y video — es claramente el camino hacia ese futuro.

Kunlun Wanwei ha revelado en su informe técnico que en el futuro se ampliará la capacidad para generar videos de duración superior a 30 segundos, se mejorará la edición interactiva en tiempo real, y se abrirán APIs para integrar más herramientas de creación.

Cada uno de estos avances acortará aún más la brecha entre la video creación AI y la producción cinematográfica profesional.

La competencia en videos AI aún no ha terminado, pero SkyReels-V4, con su primer puesto mundial, ha demostrado una cosa:

En esta categoría, la voz de Kunlun Wanwei de China no solo merece ser escuchada por todo el mundo, sino que ya está en la cima del mundo.

Fuente: Xinzhiyuan

Aviso de riesgo y exención de responsabilidad

El mercado tiene riesgos, invierta con precaución. Este artículo no constituye una recomendación de inversión personal, ni considera objetivos, situación financiera o necesidades específicas de los usuarios. Los usuarios deben evaluar si las opiniones, puntos de vista o conclusiones aquí presentados son adecuados para su situación particular. La inversión implica riesgos, y la responsabilidad es del inversor.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado