
ByteDance a publié Seedance 2.0, un modèle d’IA pour la vidéo, et le fondateur de FilmStorm, Tim, a souligné dans une évaluation qu’il représente une avancée majeure en matière de mouvements de caméra, de scénarisation et de synchronisation audio-visuelle. Cependant, Tim a découvert que le modèle avait automatiquement associé sa voix sans autorisation, et qu’il n’avait jamais reçu de rémunération pour cela. FilmStorm craint que l’IA puisse créer des doublures numériques indiscernables de la réalité. Le plan Slice prévoit que le cinéma bifurquera en deux directions : une immersion ludique ou un retour aux fonctions sociales.
Le dernier modèle vidéo IA de ByteDance, Seedance 2.0, a été discrètement dévoilé, et le fondateur de la chaîne technologique « FilmStorm », Tim, lui a attribué une haute appréciation dans sa dernière vidéo. Contrairement aux précédents outils d’IA générant des images rigides, Tim estime que Seedance 2.0 peut gérer des mouvements de caméra étendus et fluides, ce qui constitue une avancée significative dans le domaine de la génération vidéo par IA.
Les outils antérieurs comme Runway ou Pika, bien qu’ayant permis de produire des images, présentaient souvent des mouvements de caméra mécaniques et peu naturels. Les problèmes courants incluaient des accélérations soudaines, des secousses peu fluides, et un manque de « respiration » propre aux professionnels de la photographie. Ces défauts rendaient les vidéos générées par IA facilement reconnaissables, ne répondant pas aux standards de la production cinématographique professionnelle. Seedance 2.0 se distingue en simulant la logique de mouvement d’un vrai réalisateur, intégrant des courbes d’accélération/décélération naturelles, des transitions de mise au point fluides, et une esthétique de cadrage soignée.
L’amélioration de la capacité de scénarisation est encore plus révolutionnaire. Tim indique que l’IA montre une logique narrative semblable à celle d’un réalisateur, capable de changer de point de vue pour assurer la fluidité de la narration tout en maintenant la cohérence des personnages. Dans la production traditionnelle, la scénarisation est une tâche centrale pour le réalisateur et le directeur de la photographie, impliquant la gestion du rythme narratif, de l’émotion et de la cohérence visuelle. Seedance 2.0 comprend la logique du script et peut automatiquement concevoir des transitions de plans cohérentes, ce qui signifie que l’IA a évolué d’un simple générateur d’images à un assistant créatif doté d’une pensée de réalisateur.
L’amélioration de la synchronisation audio-visuelle est également impressionnante. Seedance 2.0 peut générer en un clic des voix naturelles, des chuchotements et des mixages de sons ambiants, simplifiant considérablement le processus de post-production sonore. Dans la post-production traditionnelle, la conception sonore est une étape très spécialisée et chronophage. Pour une scène de deux minutes, un sound designer professionnel peut passer plusieurs jours à nettoyer les dialogues, enregistrer les ambiances, créer des effets sonores et mixer. Seedance 2.0 réduit ce processus à quelques minutes, augmentant l’efficacité de plus de mille fois.
Mouvements fluides : simulation de courbes d’accélération/décélération et de logique de cadrage, adieu à la rigidité de l’IA
Scénarisation de niveau réalisateur : compréhension de la logique narrative pour concevoir automatiquement des transitions de plans, en maintenant la cohérence des personnages
Son en un clic : génération automatique de voix et de mixages sonores, simplifiant la post-production
Sur le plan technique, ces avancées proviendraient probablement d’un volume de données d’entraînement plus important et de modèles temporels plus avancés. Seedance 2.0 utiliserait probablement une variante de l’architecture Transformer, combinée à des modèles de diffusion et à des GAN (réseaux antagonistes génératifs), entraînés sur une vaste base de films et vidéos professionnels. Avec la plus grande base de données de vidéos courtes au monde, détenue par TikTok et Douyin, ByteDance dispose d’une ressource d’entraînement inégalée pour Seedance 2.0.
Malgré la puissance de Seedance 2.0, FilmStorm a également révélé lors de tests certains risques potentiels. Tim a découvert qu’en ne téléchargeant que sa photo sans fournir de fichier audio, le modèle pouvait identifier son identité et lui associer automatiquement sa voix. Plus étonnant encore, après avoir uploadé une photo de la façade du bâtiment de FilmStorm, l’IA pouvait précisément calculer les détails de la face cachée de l’édifice dans l’angle mort de la caméra.
Tim affirme n’avoir jamais reçu de rémunération de ByteDance ni été contacté. Cela suggère que Seedance 2.0 pourrait avoir utilisé, sans avertissement, une grande quantité de données visuelles et sonores de créateurs de contenu audiovisuel. Cette pratique soulève de graves questions de droits d’auteur. Dans la majorité des juridictions, le droit à l’image et à la voix est protégé par la loi ; utiliser sans autorisation des données audiovisuelles pour un entraînement commercial peut constituer une violation.
Tim craint qu’en maîtrisant l’intégralité des données audiovisuelles personnelles, l’IA puisse créer des doublures numériques indiscernables de la réalité, rendant difficile la distinction entre vrai et faux, même pour les proches. Cela pourrait entraîner d’importants litiges de droits et des risques éthiques. Avec le développement du Deepfake, plusieurs cas de vidéos de célébrités synthétisées par IA pour des escroqueries ont déjà été signalés. Si Seedance 2.0 est détourné, cela pourrait favoriser usurpation d’identité, fausses informations et fraudes financières.
Une problématique éthique plus profonde concerne la transparence des données d’entraînement. ByteDance n’a jamais divulgué publiquement la provenance des données utilisées pour Seedance 2.0. Si le modèle s’appuie sur un grand nombre de contenus de créateurs publics, ces derniers en sont-ils informés ? ont-ils donné leur accord ? devraient-ils être rémunérés ? Ces questions manquent encore de cadre juridique clair à l’échelle mondiale. La législation européenne sur l’IA et plusieurs propositions américaines tentent d’établir des réglementations, mais leur application et leur efficacité restent à voir.
D’un point de vue industriel, si Seedance 2.0 peut copier le style, la voix et l’apparence de tout créateur sans autorisation, la valeur de la création sera profondément remise en question. Les créateurs ayant passé des années à bâtir leur marque personnelle et leur style unique pourraient voir leur identité entièrement reproduite par l’IA en quelques minutes. Ce serait une perte économique majeure, mais aussi une menace fondamentale à l’intégrité de l’identité des créateurs.
Tim pense que, même si Seedance 2.0 n’est pas encore parfait, la prochaine version pourrait bouleverser complètement l’industrie. Les plans qui nécessitaient des centaines d’heures de travail par des équipes d’effets spéciaux peuvent désormais être réalisés en quelques minutes par l’IA, ce qui dévalue rapidement les compétences professionnelles. Quand l’investissement humain ne peut plus rivaliser avec l’efficacité de l’IA, Tim se demande à la fin de sa vidéo : « L’IA détruit-elle la barrière de la production cinématographique traditionnelle, mais qu’en est-il de l’humain ? »
Dans « La vidéo de FilmStorm : l’IA peut-elle me remplacer ? », la conclusion est « l’expérience ». C’est elle qui forge l’âme unique de chacun. Quand vous voyez les cheveux blancs de votre mère, que vous entrez dans votre ancien lycée, que vous sentez l’odeur d’une salle de classe, l’IA ne pourra peut-être pas tout comprendre. La machine à vapeur était trop lente et naïve pour l’IA, mais pour l’humain, elle porte des souvenirs de séparations et d’espoirs de retrouvailles.
La célèbre critique de cinéma chinoise « Slice Project », avec près de 2 millions de fans sur Bilibili, pense que l’IA pourrait disposer d’un nombre infini de données, mais que seul l’humain possède un corps fragile, imparfait, mais authentique. Elle souligne que dès l’enfance, nous sommes immergés dans l’image, et avant même de vivre, d’expérimenter, de douter ou de perdre, nous commençons à apprendre à exprimer. Beaucoup de créations sont en réalité une construction de sens à partir de la forme, donnant à ces images une impression de rêve plutôt que la réalité du rêve lui-même.
Voie 1 : Très ludique et immersive : narration interactive pilotée par l’IA, où le spectateur devient co-créateur, avec des fins différentes à chaque visionnage
Voie 2 : Retour à la simplicité sociale : revenir à l’essence la plus ancienne du lien humain, en rassemblant les gens devant l’écran pour ressentir le monde, comme nos ancêtres autour du feu partageant leurs émotions et leurs rêves
Le célèbre réalisateur Ang Lee a dit : « Je ne crains pas que l’IA nous remplace, mais plutôt que notre pensée devienne IA. » Cette phrase souligne une inquiétude plus profonde. La technologie en soi n’est pas à craindre, mais la perte de la capacité de penser indépendamment et de ressentir authentiquement face à la progrès technique, ce qui pourrait réduire la création à une simple imitation de contenus générés par l’IA.
Steve Jobs, le fondateur d’Apple, pourrait offrir une autre perspective. Après la sortie du premier film d’animation entièrement numérique, « Toy Story », en 1995, il déclarait : « Toute technologie sert à raconter des histoires, à aider chaque créatif. Je crois que dans 60 ans, les gens regarderont encore Toy Story, non pas pour ses effets numériques, mais pour l’histoire sur l’amitié. » Cette vision reste valable aujourd’hui, 30 ans plus tard. Peu importe la puissance de Seedance 2.0, elle reste un outil. La véritable force qui touche le cœur demeure l’histoire elle-même.