La VTuber IA japonaise Shizuku reçoit un investissement de 16 millions de dollars de a16z, avec une valorisation portée à 75 millions de dollars. La société s’efforce de créer une version IA de Hatsune Miku, mais le nombre d’abonnés reste faible pour le moment, loin du leader Neuro Sama.
Le célèbre fonds de capital-risque américain a16z a annoncé le 10 février avoir investi dans la société japonaise de technologie VTuber IA Shizuku AI. Ce tour de financement s’élève à 15 millions de dollars, portant la valorisation de l’entreprise à 75 millions de dollars, soit environ 4 % de la capitalisation boursière de la principale entreprise de VTuber cotée au Japon, Anycolor, qui vaut 1,7 milliard de dollars.
En plus de a16z, le géant du commerce électronique japonais DeNA et Adam D’Angelo, membre du conseil d’administration d’OpenAI et CEO de Quora, ont également participé en tant qu’investisseurs individuels.
Le principal produit de Shizuku AI est le VTuber IA Shizuku, une virtual YouTuber utilisant une technologie d’IA générative, capable uniquement de répondre ou d’interagir via une IA, ce qui la distingue fortement des VTubers traditionnels interprétés par des humains, plus conformes à la perception générale.
Bien que fondée en Californie, Shizuku AI a été créée par Akio Koda, originaire du Japon, qui possède une expérience technique chez Meta et Luma AI, et est également l’auteur principal de StreamDiffusion, une technologie de génération d’images IA. La société souhaite créer une « propriété intellectuelle native IA » issue du Japon mais capable de s’étendre mondialement, à l’image de la virtual idol Hatsune Miku.
Hatsune Miku n’a pas été créée par une technologie d’IA générative, mais est un logiciel de synthèse vocale développé dès 2007 par Crypton, utilisant le moteur Vocaloid de YAMAHA. La voix originale est fournie par la seiyuu Saki Fujita, et l’image par Kei.
En tant que virtual idol emblématique du Japon, l’IP Hatsune Miku perdure grâce à ses chansons Vocaloid, composées et chantées par des humains, ainsi qu’à une riche production de dessins et vidéos liés à Miku, qui incarnent la culture de la création dérivée japonaise.
Source : Flickr, photo de Chag. Hatsune Miku est une virtual idol emblématique du Japon.
Akio Koda pense également qu’un personnage attrayant ne peut pas être créé dans l’isolement, mais doit évoluer à travers des interactions avec de vrais humains.
Shizuku a repris ses livestreams le 1er février avec la version V2.0. Un nouveau modèle Live 2D, dessiné par un animateur professionnel en collaboration avec la seiyuu Moka Shikina, permet désormais des dialogues multilingues. La société a aussi lancé « Shizuku Lab », une communauté permettant aux fans d’utiliser sa technologie de synthèse vocale pour créer du contenu dérivé, dans une démarche de création communautaire pour instaurer un cycle d’interactions et pallier la monotonie actuelle des interactions de Shizuku.
Shizuku AI prévoit également d’acheter des semi-conducteurs pour le développement IA et de continuer à faire appel à des créateurs japonais pour la conception de personnages et la production d’animations.
Source : Shizuku YouTube. La VTuber IA japonaise Shizuku reçoit un investissement de a16z.
Après avoir reçu un financement de la Silicon Valley, le défi de Shizuku AI ne fait que commencer.
Le principal indicateur dans le domaine des VTubers IA est « Neuro Sama », lancé fin 2022 par l’ingénieur britannique Jack Vedal. Il compte près d’un million d’abonnés sur YouTube et Twitch, a développé une sœur jumelle Evil, organisé des concerts en 3D, interagit dans VRChat avec Vedal, et a réalisé de nombreux exploits, notamment en dépassant plusieurs fois les records de Twitch.
Source : YouTube. Le leader actuel dans le domaine des VTubers IA est « Neuro Sama », lancé par l’ingénieur britannique Jack Vedal fin 2022.
En revanche, bien que débutée début 2023, la VTuber chinoise IA « Mu Ji Meng » n’a qu’environ 152 000 fans, et ses vidéos les plus populaires en ASMR n’ont été vues que 5 000 fois. Son trafic est très loin de celui de Neuro Sama.
De plus, la concurrente chinoise « Mu Ji Meng », lancée presque en même temps que Shizuku, compte 152 000 fans depuis ses débuts début 2023, et sa dernière vidéo date de fin avril 2025.
Selon les prévisions de QYResearch, la taille du marché mondial des VTubers atteindra 3,852 milliards de dollars d’ici 2030. Les AI VTubers, qui promettent d’apporter une nouvelle forme de livestream, doivent non seulement rattraper Neuro Sama, mais aussi faire face à une concurrence féroce dans le marché des VTubers humains déjà très saturé.
Ainsi, la clé pour Shizuku sera de capter les préférences du public, de créer plus de divertissement lors de ses livestreams et de se différencier pour pouvoir rivaliser avec Neuro Sama et élargir son audience.