J'ai remarqué quelque chose d'intéressant dans la stratégie NVIDIA en ce moment. La semaine dernière, Jensen Huang a expliqué en détail pourquoi NVIDIA a investi 20 milliards de dollars pour acquérir Groq, et franchement, c'est une décision stratégique brillante qui montre comment le marché de l'inférence est en train de se transformer.



Alors voilà le contexte : pendant longtemps, tout le monde se concentrait sur une seule métrique - le débit. Mais Groq a compris quelque chose que les autres ont raté. Les ingénieurs logiciels sont maintenant prêts à payer plus cher pour des réponses plus rapides. C'est une segmentation du marché complètement nouvelle. Comme Huang l'a dit, si on peut offrir des tokens avec une latence ultra-basse, rendant les développeurs plus productifs, ils vont payer pour ça. C'est un marché qui vient à peine d'émerger.

Et c'est là que Groq rentre en jeu. Cette acquisition comble une lacune majeure dans l'arsenal d'inférence de NVIDIA. Alors que NVIDIA domine le segment haut débit avec ses solutions traditionnelles, Groq apporte quelque chose de complètement différent : une architecture LPU réputée pour sa latence déterministe exceptionnellement basse. En mars au GTC, NVIDIA a présenté le Groq 3 LPU, gravé en 4 nm chez Samsung. Les chiffres sont impressionnants - 35 fois plus d'inférence par mégawatt sur des modèles de 1 000 milliards de paramètres comparé au Blackwell NVL72.

C'est en gros une extension de la courbe de Pareto du marché. Au lieu de choisir entre débit élevé ou latence basse, NVIDIA crée maintenant deux segments distincts. Groq continue d'opérer comme entité indépendante, Jonathan Ross et son équipe ont rejoint NVIDIA. Le modèle même peut être tarifé différemment selon le temps de réponse - moins de débit, mais le prix unitaire compense largement. C'est du pur génie commercial, et ça montre comment le marché de l'IA se sophistique. Les deux approches vont coexister, et les clients vont choisir en fonction de leurs besoins réels.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler