Publier le message d’actualité, 23 avril — L’équipe de recherche de Perplexity a publié un article technique décrivant sa méthodologie de post-formation pour les agents de recherche web. L’approche utilise deux modèles open source Qwen3.5 (Qwen3.5-122B-A10B et Qwen3.5-397B-A17B) et met en œuvre un pipeline en deux étapes : un fine-tuning supervisé (SFT) pour établir le respect des instructions et la cohérence linguistique, suivi d’un apprentissage par renforcement en ligne (RL) pour optimiser la précision de recherche et l’efficacité d’utilisation des outils.

La phase RL tire parti de l’algorithme GRPO avec deux sources de données : un jeu de données interne propriétaire vérifiable de questions-réponses multi-étapes construit à partir de requêtes de départ nécessitant 2 à 4 étapes de raisonnement avec vérification par plusieurs solveurs, et des données conversationnelles générales basées sur des grilles d’évaluation qui transforment les exigences de déploiement en conditions atomiques objectivement vérifiables afin de prévenir la dégradation du comportement de la SFT.

La conception des récompenses emploie une agrégation filtrée — les scores de préférence ne contribuent que lorsque la correction de base est atteinte (correspondance question-réponse de base) ou lorsque toutes les conditions de grille d’évaluation sont satisfaites (, empêchant des signaux de préférence élevés de masquer des erreurs factuelles. Les pénalités d’efficacité utilisent un ancrage au sein du groupe, en appliquant des pénalités progressives aux appels d’outils et à la longueur de génération dépassant la référence des réponses correctes dans le même groupe.

L’évaluation montre que Qwen3.5-397B-SFT-RL atteint les meilleures performances de sa catégorie sur des bancs d’essai de recherche. Sur FRAMES, il atteint 57,3 % d’exactitude avec un seul appel d’outil, dépassant GPT-5.4 de 5,7 points de pourcentage et Claude Sonnet 4.6 de 4,7 points de pourcentage. Dans un budget modéré )quatre appels d’outils, il obtient 73,9 % d’exactitude à 0,02 $ par requête, contre 67,8 % d’exactitude pour GPT-5.4 à 0,085 $ par requête et 62,4 % d’exactitude pour Sonnet 4.6 à 0,153 $ par requête. Les chiffres de coût reposent sur la tarification API publique de chaque fournisseur et excluent les optimisations de mise en cache.

Afficher la source

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

PDG de Google : dépenses d’investissement en 2026 à 185 milliards, accélération des investissements à l’ère des agents IA

Agent IA Actualités de l’industrie de l’IA

Le PDG de Google, Sundar Pichai, a annoncé lors de la conférence Google Cloud Next qui s’est tenue le 22 avril à Las Vegas que Google prévoit d’investir entre 175 et 185 milliards de dollars en dépenses d’investissement en 2026, afin de construire l’infrastructure nécessaire aux agents d’intelligence artificielle (IA) autonomes, soit une augmentation par rapport aux 31 milliards de dollars de 2022.

MarketWhisperIl y a 4m

Google Jules ouvre une nouvelle liste de candidats pour la prochaine version et se repositionne comme une plateforme de développement de produits de bout en bout

Agent IA Actualités de l’industrie de l’IA

Selon l’annonce officielle du 23 avril du groupe Google Jules, la position produit de Jules est passée d’un agent d’encodage asynchrone à une « plateforme de développement de produits agentiques de bout en bout ». La nouvelle version peut lire l’intégralité du contexte produit, décider de façon autonome de la prochaine direction de construction et soumettre une PR. L’équipe officielle annonce en parallèle l’ouverture de la liste des candidats pour la nouvelle version.

MarketWhisperIl y a 9m

Google Jules se renomme en plateforme de développement de produits agentique de bout en bout et ouvre une liste d’attente pour une nouvelle version

Agent IA Actualités de l’industrie de l’IA

Message de Gate News, 23 avril — L’équipe Jules de Google a annoncé l’ouverture d’une liste d’attente pour une nouvelle version du produit, repositionnant Jules d’un agent de codage asynchrone vers une plateforme de développement de produits agentique de bout en bout. D’après la description officielle, la plateforme améliorée lit le contexte complet du produit,

GateNewsIl y a 55m

L’équipe OpenAI Codex corrige un bug d’authentification d’OpenClaw et améliore considérablement le comportement de l’agent

Agent IA Actualités de l’industrie de l’IA

OpenClaw passe de Pi à l’outil d’exécution Codex pour corriger un repli d’authentification silencieux, avec deux PR qui traitent le bridge et le fallback ; après la correction, l’agent passe d’un simple polling de battements à une boucle de travail complète, permettant des progrès. Résumé : L’optimisation de l’outil d’exécution Codex d’OpenClaw a corrigé une faille d’authentification critique qui provoquait un repli silencieux vers l’outil d’exécution Pi lors de l’utilisation de Codex avec des modèles OpenAI. Deux requêtes d’extraction corrigent le bridge d’authentification et empêchent le repli silencieux, en modifiant l’adaptateur d’exécution. En conséquence, le comportement de l’agent évolue d’un simple polling de battements à une boucle de travail complète qui lit le contexte, analyse les tâches, modifie les dépôts et vérifie l’avancement, améliorant la continuité et la visibilité entre les battements.

GateNewsIl y a 2h

Agents de Workspace d’OpenAI pour ChatGPT : pilotés par Codex, partage en équipe, intégration Slack

Agent IA Actualités de l’industrie de l’IA

OpenAI a lancé, le 22 avril, WorkspaceAgents dans ChatGPT Business/Enterprise/Edu/Teachers, alimenté par Codex, conçu pour fonctionner longtemps dans le cloud, partagé par les équipes et exécutable hors ligne. Il peut répondre proactivement dans Slack et gérer l’émission de factures, exécuter des workflows multi-étapes et prend en charge la planification. L’aperçu de la recherche est gratuit jusqu’au 6 mai ; ensuite, la tarification sera basée sur des crédits, les prix devant être annoncés. En concurrence avec GoogleGeminiEnterpriseAgentPlatform et AnthropicClaudeCowork, ces trois offres se concentrent sur des agents au niveau entreprise, mais avec des positionnements différents.

ChainNewsAbmediaIl y a 3h

Google Cloud Next 2026 : lancement de la plateforme d’agents d’entreprise Gemini, 750 millions de dollars pour aider les cabinets à passer à l’action

Agent IA Actualités de l’industrie de l’IA

Google Cloud a annoncé la plateforme Gemini Enterprise Agent Platform lors de Cloud Next 2026, en intégrant la sélection de modèles, la construction d’agents, le DevOps, l’orchestration et la supervision de la sécurité en entreprise, et en lançant un fonds de 750 millions de dollars pour aider McKinsey, Accenture et Deloitte à déployer des agents d’entreprise. La plateforme s’accompagne de l’Ironwood TPU, de l’A2A et du MCP, afin de créer un écosystème full-stack et un canal de conseil, et de faire face à OpenAI Operator et à la version entreprise d’Anthropic Claude.

ChainNewsAbmediaIl y a 3h

Commentaire

0/400

Aucun commentaire