GPT-5.5 sur VM0. Le modèle de raisonnement phare d'OpenAI

Le modèle phare de la famille GPT-5 d'OpenAI. Le choix le plus solide pour le codage agentique, le raisonnement approfondi et les boucles de computer-use au niveau OpenAI.

400K tokens · Text / Vision / Code · Prompt cache

Utiliser GPT-5.5 sur VM0

GPT-5.5 est le modèle vers lequel se tourner lorsque le travail exige à la fois un raisonnement approfondi et une utilisation d'outils fiable : orchestration de boucles d'agents en plusieurs étapes, modifications de code à réussir du premier coup, et flux de computer-use couvrant de nombreuses actions d'interface. Les benchmarks du fournisseur (SWE-bench Verified, AIME 2025, GPQA Diamond) chiffrent concrètement les gains par rapport au GPT-5.4.

Le prix catalogue du fournisseur est de 5 $ / 30 $ par 1M de tokens, avec l'entrée mise en cache à 0,50 $ / 1M. C'est le modèle le plus cher du catalogue intégré de VM0, à ×2 crédits, si bien que le schéma économique consiste à garder le GPT-5.4 ou le Claude Sonnet 4.6 comme valeur par défaut généralisée et à ne router que les étapes les plus difficiles vers le GPT-5.5.

Qu'est-ce que GPT-5.5 ?

Avril 2026 (successeur du GPT-5.4) · Haut de gamme de la famille GPT-5. Le modèle phare d'OpenAI pour le codage agentique et le raisonnement.

GPT-5.5 est le modèle phare de la génération GPT-5 d'OpenAI, sorti en avril 2026 comme mise à niveau recommandée depuis le GPT-5.4. OpenAI le présente comme une amélioration majeure sur l'utilisation agentique d'outils et les tâches de computer-use, plutôt que comme un simple rafraîchissement de l'API de surface. La fenêtre de contexte de 400K tokens et le paramètre reasoning_effort introduits avec le GPT-5 sont conservés à l'identique, de sorte que les agents Codex existants s'intègrent sans réécriture.

Comparé au GPT-5.4 (le cheval de trait de la même famille), le GPT-5.5 investit davantage de calcul par token dans le raisonnement. Le bénéfice comportemental se manifeste à trois endroits : des correctifs de code plus solides dès la première tentative sur les refactorisations multi-fichiers, sensiblement moins d'appels d'outils mal routés sur les longues boucles d'agents, et des gains notables sur le raisonnement scientifique de niveau universitaire (GPQA Diamond) et les mathématiques de compétition (AIME 2025). La contrepartie est le prix catalogue le plus élevé parmi les variantes GPT-5 (5 $ / 30 $ par 1M de tokens) et un multiplicateur de ×2 crédits sur VM0, raison pour laquelle OpenAI elle-même positionne le GPT-5.5 comme le niveau de planification ou d'escalade plutôt que comme la valeur par défaut généralisée.

Les classements indépendants (Artificial Analysis, Vellum) corroborent l'ordre relatif face au GPT-5.4 et placent le GPT-5.5 à quelques points du Claude Opus 4.7 sur la plupart des tâches de codage agentique. Les valeurs absolues évoluent chaque semaine et OpenAI a elle-même signalé une contamination des données d'entraînement sur le SWE-bench Verified pour les modèles de pointe. Considérez les scores publics comme indicatifs plutôt que comme des références absolues ; les différences comportementales structurées (précision des appels d'outils, fiabilité du computer-use, qualité des correctifs au premier essai) constituent le signal le plus durable.

Ce qui distingue GPT-5.5

Principales caractéristiques d'architecture et de capacités.

GPT-5.5 conserve la fenêtre de contexte de 400K tokens du GPT-5.4, facturée au tarif d'entrée standard sur toute la fenêtre. Il prend en charge le paramètre reasoning_effort à quatre niveaux (minimal, low, medium, high), la mise en cache des prompts (l'entrée mise en cache étant facturée au dixième du tarif d'entrée), et la surface Responses API qu'utilise codex CLI par défaut. L'utilisation d'outils, les sorties structurées et le computer-use sont inchangés par rapport à la 5.4. Les entrées sont multimodales (texte, vision et code) ; le modèle ne génère pas nativement d'images (utilisez l'Images API pour cela).

Spécifications en un coup d'œil

FamilleGénération GPT-5

ModalitésTexte, vision, code

LanguesAnglais en priorité, multilingue

Mise en cache des promptsPrise en charge (OpenAI)

Fenêtre de contexte400K tokens

Sortie maximaleJusqu'à 128K tokens

Effort de raisonnementMinimal / Low / Medium / High

Prix catalogue fournisseur5 $ entrée / 30 $ sortie par 1M

Benchmarks de GPT-5.5

Scores communiqués par le fournisseur, issus des documents de lancement du GPT-5.5 d'OpenAI, avec les écarts indiqués par rapport aux chiffres publics du GPT-5.4. Les tests indépendants placent la 5.5 à quelques points du Claude Opus 4.7 sur les tâches de codage agentique. Considérez les pourcentages absolus comme indicatifs ; OpenAI a signalé une contamination des données d'entraînement sur le SWE-bench Verified pour tous les modèles de pointe.

SWE-bench Verifiedcommuniqué par le fournisseur ; en hausse par rapport aux 74,9 % de la 5.4

~82 %

Terminal-Bench 2.0utilisation d'outils communiquée par le fournisseur

~69 %

AIME 2025 (sans outils)mathématiques de compétition, communiqué par le fournisseur

~96 %

GPQA Diamondsciences de niveau universitaire, communiqué par le fournisseur

~89 %

OSWorld (computer use)communiqué par le fournisseur

~74 %

MMMU (multimodal)communiqué par le fournisseur

En tête de la famille GPT-5

VitesseArtificial Analysis, effort medium

~70 tokens/s

Tarification de GPT-5.5

Prix catalogue fournisseur, par million de tokens.

Entrée$5.00

Sortie$30.00

Lecture cache$0.50

Écriture cacheNon facturé

Comment GPT-5.5 se comporte en pratique

Comportement observé lors d'exécutions d'agents en production.

Routage des outils

Le taux le plus bas d'appels d'outils mal routés de la famille GPT-5. L'écart avec la 5.4 se creuse sur les cas limites difficiles : sélection conditionnelle d'outils, arguments profondément imbriqués et appels d'outils lancés après de longues séquences de raisonnement.

Modifications de code au premier essai

La meilleure qualité de correctifs de la famille GPT-5. Le bon choix lorsqu'un agent doit modifier du code qui doit continuer à compiler et à passer les tests, surtout lorsque le correctif s'étend sur plusieurs fichiers. Le SWE-bench Verified communiqué par le fournisseur en rend directement compte.

Computer use

Sensiblement plus fiable que la 5.4 sur les séquences d'interface en plusieurs étapes, ce que capture l'écart sur OSWorld. À privilégier lorsque l'agent pilote un navigateur ou une application de bureau sur des dizaines d'étapes et que le coût d'un déraillement en cours d'exécution est élevé.

Vitesse

Plus lent que la 5.4 et nettement plus lent que la 5.4 Mini. Environ 70 tokens/s à l'effort medium selon Artificial Analysis. Réservez-le aux étapes qui requièrent réellement la profondeur de raisonnement supplémentaire et faites tourner les niveaux plus légers en parallèle.

Comportement face aux hallucinations

GPT-5.5 hérite de la calibration plus stricte de la génération GPT-5 et tend à reconnaître l'incertitude plutôt qu'à fabuler, ce qui explique pourquoi les équipes en production continuent de payer la prime pour le raisonnement à fort enjeu, malgré des alternatives moins chères comme DeepSeek V4 Pro qui l'égalent désormais sur les benchmarks.

Meilleures tâches d'agent pour GPT-5.5

L'orchestrateur qui exécute un plan multi-outils

Utilisez GPT-5.5 comme le planificateur qui décompose la requête d'un client en dix étapes, confie chaque étape à un sous-agent de niveau GPT-5.4 ou 5.4 Mini, puis réassemble les résultats. Faire tourner la 5.5 uniquement à la couche du planificateur (et les niveaux moins chers partout ailleurs) coûte une fraction du prix d'une exécution 5.5 de bout en bout, tout en préservant l'essentiel de la qualité.

Les modifications de code réussies du premier coup, sans gaspiller un cycle de CI

Demandez à GPT-5.5 de migrer un code de 50 fichiers d'un ORM à un autre, de refactoriser un module enchevêtré ou d'appliquer un correctif de sécurité dans tout le dépôt. Le correctif s'applique proprement dès la première tentative plus souvent qu'avec tout autre modèle de la famille, et c'est exactement ce que reflétera votre facture de CI.

L'agent de computer-use qui doit aller au bout du flux

Lorsque l'agent pilote un navigateur dans un flux de réservation en plusieurs étapes, une application de bureau ou une interface d'administration héritée, le meilleur score OSWorld de la 5.5 se traduit par moins de déraillements en cours d'exécution et moins de reprises humaines. La prime est rentabilisée dès la première fois qu'une longue session n'a pas besoin d'être relancée.

L'étape de recherche en maths ou sciences difficiles

Soumettez-lui un jeu de problèmes de mathématiques de niveau compétition ou une dérivation de physique universitaire et la 5.5 le résoudra sans les erreurs à un près que l'on observe avec la 5.4. L'AIME 2025 et le GPQA Diamond captent précisément ce type de comportement.

Quand éviter GPT-5.5

Évitez GPT-5.5 pour le travail de routine à fort volume, où le GPT-5.4 atteint le même niveau de qualité pour moitié moins de crédits, pour les réponses de chat sensibles à la latence, où le GPT-5.4 Mini est bien plus rapide, et pour les tâches de classification ou d'extraction en masse, où le GPT-5.4 Mini est l'option groupée prise en charge la moins chère.

GPT-5.5 vs autres modèles

GPT-5.5 vs GPT-5.4

GPT-5.4 est le cheval de trait par défaut de la famille GPT-5 et le bon choix pour la plupart des agents. Ne passez au GPT-5.5 que lorsque la 5.4 échoue visiblement sur le raisonnement difficile, les longues boucles agentiques ou les modifications de code au premier essai, généralement comme orchestrateur qui délègue vers des sous-agents de niveau 5.4 ou 5.4 Mini.

GPT-5.5 vs Claude Opus 4.7

Même rôle dans des familles différentes : l'orchestrateur à fort enjeu et le modèle vers lequel vous escaladez quand le niveau moins cher échoue. L'Opus 4.7 dispose de la fenêtre de contexte de 1M de tokens et du profil de sécurité d'Anthropic ; le GPT-5.5 a de meilleurs scores de computer-use et constitue le choix naturel pour les équipes déjà sur le framework Codex. Choisissez selon le framework et l'écosystème que visent vos agents existants.

GPT-5.5 vs Gemini 3 Pro

Gemini 3 Pro est en tête sur le raisonnement brut en contexte long (fenêtre de 2M de tokens) et sur certains benchmarks multimodaux. GPT-5.5 est en tête sur le codage agentique (SWE-bench Verified, Terminal-Bench) et le computer-use. Choisissez GPT-5.5 lorsque l'agent modifie du code ou pilote une interface ; choisissez Gemini 3 Pro lorsque la charge de travail est de la compréhension intensive de documents ou de vidéos.

En résumé : devriez-vous utiliser GPT-5.5 ?

GPT-5.5 est le niveau d'escalade côté OpenAI. Par défaut, utilisez GPT-5.4 ; passez à la 5.5 uniquement sur les étapes précises où la 5.4 échoue visiblement.

Questions fréquentes

Quelle est la fenêtre de contexte du GPT-5.5 ?

400 000 tokens, avec jusqu'à 128K tokens de sortie par réponse. Toute la fenêtre est facturée au tarif standard.

GPT-5.5 peut-il traiter des images ?

Oui. GPT-5.5 est multimodal. Il accepte des entrées image en plus du texte et du code, de sorte que les agents pilotés par captures d'écran et la vision documentaire fonctionnent nativement. Pour la génération d'images, utilisez l'Images API d'OpenAI.

Quand dois-je choisir GPT-5.5 plutôt que GPT-5.4 ?

Lorsque (a) l'agent est le planificateur / orchestrateur et que les décisions se propagent en cascade, (b) l'exécution est assez longue pour que la 5.4 commence à mal router les appels d'outils, ou (c) la sortie doit s'appliquer proprement dès la première tentative (modifications de code, charges utiles structurées, flux de computer-use).

GPT-5.5 prend-il en charge la mise en cache des prompts ?

Oui. L'entrée mise en cache est facturée 0,50 $ par 1M de tokens — une remise de 10× sur la portion mise en cache. À utiliser dès que votre prompt système ou votre schéma d'outils est stable d'un appel à l'autre.

Quel framework GPT-5.5 utilise-t-il sur VM0 ?

Codex. VM0 route GPT-5.5 via la surface Responses API du framework Codex, celle qu'utilise codex CLI par défaut. Les agents du framework Claude Code ne sont pas compatibles avec les modèles GPT-5 sur VM0.

Alternatives

GPT-5.4

Moitié des crédits, même famille

Claude Opus 4.7

Modèle phare équivalent côté Claude

Claude Sonnet 4.6

Cheval de trait par défaut à ×1 crédit

Utiliser GPT-5.5 sur VM0

Deux façons d'accéder à GPT-5.5 sur VM0

VM0 prend en charge GPT-5.5 comme modèle Built-in facturé en crédits VM0, et via le bring-your-own avec une OpenAI API key. La voie Built-in utilise le routage VM0 Managed et le multiplicateur de crédits expliqué ci-dessous ; la voie bring-your-own vous facture directement auprès du fournisseur en amont et contourne entièrement la conversion en crédits VM0.

La recommandation de VM0

VM0 positionne GPT-5.5 comme un modèle d'agent central, recommandé aux côtés de Claude Opus 4.7, Claude Opus 4.6 et Claude Sonnet 4.6 pour les étapes qui déterminent le résultat réel d'une exécution d'agent. Ce sont les modèles que nous choisirions pour le rôle d'orchestrateur, pour les agents touchant au code, et pour toute étape où une mauvaise réponse coûte cher.

Les crédits et le multiplicateur ×2

Chaque modèle Built-in sur VM0 est tarifé comme un multiple de Claude Sonnet 4.6, qui se situe à la référence de crédits ×1. GPT-5.5 est facturé à ×2 crédits. Le multiplicateur est ce qui apparaît sur votre facture VM0 ; le prix catalogue du fournisseur dans le tableau de tarification ci-dessus est ce que le fournisseur en amont facture avant que VM0 ne le convertisse en crédits.

GPT-5.5 est facturé à ×2, ce qui signifie qu'une étape ici coûte 2× les crédits d'une étape équivalente sur Sonnet 4.6 (la référence ×1). C'est un palier premium sur VM0, donc le pattern le plus économique est de choisir par défaut un modèle moins cher et de n'acheminer vers GPT-5.5 que les étapes qui ont réellement besoin de cette profondeur de raisonnement supplémentaire.

Disponible sur VM0 depuis le April 2026.

Qu'est-ce que GPT-5.5 ?

Ce qui distingue GPT-5.5

Spécifications en un coup d'œil

Benchmarks de GPT-5.5

Tarification de GPT-5.5

Comment GPT-5.5 se comporte en pratique

Routage des outils

Modifications de code au premier essai

Computer use

Vitesse

Comportement face aux hallucinations

Meilleures tâches d'agent pour GPT-5.5

L'orchestrateur qui exécute un plan multi-outils

Les modifications de code réussies du premier coup, sans gaspiller un cycle de CI

L'agent de computer-use qui doit aller au bout du flux

L'étape de recherche en maths ou sciences difficiles

Quand éviter GPT-5.5

GPT-5.5 vs autres modèles

GPT-5.5 vs GPT-5.4

GPT-5.5 vs Claude Opus 4.7

GPT-5.5 vs Gemini 3 Pro

En résumé : devriez-vous utiliser GPT-5.5 ?

Questions fréquentes

Quelle est la fenêtre de contexte du GPT-5.5 ?

GPT-5.5 peut-il traiter des images ?

Quand dois-je choisir GPT-5.5 plutôt que GPT-5.4 ?

GPT-5.5 prend-il en charge la mise en cache des prompts ?

Quel framework GPT-5.5 utilise-t-il sur VM0 ?

Alternatives

Utiliser GPT-5.5 sur VM0

Deux façons d'accéder à GPT-5.5 sur VM0

La recommandation de VM0

Les crédits et le multiplicateur ×2

Plus de modèles sur VM0