Todos os modelos

GPT Image 2 na VM0. O modelo de geração de imagem mais novo da OpenAI

O modelo de imagem mais novo da OpenAI para geração e edição de texto para imagem. Use-o quando quiser o fluxo do GPT Image com maior aderência ao prompt e dimensionamento flexível.

Image / Text-to-image / Image edit

O GPT Image 2 é o modelo de geração de imagem mais novo da OpenAI na VM0. Ele mantém o fluxo de texto para imagem e edição do GPT Image enquanto adiciona dimensionamento flexível e maior aderência ao prompt para tarefas de imagem em produção.

A cobrança na VM0 é baseada em níveis, de cerca de US$ 0,007 por imagem no nível baixo/standard até US$ 0,481 no nível alto/grande. O nível médio-standard (cerca de US$ 0,064 por 1024×1024 na VM0) é o padrão sensato para a maioria das chamadas de geração integradas.

O que é o GPT Image 2?

Abril de 2026 · O modelo GPT Image mais novo da OpenAI, posicionado acima do GPT Image 1 em aderência ao prompt e dimensionamento flexível da saída.

O GPT Image 2 é o modelo de imagem mais novo da OpenAI exposto pelo caminho de geração de imagem integrado da VM0. Ele oferece suporte a geração de texto para imagem e edições de imagem por meio do mesmo fluxo voltado a agentes que o GPT Image 1.

O modelo é um bom padrão quando quem chama quer um seguimento de prompt no estilo da OpenAI, mas precisa de um dimensionamento de saída mais flexível que os níveis padrão do GPT Image 1. Ele é precificado por qualidade e tamanho, então os agentes podem manter os loops de rascunho mais baratos e reservar a saída de alta qualidade para as renderizações finais.

O que se destaca no GPT Image 2

Principais recursos de arquitetura e capacidade.

Modelo de texto para imagem e edição de imagem exposto pelo endpoint GPT Image 2 da OpenAI no fal. Oferece suporte a níveis de qualidade e tamanhos de imagem flexíveis; fundos transparentes não são suportados na VM0 para este modelo.

Especificações em resumo

FamíliaOpenAI Images
ModalidadesTexto para imagem, edição imagem para imagem
Níveis de saídaStandard / Grande × Baixo / Médio / Alto
Preço cobrado pela VM0De US$ 0,007 a US$ 0,481 por imagem
IdiomasPrompts multilíngues
Disponível na VM0Abril de 2026

Preços do GPT Image 2

Preço de tabela do fornecedor por unidade gerada.

Por imagem gerada$0.06
DetalheMedium standard tier (1024x1024)

Como o GPT Image 2 se comporta na prática

Comportamento observado em execuções de agentes em produção.

Aderência ao prompt

O principal motivo para escolher o GPT Image 2 em vez do GPT Image 1 é a execução mais rigorosa de prompts detalhados, especialmente quando o briefing inclui restrições de composição, proporção e estilo.

Dimensionamento flexível

Oferece suporte ao caminho de tamanho de imagem flexível da VM0, então os agentes podem solicitar tamanhos de entrega quadrados, retrato, paisagem e maiores sem trocar de família de modelos.

Fluxos de edição

Oferece suporte a edições imagem para imagem e máscaras. Use-o quando um fluxo precisa preservar uma imagem de origem enquanto altera uma região descrita.

Custo

Mais caro que o GPT Image 1 nos níveis médio e alto. Mantenha os loops de rascunho em qualidade mais baixa e reserve a alta qualidade para a saída final.

Melhores tarefas de agente para o GPT Image 2

O agente que precisa de seguimento exato do prompt

Quando o prompt tem requisitos específicos de enquadramento, estilo ou tamanho, o GPT Image 2 é a escolha de imagem da OpenAI mais segura que o GPT Image 1.

O fluxo de imagem que precisa de múltiplas proporções

Ativos de marketing, redes sociais e site frequentemente precisam de saídas quadradas, retrato e paisagem. O GPT Image 2 atende a esses fluxos sem mudar o estilo do prompt.

O loop de edição na stack da OpenAI

Se um agente já está usando modelos da OpenAI para planejamento e copy, o GPT Image 2 mantém a geração de imagem na mesma família de seguimento de prompt.

Quando dispensar o GPT Image 2

Evite o GPT Image 2 quando o custo for o fator dominante ou quando uma saída de fundo verdadeiramente transparente for exigida. O GPT Image 1, o GPT Image 1.5 ou o SeedDream 4 podem ser melhores dependendo da restrição.

GPT Image 2 vs outros modelos

GPT Image 2 vs GPT Image 1

O GPT Image 2 é o modelo mais novo e flexível, com maior aderência ao prompt. O GPT Image 1 continua mais barato nas configurações médio-standard comuns e ainda é forte para ilustração estilizada.

GPT Image 2 vs SeedDream 4

O SeedDream 4 é mais barato e tende ao fotorrealismo. O GPT Image 2 é a melhor escolha na stack da OpenAI quando aderência ao prompt, fluxo de edição e dimensionamento flexível importam mais que o menor custo.

Conclusão: você deveria usar o GPT Image 2?

Escolha o GPT Image 2 quando quiser geração de imagem da OpenAI com maior aderência ao prompt e dimensionamento flexível. Use o GPT Image 1 ou o SeedDream 4 quando o custo for a restrição dominante.

Perguntas frequentes

Como o GPT Image 2 é precificado?

Ele é precificado por qualidade e tamanho. Na VM0, o nível médio-standard custa cerca de US$ 0,064 por imagem e o nível alto/grande custa cerca de US$ 0,481 por imagem.

O GPT Image 2 oferece suporte a edição de imagem?

Sim. A VM0 expõe edição imagem para imagem e suporte a máscaras para o GPT Image 2.

O GPT Image 2 oferece suporte a fundos transparentes?

Não. O caminho do GPT Image 2 na VM0 não oferece suporte a saída de fundo transparente.

Quando devo usar o GPT Image 2 em vez do GPT Image 1?

Use o GPT Image 2 para aderência mais rigorosa ao prompt e dimensionamento flexível. Use o GPT Image 1 quando o briefing for mais simples ou o custo importar mais.

Alternativas

Usando o GPT Image 2 na VM0

Usando o GPT Image 2 na VM0

Os agentes da VM0 podem chamar o GPT Image 2 como parte de uma execução de agente, cobrado contra seus créditos VM0. O preço de tabela acima é o que o provedor upstream cobra; a VM0 o repassa com a conversão de créditos padrão.

Disponível na VM0 desde April 2026.