Todos os modelos

GPT Image 1 na VM0. O modelo de texto para imagem da OpenAI

O modelo de texto para imagem da OpenAI com forte ilustração estilizada e edição. A escolha natural quando você quer a estética e o estilo de seguimento de prompt da OpenAI.

Image / Text-to-image / Image edit

O GPT Image 1 é o modelo de texto para imagem da OpenAI — aquele que a maioria das equipes conhece como o modelo por trás da geração de imagem do ChatGPT. Seus pontos fortes são ilustração estilizada, trabalho de personagens e edição de imagem com mascaramento orientado por texto, com um estilo de seguimento de prompt que se alinha de perto ao que os modelos de texto da OpenAI esperam.

O preço de tabela é baseado em níveis, de cerca de US$ 0,011 por imagem no nível baixo/standard até US$ 0,25 no nível alto/grande. O nível médio-standard (cerca de US$ 0,05 por 1024×1024) é o padrão sensato para a maioria das cargas de trabalho de agente.

O que é o GPT Image 1?

Abril de 2026 · O principal modelo de texto para imagem da OpenAI. Precificado por nível em configurações de resolução e qualidade.

O GPT Image 1 é o modelo de texto para imagem em produção da OpenAI. Ele se combina nativamente com os modelos de texto da OpenAI, então, quando um agente já roda no GPT-5.4 ou GPT-5.5, o estilo do prompt se transfere de forma limpa e o fluxo do loop de edição permanece dentro da superfície da OpenAI.

Os pontos fortes estilísticos do modelo estão em ilustração, trabalho de personagens e edições que preservam a composição original enquanto alteram um elemento específico. A saída fotorrealista é sólida, mas tende ao estilo característico da OpenAI; equipes que querem um teto estético diferente frequentemente recorrem ao Flux Pro 1.1 Ultra ou ao SeedDream 4 em conjunto.

O que se destaca no GPT Image 1

Principais recursos de arquitetura e capacidade.

Texto para imagem baseado em difusão com suporte nativo a edição. O preço por nível escala conforme a resolução de saída (standard / grande) e a qualidade (baixa / média / alta), com o nível médio/standard como padrão típico. As entradas aceitam texto mais imagens de referência opcionais para edições e máscaras.

Especificações em resumo

FamíliaOpenAI Images
ModalidadesTexto para imagem, edição imagem para imagem
Níveis de saídaStandard / Grande × Baixo / Médio / Alto
Preço de tabela do fornecedorDe US$ 0,011 a US$ 0,25 por imagem
IdiomasPrompts multilíngues
Disponível na VM0Abril de 2026

Preços do GPT Image 1

Preço de tabela do fornecedor por unidade gerada.

Por imagem gerada$0.05
DetalheMedium standard tier (1024×1024)

Como o GPT Image 1 se comporta na prática

Comportamento observado em execuções de agentes em produção.

Ilustração estilizada

Um dos modelos mais fortes para saída não fotorrealista — ilustração, estilo de quadrinhos, pictórico. Bom encaixe quando o entregável é uma ilustração e não uma foto.

Fluxos de edição

Suporte nativo a edições mascaradas e mudanças locais orientadas por texto. Útil quando um agente precisa iterar sobre uma região específica de uma imagem em vez de regerar a coisa inteira.

Estilo de prompt

Alinha-se de perto às expectativas dos modelos de texto da OpenAI. Quando o agente que chama já está no GPT-5.4 ou GPT-5.5, os prompts escritos por esse agente se transferem com pouco ajuste.

Custo

Baseado em níveis — o nível médio/standard (~US$ 0,05 por 1024×1024) é o padrão típico. O nível alto/grande chega a US$ 0,25 e só vale a pena para saída em nível de entrega.

Melhores tarefas de agente para o GPT Image 1

O agente de ilustração que entrega estilo de quadrinhos ou desenhado à mão

A saída estilizada é onde o GPT Image 1 carrega uma vantagem real. Quadros de quadrinhos, ilustrações pictóricas, ícones com aparência desenhada à mão — tudo isso sai de forma mais confiável aqui do que nas alternativas que tendem ao fotorrealismo.

O agente de loop de edição na stack da OpenAI

Se o agente orquestrador já está no GPT-5.4 ou GPT-5.5, manter a geração de imagem dentro da superfície da OpenAI (GPT Image 1) significa que o estilo do prompt, a semântica de edição e as saídas estruturadas permanecem consistentes ao longo da execução.

Quando dispensar o GPT Image 1

Evite o GPT Image 1 quando o entregável for especificamente fotorrealista (o SeedDream 4 carrega um teto fotorrealista mais alto).

GPT Image 1 vs outros modelos

GPT Image 1 vs SeedDream 4

O SeedDream 4 lidera na estética fotorrealista a um preço ligeiramente menor; o GPT Image 1 lidera em ilustração estilizada e fluxos de edição.

GPT Image 1 vs Flux Pro 1.1 Ultra

O Flux Pro 1.1 Ultra carrega o teto estético mais alto para entregáveis hero-shot; o GPT Image 1 é o padrão natural da stack da OpenAI para todo o resto.

Conclusão: você deveria usar o GPT Image 1?

Escolha o GPT Image 1 quando seu agente já está na stack da OpenAI e você quer ilustração estilizada ou fluxos de edição nativos. Escale para o Flux Pro 1.1 Ultra para hero shots fotorrealistas; desça para o SeedDream 4 quando o custo for o fator dominante.

Perguntas frequentes

Como o GPT Image 1 é precificado?

Baseado em níveis — combinações de tamanho (standard / grande) e qualidade (baixa / média / alta). O nível médio/standard a ~US$ 0,05 por imagem 1024×1024 é o padrão típico.

O GPT Image 1 oferece suporte a edição de imagem?

Sim. Ele aceita uma imagem de referência mais uma máscara opcional e oferece suporte a edições locais orientadas por texto, bem como outpainting.

O GPT Image 1 consegue renderizar texto dentro das imagens?

Sim — trechos curtos de texto renderizam de forma confiável; passagens longas de texto ainda têm dificuldade, como na maioria dos modelos de difusão.

Ele é multimodal como entrada?

Edições imagem para imagem aceitam imagens de referência. O modelo gera apenas imagem como saída.

Alternativas

Usando o GPT Image 1 na VM0

Usando o GPT Image 1 na VM0

Os agentes da VM0 podem chamar o GPT Image 1 como parte de uma execução de agente, cobrado contra seus créditos VM0. O preço de tabela acima é o que o provedor upstream cobra; a VM0 o repassa com a conversão de créditos padrão.

Disponível na VM0 desde April 2026.