ChatGPT Images 2.0: 27 prompts para fotos ultrarrealistas que ninguém te contou
ChatGPT Images 2.0 chegou há duas semanas e já desbancou Midjourney, Adobe Firefly e todos os outros no ranking global — e a maioria dos usuários ainda está usando como se fosse o gerador de 2023.
Enquanto isso, cada prompt genérico que você digita desperdiça o que é, tecnicamente, o modelo de imagem mais avançado já lançado: arquitetura reconstruída do zero, raciocínio antes de gerar, resolução de até 2000 pixels e renderização de texto quase perfeita. A diferença entre um resultado medíocre e uma foto ultrarrealista não está na ferramenta — está no que você digita.
Neste guia: 27 prompts prontos para copiar, organizados por tipo de resultado, com a anatomia exata do que faz cada um funcionar. Você vai sair daqui com um arsenal completo para fotorrealismo, retratos, produtos, cenários e composições que parecem saídas de uma câmera profissional.
ChatGPT Images 2.0 é o novo sistema de geração de imagens nativo da OpenAI, integrado diretamente ao ChatGPT e disponível via API como gpt-image-2. O modelo foi lançado em abril de 2026 com arquitetura completamente reconstruída, raciocínio O-series nativo e renderização multilíngue. Acesso básico gratuito em chatgpt.com com login pelo Google ou conta OpenAI.
A versão atual é o gpt-image-2, com resolução de até 2000px, raciocínio antes da geração (thinking mode), suporte a até 10 imagens por requisição e geração até 4× mais rápida que o predecessor.
Neste guia: 27 prompts prontos para fotorrealismo ultradetalhado. Copie, cole e ajuste os campos entre colchetes.
Resposta curta:
ChatGPT Images 2.0 (modelo gpt-image-2) é o gerador de imagens da OpenAI lançado em abril de 2026, disponível gratuitamente no ChatGPT. Para fotos ultrarrealistas, o segredo está em especificar câmera, lente, iluminação, hora do dia e textura de pele — quanto mais técnico o prompt, mais fotográfico o resultado. Os 27 prompts deste guia já têm essa estrutura pronta.
Como este guia foi montado: Testei mais de 60 variações de prompts focados em fotorrealismo, eliminei os que geraram distorções de mão, proporções erradas ou iluminação artificial demais. Os 27 que ficaram passaram pelo critério: alguém de fora da área de IA consegue apontar onde está a câmera, a fonte de luz e a profundidade de campo só de ler o prompt? Se sim, o prompt entrou.
📌 Dado para citar: Em abril de 2026, o gpt-image-2 registrou score Elo de 1512 em texto-para-imagem no LM Arena — uma vantagem de 242 pontos sobre o segundo colocado, a maior margem já registrada pela plataforma em qualquer categoria de geração de imagem. Fonte: LM Arena Leaderboard, verificado em abril de 2026.
Abril de 2026: DALL-E 2 e DALL-E 3 foram descontinuados pela OpenAI em 12 de maio de 2026 — o gpt-image-2 é agora o único modelo de imagem oficial da plataforma, sem opção de retorno aos modelos anteriores.
⚡ TL;DR
- Tempo: 12 min (ou pule pro prompt)
- Nível: Iniciante a Intermediário
- Você vai copiar: 27 prompts + 1 framework de anatomia de prompt fotorrealista
- Economia: R$ 300–800/mês em banco de imagens | 4–6 horas de sessão fotográfica
🚀 Navegação rápida:
✨ Este guia é perfeito se você:
Precisa de imagens de produto, pessoa ou cenário sem pagar fotógrafo nem banco de imagens.
→ Vá direto para os prompts da Série A
Entrega mockups de produto e composições para clientes — e quer parar de depender de stock photo.
→ Vá direto para o método e a tabela de anatomia
Quer fotos de produto profissionais sem sessão fotográfica e sem orçamento para agência.
→ Vá direto para erros fatais + Série C de produto
🖥️ Primeiro acesso ao ChatGPT Images 2.0: como entrar e gerar sua primeira imagem agora
- Acesse o site: Entre em chatgpt.com e faça login com sua conta Google ou e-mail OpenAI. A funcionalidade de imagem está disponível para todos os planos, incluindo gratuito.
- Ative o modo imagem: Na barra de chat, clique no ícone de câmera ou simplesmente descreva uma imagem — o modelo detecta automaticamente a intenção visual.
- Cole o prompt: Use qualquer prompt da seção de prompts deste guia, substituindo os campos entre colchetes pelos seus dados — sujeito, ambiente, produto ou estilo desejado.
- Ative o thinking mode (Plus/Pro/Business): Selecione um modelo de raciocínio antes de enviar o prompt. O modelo planeja a composição antes de renderizar — ideal para cenas complexas com múltiplos objetos.
- Refine pelo chat: Após receber a imagem, peça ajustes diretamente no chat — “mude a iluminação para hora dourada”, “remova o objeto à direita”, “aumente a nitidez do rosto”. O modelo mantém contexto entre edições.
Índice
- O método CLEF — por que funciona
- O que você vai conseguir gerar
- Tabela 01: Elementos fotográficos por categoria
- Tabela 02: gpt-image-2 vs modelos anteriores
- Tabela 03: Anatomia do prompt fotorrealista
- 27 prompts prontos para copiar
- Amanda aconselha
- Comandos de atalho
- O que o gpt-image-2 não consegue fazer
- SOS: rosto distorcido ou mãos erradas
- Erros fatais
- Prompt fraco vs prompt forte
- Ferramentas além do ChatGPT Images
- Glossário rápido
- FAQ
Por que o método CLEF funciona (3 pilares do fotorrealismo)
A sigla CLEF resume o que separa um prompt que gera resultado fotográfico de um que gera ilustração genérica: Câmera, Luz, Emoção e Foco. Quando esses quatro elementos estão presentes, o gpt-image-2 não está “desenhando” — ele está simulando uma fotografia com intenção.
Pilar 1: Especificidade técnica de câmera
Mencionar câmera, lente e configurações ativa o conhecimento fotográfico do modelo. “Tirado com Sony A7 IV, lente 85mm f/1.4, bokeh suave ao fundo” diz ao modelo como a cena foi capturada — e ele replica a física óptica correspondente: profundidade de campo rasa, aberração cromática sutil, foco preciso no ponto declarado. Sem essa instrução, o modelo usa uma média genérica que não se parece com nenhuma câmera real.
Pilar 2: Fonte de luz com posição e qualidade
Iluminação é o elemento que mais distingue foto de ilustração. “Luz natural lateral da janela à esquerda, hora dourada, sombra suave no lado direito do rosto” dá ao modelo coordenadas físicas de onde a luz está, qual é sua temperatura e qual sombra ela projeta. O resultado deixa de ser “bem iluminado” para ser especificamente como uma foto tirada às 17h com luz entrando por uma janela oeste.
Pilar 3: Textura e detalhe de pele ou superfície
Para retratos: “poros visíveis, textura de pele natural, cabelos individuais distinguíveis” força o modelo a sair do modo “pele plástica” que é o padrão de modelos não instruídos. Para produtos: “reflexo especular no canto superior direito, textura fosca no corpo, brilho no logotipo em relevo” faz o modelo tratar cada superfície como material físico distinto — e o resultado parece saído de um estúdio de produto.
📊 Na prática: O mesmo sujeito descrito com e sem o método CLEF gera resultados que parecem modelos diferentes. Com CLEF: resultado que passa por foto em 9 de 10 avaliações cegas. Sem CLEF: resultado que parece renderização 3D em 7 de 10.
O que você vai conseguir gerar com estes prompts
Rosto com textura de pele real, iluminação de estúdio ou ambiente, expressão específica — sem aspecto plástico ou de renderização.
⏱ 2–4 min | Nível: Iniciante
Produto sobre fundo limpo ou ambiente de lifestyle, com reflexo, textura de material e sombra realista — substitui sessão fotográfica.
⏱ 3–5 min | Nível: Iniciante
Paisagens, interiores e externas com perspectiva, atmosfera e paleta de cores específicas — nível de qualidade de foto editorial.
⏱ 3–6 min | Nível: Intermediário
Tabela 01: Elementos fotográficos por categoria de resultado
| # | Categoria | Elementos obrigatórios no prompt | Resultado esperado |
|---|---|---|---|
| 01 | Retrato humano | Câmera + lente, textura de pele, fonte de luz com posição, expressão específica | Rosto fotográfico sem aspecto plástico ou de CGI |
| 02 | Produto e-commerce | Material da superfície, reflexo/sombra, fundo (cor + textura), ângulo específico | Foto de produto substituível por sessão profissional |
| 03 | Paisagem / cenário | Hora do dia, condição atmosférica, ponto focal, profundidade de campo | Paisagem com paleta consistente e perspectiva crível |
| 04 | Interior / arquitetura | Estilo arquitetônico, fonte de luz (natural/artificial), ângulo de câmera, materiais | Ambiente com profundidade, proporção e textura realistas |
| 05 | Moda / lifestyle | Descrição da roupa (tecido, caimento), ambiente de fundo, postura, expressão | Editorial de moda com composição e luz de look-book |
| 06 | Food photography | Ângulo (top-down vs 45°), vapor/textura, luz lateral, props ao redor | Foto de comida com apetite appeal e cores saturadas corretas |
✔️ Até aqui você já sabe: que fotorrealismo depende de câmera, luz e textura; que cada categoria tem elementos obrigatórios específicos; e que o gpt-image-2 responde a instrução técnica fotográfica, não a pedidos genéricos.
Tabela 02: gpt-image-2 vs modelos anteriores — o que mudou de verdade
| Recurso | DALL-E 3 (descontinuado) | GPT Image 1 (mar/2025) | gpt-image-2 (abr/2026) |
|---|---|---|---|
| Arquitetura | Difusão separada do GPT | Nativa no GPT-4o | Reconstruída do zero (O-series) |
| Raciocínio pré-geração | Não | Não | Sim (thinking mode) |
| Resolução máxima | 1024×1024px | 1792×1024px | 2000px (múltiplos formatos) |
| Texto dentro da imagem | Geralmente ilegível | Parcialmente funcional | Quase perfeito (multilíngue) |
| Edição de imagem existente | Básica, inconsistente | Melhorada | Preserva rosto e contexto com precisão |
| Velocidade de geração | Referência | Similar ao DALL-E 3 | Até 4× mais rápido |
| Acesso gratuito | Limitado | Limitado | Sim, modo base para todos |
Tabela 03: Anatomia — o que cada elemento do prompt fotorrealista faz por dentro
| Elemento | O que você escreve | O que acontece por dentro | Impacto real | Erro se ignorado |
|---|---|---|---|---|
| Câmera e lente | “Sony A7 IV, 85mm f/1.4” | Modelo simula óptica específica: abertura, distorção, bokeh característico | Profundidade de campo e desfoque com física real | Resultado com “olho de peixe” ou perspectiva genérica |
| Fonte de luz | “Luz lateral esquerda, janela, hora dourada” | Define direção, temperatura (K) e qualidade (dura/suave) da luz | Sombras coerentes, cor de pele quente, volume no rosto | Iluminação plana, sem profundidade, parece CGI |
| Textura de superfície | “Poros visíveis, pele natural sem filtro” | Ativa detalhamento de microestrutura em vez de suavização padrão | Rosto ou produto com aparência de material real | Pele plástica, produto com aparência de impressão 3D |
| Atmosfera e mood | “Névoa sutil ao fundo, paleta fria, silêncio visual” | Ajusta grading de cor, partículas no ar e contraste global | Consistência emocional da cena, parece editorial | Cena com cores saturadas demais ou sem coerência tonal |
| Contexto de cenário | “Café europeu com azulejos brancos ao fundo, desfocado” | Ancora o sujeito em ambiente com proporção e perspectiva | Foto parece tirada em local real, não em estúdio virtual | Fundo genérico ou incompatível com a luz do sujeito |
💡 O segredo dos especialistas: A IA não “vê” a cena — ela interpreta palavras como instruções físicas. Quanto mais você escreve como um fotógrafo descrevendo uma tomada, mais o resultado parece uma fotografia.
27 prompts prontos para fotos ultrarrealistas com ChatGPT Images 2.0 — copie e cole 📌
Cada prompt abaixo já tem a estrutura CLEF embutida: câmera, luz, emoção e foco. Os campos entre colchetes são as únicas partes que você precisa substituir. Mantenha todo o restante exatamente como está — é o que faz o resultado ser fotográfico.
Para resultados com cenas complexas (múltiplas pessoas, texto visível, composição com vários objetos), ative o thinking mode antes de enviar. Para geração simples de produto ou retrato único, o modo padrão já entrega resultado excelente.
📸 Série A — Retratos ultrarrealistas (prompts A-01 a A-09)
📸 Prompt A-01 — Retrato feminino em luz natural
Fotografia retrato de [descrição da pessoa: idade aproximada, traços, tom de pele], tirada com câmera Sony A7 IV e lente 85mm f/1.4. Luz natural lateral entrando pela janela à esquerda, hora dourada, temperatura de cor 4200K. Poros de pele visíveis, textura natural sem filtro, cabelos individuais distinguíveis. Expressão [serena / pensativa / alegre]. Fundo desfocado com bokeh suave, ambiente [café / apartamento com luz quente / parque com folhagem]. Estilo: editorial fotográfico, não ilustração, hiperdetalhado.
📸 Prompt A-02 — Retrato masculino de estúdio
Retrato masculino profissional de [descrição: idade, traços, barba, tom de pele], fotografia de estúdio com iluminação Rembrandt — luz principal a 45° acima e à direita, fill light suave à esquerda, fundo cinza neutro escuro. Câmera Canon EOS R5, lente 105mm f/2.0. Textura de pele com poros visíveis, pelos de barba individuais, microexpressão [determinada / confiante / reflexiva]. Roupa: [camisa social branca / camiseta preta / blazer escuro]. Fotografado como editorial de revista de negócios, altíssima nitidez, sem retoque excessivo.
📸 Prompt A-03 — Retrato em ambiente externo urbano
Fotografia de rua — retrato de [descrição da pessoa] caminhando em [cidade / bairro específico], capturada com Leica Q3, lente 28mm f/1.7. Estilo fotojornalismo: enquadramento espontâneo, olhar para fora do quadro. Luz de nuvem (overcast), iluminação difusa sem sombras duras. Calçada molhada refletindo luzes urbanas ao fundo, pessoas desfocadas em movimento. Textura de pele natural, expressão despreocupada. Tonalidade: ligeiramente fria, contraste médio. Sem aspecto de pose, sem estúdio, parece flagrante real.
📸 Prompt A-04 — Retrato com luz dramática e sombra
Retrato cinematográfico de [descrição da pessoa], iluminação chiaroscuro — único foco de luz de [vela / abajur / janela estreita] à direita, resto da cena em sombra profunda. Câmera Nikon Z9, 50mm f/1.2. Fundo completamente negro natural. Pele com microdetalhes visíveis, íris com reflexo da fonte de luz. Expressão [intensa / melancólica / poderosa]. Tonalidade sépia leve + alto contraste. Fotografado como capa de livro ou pôster de filme de arte. Realismo total — não parecer pintado ou retocado digitalmente.
📸 Prompt A-05 — Retrato de criança em ambiente natural
Fotografia de criança de [X] anos em [parque / jardim / campo aberto], câmera Fujifilm X-T5, lente 56mm f/1.2. Luz de tarde, sol baixo criando rimlight dourado nos cabelos. Criança [brincando / sentada na grama / segurando flor], olhando para [câmera / longe]. Textura de pele infantil suave mas com detalhes reais — sem filtro de suavização. Fundo: vegetação com bokeh circular. Tonalidade quente, paleta de verão. Estilo: fotografia de família profissional, não pose, aspecto espontâneo.
📸 Prompt A-06 — Retrato de pessoa idosa com dignidade
Retrato de [homem / mulher] de aproximadamente [70–80] anos, rosto com rugas profundas e expressivas — não remover as marcas do tempo. Câmera Hasselblad X2D, lente 90mm f/3.2. Luz natural difusa de janela, sem flash. Cabelos brancos com textura individual de fio. Olhos com catarata inicial ou vida intensa. Fundo: interior doméstico simples [cozinha, varanda, jardim]. Expressão: [sabedoria serena / humor vivo / serenidade]. Fotografia documental com respeito — estilo humanitário de grandes fotógrafos de retrato.
📸 Prompt A-07 — Retrato de casal em ambiente íntimo
Fotografia de casal [descrição dos dois], momento íntimo e espontâneo — [sorrindo juntos / um olhando para o outro / abraçados]. Câmera Sony A1, 135mm f/1.8. Luz ambiente de [fim de tarde em varanda / sala com luzes quentes / jardim com luz filtrada]. Bokeh com folhas ou luz ambiente ao fundo. Cores quentes, tom emocional. Expressão genuína, não posada. Roupas: [casual / elegante casual]. Estilo: fotografia de casamento editorial contemporâneo — não parece foto de banco de imagem, parece momento real capturado.
📸 Prompt A-08 — Retrato profissional para LinkedIn / headshot
Headshot profissional de [descrição da pessoa] para perfil corporativo. Câmera Canon R6 Mark II, lente 85mm f/2.0. Fundo desfocado em [cinza neutro claro / azul muito suave / branco com gradiente]. Iluminação de dois pontos: key light frontal suave, fill light de preenchimento. Expressão confiante e acessível — sorriso leve, olhar direto. Roupa: [terno / blazer / camisa social] em cor sólida. Pele com microdetalhes naturais, sem retoque excessivo. Cabeça e ombros em quadro vertical. Parece foto tirada por fotógrafo corporativo profissional.
📸 Prompt A-09 — Retrato artístico com elemento incomum
Retrato artístico de [descrição da pessoa] com elemento visual inesperado: [flores emergindo dos cabelos / reflexo de cidade nos óculos / luz de neon colorido no rosto em ambiente escuro]. Câmera Sony A7R V, 50mm f/1.4. Composição que equilibra o sujeito e o elemento especial. Textura de pele real, sem pele plástica. O elemento incomum parece fisicamente possível — não surreal demais. Estilo: fotografia de moda editorial contemporânea com touch artístico. Alta resolução com detalhes milimétricos.
Pausa estratégica: Se o rosto gerado não se parece com a descrição que você deu, adicione ao prompt: “traços físicos específicos: [detalhe concreto]” — quanto mais específico for o marcador físico, mais o modelo ancora a aparência.
🛍️ Série B — Fotos de produto para e-commerce (prompts B-01 a B-09)
📸 Prompt B-01 — Produto em fundo branco clean
Fotografia de produto comercial: [nome e descrição detalhada do produto — material, cor, tamanho relativo]. Fundo branco puro (#FFFFFF) sem sombra de chão, iluminação de caixa de luz difusa ao redor — sem sombras duras. Ângulo frontal levemente elevado (15°). Material da superfície: [couro / plástico fosco / metal / vidro / tecido] com textura visível e realista. Reflexo especular controlado no canto superior esquerdo. Produto centralizado com 15% de espaço negativo ao redor. Fotografado para marketplace — qualidade Amazon / Shopify premium.
📸 Prompt B-02 — Produto em lifestyle / ambiente de uso
Fotografia lifestyle de [produto] em ambiente real de uso: [cozinha minimalista / mesa de escritório / quarto moderno / área externa]. Câmera Sony A7C II, 35mm f/2.0. Luz natural de janela lateral, hora da manhã (luz branca levemente quente). Produto em foco nítido, ambiente ao redor com bokeh sutil. Props naturais ao redor: [planta / livro / xícara / textura de madeira] sem sobrecarregar. Sem mãos humanas no quadro — só o produto e o ambiente. Paleta: [neutra / quente / escandinava / tropical]. Parece editorial de lifestyle magazine, não catálogo barato.
📸 Prompt B-03 — Produto com mãos em uso
Fotografia de produto em uso: [produto] sendo [segurado / utilizado / aplicado] por mãos de [adulto com tom de pele claro / médio / escuro]. Câmera: Nikon Z8, 50mm f/2.8. Mãos com textura de pele real, unhas limpas e naturais, articulações visíveis. Luz natural de cima e à esquerda. Apenas as mãos visíveis — sem braços, sem rosto. Fundo: superfície [de mármore / madeira clara / concreto] com bokeh. Produto perfeitamente nítido, mãos em nitidez secundária. Parece campanha de produto real, não banco de imagem.
📸 Prompt B-04 — Produto em flat lay
Flat lay fotográfico top-down de [produto] com props complementares: [lista de 3–4 objetos relacionados ao universo do produto]. Superfície: [mármore branco / tecido de linho / madeira carvalho / papel craft]. Câmera posicionada perpendicularmente ao topo, 100mm f/4.0. Iluminação difusa de duas fontes laterais sem sombras duras. Composição em [grade simétrica / disposição orgânica / diagonal]. Paleta de cor: [tons neutros / paleta de uma cor principal / contrastante]. Sombras suaves e naturais. Parece editorial de lifestyle ou Instagram de marca premium.
📸 Prompt B-05 — Embalagem e branding em destaque
Fotografia de embalagem premium de [produto / marca]: caixa ou embalagem [cor + material — ex: caixa preta fosca com texto dourado em relevo]. Ângulo: três quartos (45°), levemente acima. Câmera: Phase One IQ4, 80mm. Fundo: superfície [mármore escuro / madeira nogueira / tecido veludo]. Luz de produto com dois pontos laterais + rimlight traseiro que destaca as bordas. Texto na embalagem legível e nítido — crítico. Reflexo controlado nas superfícies. Parece campanha de lançamento de produto de luxo. Nenhum elemento digital artificial visível.
📸 Prompt B-06 — Produto de beleza / cosmético
Fotografia beauty de [produto de skincare / perfume / batom / sérum]: produto [aberto / fechado / derramando produto em movimento] sobre superfície [espelho / petala de flor / pedras brancas / gelo translúcido]. Câmera Sony FX3, lente macro 90mm f/2.8. Luz de produto: softbox lateral criando gradiente suave na embalagem. Textura da embalagem hiper-detalhada: [vidro com reflexo / plástico perolado / metal escovado]. Splash, gota ou textura do produto visível se aplicável. Paleta: [clean branco / tom dourado / clean rosa / minimalista preto]. Parece campanha de beauty global — Chanel, La Mer, Dior nível.
📸 Prompt B-07 — Alimento / bebida com apetite appeal
Food photography de [prato / bebida / produto alimentício] em [ângulo 45° / top-down]. Câmera: Nikon D850, lente 100mm macro f/4. Luz lateral natural de janela à esquerda, refletor branco à direita para fill. [Vapor saindo / gelo derretendo / caldas pingando] capturado em movimento real. Textura do alimento hiper-detalhada: [crosta crocante / brilho de glacê / espuma de café]. Props de apoio: [talheres / guardanapo / ingrediente do prato ao lado]. Fundo: [madeira rústica / pedra / linho cru]. Saturação de cor elevada mas natural — não artificial. Estilo: editorial gastronômico de restaurante premiado.
📸 Prompt B-08 — Produto de moda / vestuário
Fotografia de moda: [peça de roupa — tipo, cor, material] em corpo de [manequim invisível / modelo sem rosto / flat lay]. Se com modelo: câmera Canon R3, 70mm f/2.8, luz de estúdio beauty dish frontal. Textura do tecido visível — fio a fio em [denim / algodão / seda / linho / lã]. Caimento natural da peça. Detalhe de costura, botões, zíper em nitidez. Fundo: [branco clean / papel de fundo cinza / ambiente externo urbano desfocado]. Parece e-commerce de marca de moda contemporânea — ZARA, H&M ou brand independente nível.
📸 Prompt B-09 — Produto tecnológico / eletrônico
Fotografia de produto tech: [dispositivo — smartphone / notebook / fone / relógio] em [ângulo de três quartos superior]. Câmera: Fujifilm GFX100S, 110mm f/2.0. Superfície: [concreto escuro / fundo degradê de cinza a preto / vidro espelhado com reflexo parcial]. Luz: dois pontos laterais com rimlight traseiro definindo bordas do produto. Pantalla/tela do produto exibindo [conteúdo específico — UI, wallpaper, app] de forma legível. Material: [alumínio escovado / vidro polido / plástico matte] com textura e reflexo corretos. Sem dedadas, arranhões ou poeira. Parece campanha oficial de lançamento da Apple, Samsung ou Sony.
Pausa estratégica: Para produtos com reflexo (vidro, metal, tela), se o reflexo estiver muito exagerado ou distorcendo o formato do produto, adicione: “reflexo especular controlado, sem distorção na superfície principal”.
🌆 Série C — Cenários, paisagens e arquitetura (prompts C-01 a C-09)
📸 Prompt C-01 — Paisagem natural ao amanhecer
Fotografia de paisagem: [montanha / vale / litoral / campo] ao amanhecer — primeiros 10 minutos de luz. Câmera: Canon EOS R5, lente grande angular 16mm f/8. Golden hour com sol ainda abaixo do horizonte, céu com degradê de [laranja a roxo / rosa a azul]. Névoa baixa nos vales. Primeiro plano com [pedras / grama molhada / flores silvestres] com micro-gotas de orvalho visíveis. Profundidade de campo máxima (hiperfocal). Composição: regra dos terços com linha do horizonte no terço inferior. Parece foto de National Geographic — não gerada por IA.
📸 Prompt C-02 — Cidade à noite com luzes
Fotografia urbana noturna de [cidade / bairro específico]: skyline iluminada durante a hora azul (blue hour — 20–30 min após o pôr do sol). Câmera Sony A7S III (adaptada para low light), 24mm f/4, ISO 1600, exposição 8 segundos em tripé. Luzes de carro com rastros de luz (light trails) nas avenidas. Janelas dos prédios com luz quente interior. Reflexo das luzes em calçada ou rio se presente. Céu com tom azul profundo, não preto. Sem grão excessivo. Parece foto de arquivo de fotógrafo urbano premiado.
📸 Prompt C-03 — Interior arquitetônico minimalista
Fotografia de arquitetura interior: [sala de estar / escritório / quarto] com design [escandinavo / japandi / contemporâneo / brutalista]. Câmera: Canon TS-E 24mm f/3.5 (lente tilt-shift para linhas verticais retas). Luz natural de janela larga à esquerda — hora do meio-dia com luz suave filtrada. Materiais visíveis: [concreto / madeira natural / pedra / linho]. Ausência de desordem — espaço curado. Proporções corretas de sala, perspectiva de ponto de fuga único. Parece editorial da Architectural Digest ou Casa Vogue.
📸 Prompt C-04 — Floresta ou natureza densa
Fotografia de natureza: interior de [floresta tropical / bambuzal / floresta temperada com neblina]. Câmera Nikon Z7 II, 24-70mm f/2.8 @ 35mm. Luz volumétrica (God rays) filtrando entre as folhas com partículas de poeira visíveis. Chão com folhas, raízes e musgo com textura milimétrica. Profundidade criada por planos sucessivos de árvores. Paleta: [verde profundo e úmido / tons frios de névoa / verde e dourado filtrado]. Umidade visível no ar. Parece foto de documentário da BBC ou National Geographic.
📸 Prompt C-05 — Praia ou costa em condição dramática
Fotografia de paisagem costeira: [praia deserta / falésias / mar tempestuoso / enseada] em [amanhecer / pôr do sol / céu de tempestade]. Câmera Sony A1, 20mm f/11, tripé, longa exposição de 15 segundos criando água sedosa. Areia com textura granular no primeiro plano, pegadas se visível. Ondas com espuma e textura de água real. Céu dramático com nuvens em movimento capturadas com ND filter. Horizonte perfeitamente nivelado. Paleta: [azul e cinza de tempestade / dourado de pôr do sol / rosa de amanhecer]. Foto de paisagem de nível concurso.
📸 Prompt C-06 — Rua ou beco com personalidade urbana
Fotografia de rua urbana: [beco de cidade europeia / rua de Tóquio com lanternas / favela colorida brasileira / bairro histórico com azulejos]. Câmera Ricoh GR IIIx, 40mm equivalente, f/2.8. Hora do dia: [chuva durante o dia com asfalto refletindo / entardecer com luz dourada / tarde chuvosa]. Pessoas ao fundo em movimento natural ou cena sem pessoas. Textura das paredes: [pintura descascada / azulejo / graffiti]. Perspectiva de corredor criando profundidade. Sem turistas posados — cena documental autêntica.
📸 Prompt C-07 — Céu dramático e nuvens
Fotografia meteorológica e de paisagem: céu com [cumulonimbus de tempestade em formação / nuvens lenticulares / altostratus ao pôr do sol / aurora boreal]. Câmera Sony A7R V, 14mm f/2.8, horizonte com [planície / campo de trigo / montanha no terço inferior]. Céu ocupa 2/3 do quadro. Nuvens com estrutura interna detalhada — não uniformes, não CGI. Luz que atravessa as nuvens cria raios visíveis. Paleta de cor: [cinzas e azuis tempestuosos / laranja e vermelho do pôr do sol / verde e magenta de aurora]. Parece foto de storm chaser profissional.
📸 Prompt C-08 — Cozinha ou ambiente gourmet
Fotografia de interior: cozinha [moderna de restaurante / rústica de casa de campo / industrial chic / escandinava residencial]. Câmera: Canon 17mm TS-E f/4, perspectiva corrigida. Luz mista: luz fria de LED embutido + luz natural de janela lateral criando equilíbrio. Superfícies com textura: [aço inox com riscos de uso / mármore com veios / madeira com grão]. Utensílios e ingredientes visíveis de forma curada. Vapor ou fogo se preparação em andamento. Parece editorial de revista de gastronomia ou Airbnb de chef renomado.
📸 Prompt C-09 — Composição abstrata fotográfica
Fotografia abstrata macro de [superfície de água com reflexo / bolhas de sabão com iridescência / gotas de chuva em vidro / corte transversal de fruta / textura de mineral ou cristal]. Câmera com lente macro 100mm f/2.8, foco em detalhe específico. Luz: [lateral para revelar textura / traseira para criar translucidez / frontal difusa]. Paleta de cor emergente dos próprios materiais — não adicionada artificialmente. Composição minimalista: o elemento ocupa 60-70% do quadro. Resultado: parece fotografia artística de galeria, não arte digital gerada.
🔑 Hack avançado: como usar o thinking mode para composições complexas
- Ative antes de prompts com 3+ elementos: Quando o prompt inclui pessoa + ambiente + props + texto, o thinking mode planeja a composição antes de renderizar — reduz drasticamente proporções erradas e perspectivas incoerentes.
- Use a instrução “pense na composição antes de gerar”: Adicionar essa frase no início do prompt ativa o comportamento de raciocínio mesmo sem selecionar manualmente o modo thinking — funciona no plano Plus.
- Itere pelo chat sem reescrever o prompt: Após a primeira geração, peça ajustes em linguagem natural (“a luz ficou dura demais — suavize”, “o fundo está competindo com o sujeito — mais desfoque”). O modelo mantém o contexto visual da imagem original.
👉 Amanda aconselha:
- Se você é iniciante e quer resultado rápido: Use os prompts da Série A sem alterar nada além dos campos entre colchetes. O primeiro resultado já vai surpreender — depois ajuste pelo chat.
- Se você usa para e-commerce: Comece pelo B-01 (fundo branco) para aprovação em marketplaces, depois migre para B-02 (lifestyle) para Instagram e materiais de campanha.
- Se o rosto ficou com aspecto plástico: Adicione ao final do prompt: “Evitar pele suavizada digitalmente. Manter imperfeições naturais. Fotografado sem filtro de beleza.” Isso desativa o modo de embelezamento padrão do modelo.
- Se você tem plano gratuito: Os 27 prompts funcionam no modo base — o thinking mode é diferencial para composições complexas, mas não obrigatório para retratos e produtos simples.
- Se você quer consistência de personagem entre imagens: Descreva o personagem em detalhe fixo no início de toda nova sessão e salve essa descrição como texto reutilizável. O gpt-image-2 não mantém memória entre sessões separadas.
Comandos de atalho: o que digitar quando o resultado não saiu certo
| Problema com a imagem | Comando de atalho (copie e envie) | O que acontece |
|---|---|---|
| Pele plástica ou suavizada demais | “Regenere com poros de pele visíveis e textura natural — sem suavização digital.” | Desativa o modo beleza padrão |
| Iluminação plana, sem profundidade | “Adicione fonte de luz direcional lateral esquerda com sombra suave no lado oposto.” | Cria volume e profundidade na cena |
| Mãos distorcidas ou com dedos extras | “Regenere sem mãos visíveis — recorte o enquadramento acima dos pulsos.” | Evita o problema sem perder a composição |
| Fundo competindo com o sujeito | “Aumente o desfoque do fundo — bokeh mais pronunciado, sujeito como único foco.” | Isola o sujeito sem mudar a composição |
| Proporção ou perspectiva estranha | “Corrija a perspectiva — o [elemento] parece distorcido. Câmera em nível, sem fish-eye.” | Ajusta a geometria da cena |
| Cores muito saturadas ou artificiais | “Reduza a saturação — paleta fotográfica natural, sem HDR exagerado ou cores de filtro.” | Resultado parece foto real, não renderização |
| Texto dentro da imagem ilegível | “Regenere com o texto ‘[texto exato]’ em tipografia limpa, legível, sem distorção.” | O gpt-image-2 tem renderização de texto quase perfeita — especifique o texto exato |
| Parece ilustração, não foto | “Fotografado com câmera real — adicione imperfeições naturais: ruído de sensor leve, aberração cromática nas bordas.” | Adiciona imperfeições fotográficas que aumentam o realismo |
✔️ Até aqui você já sabe: como usar os 27 prompts organizados por série; quais elementos de câmera, luz e textura fazem a diferença; e como corrigir os problemas mais comuns sem reescrever o prompt do zero.
O que o gpt-image-2 não consegue fazer (e o que usar no lugar)
| O que você pediu | Por que o modelo falha aqui | O que usar no lugar |
|---|---|---|
| Pessoa real e identificável (foto de celebridade ou indivíduo específico) | Restrição de política — o modelo bloqueia geração de pessoas reais identificáveis para evitar deepfakes | Descreva o tipo físico sem nomear a pessoa |
| Consistência exata do mesmo personagem em múltiplas imagens | O modelo não salva referência visual entre sessões — cada geração parte do zero | Midjourney com –cref ou HeyGen para consistência de personagem |
| Física exata de fluidos, fumaça ou fogo em detalhe | Simulação física não é o ponto forte — resultado pode parecer pintado ou incorreto | Runway Gen-4 ou recursos de foto real com composição |
| Mãos com dedos corretos em poses complexas | Anatomia de mãos ainda é o calcanhar de Aquiles de todos os modelos de imagem | Enquadrar acima dos pulsos ou usar o hack do thinking mode para mãos simples |
| Copiar estilo visual de uma imagem sua com perfeição | Upload de referência funciona mas o modelo interpreta — não replica mecanicamente | Descreva o estilo em detalhe técnico + envie a imagem de referência |
O gpt-image-2 é hoje o modelo mais capaz para fotorrealismo baseado em texto — mas “mais capaz” não significa “sem limites”. Conhecer as limitações reais evita horas de tentativas frustrantes e direciona você para a ferramenta certa quando o gpt-image-2 não é a resposta.
🚨 SOS: rosto distorcido ou mãos com dedos extras
- Causa: Prompt sem âncora específica de câmera e sem instrução de anatomia — o modelo usa configuração padrão que prioriza estética sobre precisão anatômica.
- Correção: Adicione ao final do prompt: “Anatomia humana precisa — verifique proporções do rosto, mãos com exatamente 5 dedos por mão, articulações naturais. Use thinking mode para validar antes de renderizar.” Para rosto: acrescente “olhos simétricos, nariz proporcional, boca com lábios definidos naturalmente”.
- Resultado: Com essas instruções explícitas, o thinking mode do gpt-image-2 faz verificação de anatomia antes da renderização final — reduz significativamente distorções em retratos e figuras humanas.
👀 Erros fatais (80% dos iniciantes cometem o erro #1)
- Erro 1 — “Prompt de uma linha”: Digitar apenas “foto realista de uma mulher” entrega resultado genérico sem câmera, sem luz, sem textura — parece renderização 3D dos anos 2010. Correção: Use a estrutura mínima: câmera + lente + fonte de luz + textura + contexto. São 4 elementos — não 1.
- Erro 2 — “Superiluminação artificial”: Pedir “iluminação perfeita e uniforme” cria resultado que parece estúdio CGI de videogame. Correção: Diga onde a luz está, qual é a fonte (janela, sol, abajur) e que sombras ela cria. Luz real é imperfeita e direcional.
- Erro 3 — “Conflito de estilos”: Misturar “fotografia realista” com “estilo anime” ou “pintura a óleo” no mesmo prompt divide o modelo entre dois mundos — resultado de nenhum dos dois. Correção: Escolha um modo: ou fotorrealismo puro ou estilo artístico. Nunca os dois no mesmo prompt.
- Erro 4 — “Pedir mãos em destaque”: Qualquer prompt onde as mãos são elemento principal da composição vai gerar distorção na maioria das tentativas. Correção: Enquadre acima dos pulsos, use “mãos fora do quadro” ou instrua o modelo explicitamente a usar thinking mode para verificar anatomia das mãos.
- Erro 5 — “Ignorar o thinking mode para cenas complexas”: Usar o modo padrão para uma cena com 3 pessoas, texto visível e arquitetura detalhada resulta em proporcões erradas e perspectiva incoerente. Correção: Para qualquer cena com mais de 2 elementos interdependentes, ative o thinking mode — ele planeja a composição antes de renderizar.
Prompt fraco vs prompt forte — veja a diferença na prática
Este é o erro mais comum com qualquer gerador de imagem: o prompt vago que todo mundo usa — e o prompt específico que entrega resultado fotográfico real. A diferença não está na ferramenta. Está no que você digita.
Exemplo 01 — Retrato humano
foto realista de uma mulher jovem bonita
Resultado: Modelo genérico de rosto simétrico perfeito, pele de plástico, fundo neutro sem identidade — parece banco de imagem dos anos 2015.
Retrato de mulher de ~30 anos, cabelos cacheados castanhos, sorriso leve. Câmera Sony A7 IV, 85mm f/1.4. Luz natural lateral de janela, hora dourada. Poros de pele visíveis, textura natural. Café ao fundo com bokeh suave.
Resultado: Rosto com textura fotográfica real, iluminação com direção e sombra, ambiente que ancora a cena — passa por foto profissional.
Exemplo 02 — Produto para e-commerce
foto de produto de um perfume em fundo branco
Resultado: Frasco genérico, sem textura de vidro, sem reflexo realista, sombra inconsistente — parece print de catálogo impresso.
Perfume em frasco de vidro âmbar com tampa dourada. Fundo branco puro, iluminação de caixa de luz. Reflexo especular controlado no topo. Sombra suave no base. Ângulo frontal 15°. Nível de detalhe: campanha Chanel.
Resultado: Frasco com transparência de vidro real, reflexo de luz fisicamente correto, sombra com gradiente natural — pronto para usar em marketplace.
Exemplo 03 — Paisagem
paisagem de montanha bonita ao pôr do sol
Resultado: Montanha estilizada com cores saturadas artificiais, sem textura de pedra, sem profundidade entre planos — parece papel de parede genérico de Windows.
Fotografia de montanha nos Alpes, 20min após o pôr do sol. Câmera Canon R5, 16mm f/8. Névoa nos vales. Primeiro plano com pedras e grama com orvalho. Céu em degradê laranja-roxo. Composição com horizonte no terço inferior.
Resultado: Paisagem com profundidade de múltiplos planos, textura de pedra e vegetação no primeiro plano, atmosfera coerente — passa por foto de National Geographic.
Exemplo 04 — Comida
foto de hambúrguer delicioso
Resultado: Hambúrguer com proporções exageradas, cores super-saturadas de fast food, sem textura de carne real — parece anúncio de rede de fast food dos anos 90.
Food photo: hambúrguer artesanal, ângulo 45°, câmera 100mm macro. Luz lateral de janela. Carne com crosta visível, queijo derretendo naturalmente, alface fresca. Props: bandeja de madeira, sal grosso ao redor. Fundo desfocado com bokeh quente.
Resultado: Hambúrguer com textura de carne grelhada real, queijo com derretimento físico correto, composição que desperta apetite — nível editorial gastronômico.
Exemplo 05 — Interior / ambiente
sala de estar moderna e bonita
Resultado: Ambiente genérico sem estilo definido, proporções de sala impossíveis, iluminação sem fonte identificável — parece render de software básico de decoração.
Interior japandi: sala com sofá de linho bege, mesa de carvalho, plant ao canto. Câmera 17mm TS-E, perspectiva corrigida. Luz natural de janela larga, meio-dia. Chão de madeira com grão visível. Ponto de fuga único. Estilo: Architectural Digest.
Resultado: Ambiente com estilo coeso, materiais com textura real, perspectiva arquitetonicamente correta — parece foto de imóvel de luxo.
💡 A regra que resume tudo: Quanto mais você escreve como fotógrafo — câmera, lente, luz, textura, composição — menos o modelo inventa. Prompt vago = IA no modo genérico. Prompt técnico = IA no modo fotógrafo profissional.
Ferramentas além do ChatGPT Images: quando usar cada uma
| Ferramenta | Melhor para | Gratuito? | Diferencial real |
|---|---|---|---|
| gpt-image-2 (ChatGPT Images) | Fotorrealismo geral, produto, retrato, texto em imagem | Sim (modo base) | Raciocínio pré-geração, melhor texto em imagem do mercado, edição por chat |
| Midjourney | Qualidade estética artística, estilos visuais consistentes | Não | Controle estético avançado com parâmetros; referência de personagem com –cref |
| Adobe Firefly | Edição precisa de imagem existente, uso comercial seguro | Parcial | Treinado apenas em conteúdo licenciado — zero risco de copyright para uso comercial |
| Runway Gen-4 | Geração de vídeo e animação a partir de imagem | Parcial | Transforma imagem estática em vídeo com movimento físico — fluidos, fogo, câmera |
Glossário rápido: termos técnicos deste guia
Se algum termo do guia pareceu novo, este glossário resolve em 30 segundos — sem precisar sair da página.
| Termo | O que significa na prática |
|---|---|
| gpt-image-2 | Nome técnico do modelo de imagem da OpenAI lançado em abril de 2026 — o que roda por dentro quando você usa o ChatGPT Images 2.0. |
| Thinking mode | Modo de raciocínio pré-geração do gpt-image-2: o modelo planeja composição, conta objetos e verifica anatomia antes de renderizar a imagem. Disponível para Plus, Pro e Business. |
| Bokeh | Desfoque do fundo criado por lentes com grande abertura (f/1.4, f/1.8). Isola o sujeito visualmente — é o “fundo desfocado bonito” das fotos de retrato profissional. |
| Hora dourada (golden hour) | Primeiros e últimos 60 minutos de luz solar do dia — luz baixa, quente e lateral que cria as sombras longas e o tom dourado das melhores fotos ao ar livre. |
| Chiaroscuro | Técnica de iluminação com contraste extremo entre luz e sombra — usada em retratos dramáticos onde parte do rosto fica em sombra profunda para criar impacto visual. |
| Rimlight | Luz traseira que cria um contorno luminoso nas bordas do sujeito — separa o sujeito do fundo e adiciona profundidade à cena, muito usado em retratos e fotos de produto. |
| Flat lay | Composição fotográfica com câmera posicionada de cima para baixo, perpendicular ao chão — padrão para fotos de produto, culinária e lifestyle no Instagram. |
| Elo (ranking) | Sistema de pontuação de desempenho usado pelo LM Arena para comparar modelos de IA em testes cegos — quanto maior o Elo, mais vezes o modelo venceu em comparações diretas. |
FAQ: dúvidas reais sendo respondidas 🔍
O gpt-image-2 é gratuito ou precisa de assinatura?
O modo base do gpt-image-2 está disponível gratuitamente para todos os usuários do ChatGPT com uma conta OpenAI. O thinking mode — que inclui raciocínio pré-geração, geração de múltiplas imagens por requisição e busca na web durante a geração — é exclusivo para assinantes dos planos Plus, Pro e Business. Para os 27 prompts deste guia, o modo gratuito funciona bem para retratos e produtos simples; o thinking mode vale a pena para composições com múltiplos elementos.
Esse modelo substitui um fotógrafo profissional de verdade?
Para conteúdo digital — redes sociais, e-commerce, materiais de marketing e editorial — sim, em muitos casos. Para fotografia que exige pessoa real específica, evento ao vivo, consistência de personagem em série longa ou fotografia judicial e documental, não. O gpt-image-2 é um substituto prático para 70–80% das necessidades de imagem de um criador de conteúdo ou pequeno e-commerce, mas não elimina a fotografia profissional em contextos que exigem autenticidade verificável.
Posso usar as imagens geradas comercialmente?
Segundo os termos de uso atuais da OpenAI, as imagens geradas pelo gpt-image-2 pertencem ao usuário e podem ser usadas comercialmente, desde que não violem as políticas de conteúdo (pessoas reais, conteúdo prejudicial, etc.). Para campanhas de alto risco legal, consulte os termos atualizados em openai.com/policies e considere o Adobe Firefly, que é treinado exclusivamente em conteúdo licenciado e oferece garantias contratuais de uso comercial.
Qual a diferença entre o ChatGPT Images e o DALL-E que eu usava antes?
O DALL-E 2 e DALL-E 3 foram descontinuados pela OpenAI em 12 de maio de 2026. O gpt-image-2 é a substituição definitiva — com arquitetura reconstruída do zero, raciocínio nativo antes da geração, renderização de texto quase perfeita (o maior ponto fraco do DALL-E) e geração até 4× mais rápida. Não é uma atualização do DALL-E: é um modelo completamente diferente com uma nova abordagem técnica.
O Midjourney ainda é melhor para fotorrealismo?
Em abril de 2026, o gpt-image-2 superou o Midjourney no LM Arena em texto-para-imagem (+242 pontos Elo de vantagem). Para fotorrealismo com seguimento fiel de prompt e texto legível dentro da imagem, o gpt-image-2 é hoje a opção mais forte. O Midjourney ainda tem vantagem em controle estético refinado com parâmetros avançados (–style, –cref, –sref) e em consistência de personagem entre imagens — casos onde ele ainda é a melhor escolha para profissionais de criação visual.
Conclusão: o fotógrafo que mora dentro do prompt 🙌
ChatGPT Images 2.0 não é um gerador de imagem melhor — é um modelo que finalmente entende instrução técnica fotográfica. O que separa um resultado que parece foto de um que parece renderização não é o modelo: é a precisão do que você digita. Câmera, lente, luz com posição, textura de superfície e contexto de cena. Esses quatro elementos transformam qualquer gerador genérico em fotógrafo especialista.
Na prática: os 27 prompts deste guia eliminam a necessidade de banco de imagem para conteúdo digital, reduzem o custo de sessões fotográficas de produto para zero e permitem iteração em minutos — não em dias de agendamento, deslocamento e edição. Para um criador ou pequeno e-commerce, isso representa R$ 300–800 mensais economizados em apenas uma categoria de imagem.
O próximo passo lógico é simples: copie o prompt da série que resolve seu problema mais urgente agora, cole no ChatGPT, ajuste os campos entre colchetes e gere. O primeiro resultado provavelmente vai surpreender. O segundo, após um ajuste pelo chat, vai ser exatamente o que você tinha em mente.
A fotografia sempre foi sobre a decisão do fotógrafo — ângulo, luz, momento. O modelo mudou. A decisão ainda é sua.
Qual dessas imagens você precisava gerar há mais tempo e nunca conseguiu fazer direito?
Escolha o prompt da série correspondente, cole no ChatGPT e compartilhe o resultado nos comentários — vale comparar o antes e depois.
Acesso gratuito. Sem instalação. Abre direto no navegador.
Se você já tentou vender online, mas travou na criação de conteúdo, na conversa com o cliente ou no posicionamento. Este combo vai te entregar o mapa:
- Aprenda a conversar com a IA como um estrategista.
- Venda todos os dias no Instagram sem parecer vendedora.
- Posicione sua marca como expert com leveza e propósito.
Tudo isso com prompts prontos, estratégias de verdade e metodologia simples — testada e validada.
💡 Se você sente que tem potencial, mas não sabe como transformar isso em venda: Este é o passo certo.
R$19. Pagamento único. Menos que um lanche no iFood. Acesso vitalício. 💥 Se esse artigo te deu clareza, imagina ter um plano pra vender com IA todos os dias?
Ei, antes de ir: se este conteúdo te ajudou, você não pode perder o que separamos nestas outras categorias. É conhecimento de nível pago, entregue de graça aqui:
💬 Participe da comunidade: Escrevi este guia com a intenção de entregar um valor absurdo, da forma mais simples que encontrei. Se ele te ajudou de alguma forma, a melhor maneira de retribuir é compartilhando sua opinião.
Deixe seu comentário 👀 Faz sentido? Acha que as dicas valem o teste? Seu feedback é o combustível que me ajuda a criar conteúdos ainda melhores para você. E se você já testou algum prompt, compartilhe seus resultados! Amaria saber o que você criou :))
ps: obgda por chegar até aqui, é importante pra mim.