Baseado no livro Stable Diffusion Prompt Book
Em resumo: é o texto em inglês (língua usada para a criação do modelo) com as instruções para que uma imagem seja gerada.
Essa é uma possível futura área de atuação dentro do universo de modelos geracionais. Um engenheiro de prompt é um especialista que busca soluções para a construção de melhores resultados através de frases e modificadores.
Apesar de ser possível escrever os prompts em português, o modelo original foi treinado em inglês, e essa é o idioma ideal para se obter os resultados mais precisos.
Um bom prompt contém uma boa estrutura de frase e modificadores coerentes com o assunto, além de bons ajustes de parâmetros na interface.
Para este guia, alguns termos e frases vão conter sua versão em inglês, para facilitar o uso.
to-do: criar extensão auxiliar para criar prompts em português e a tradução em inglês gerar a imagem
Comece escolhendo qual é o tipo de imagem a ser gerada.
Exemplos: Fotografia (Photography), pintura (Painting), Escultura (Sculpture).
Escolha o objeto principal.
Exemplos: Um homem (a man), uma mulher (a woman), um gato (a cat), uma cidade (a city).
Acrescente detalhes importantes para a imagem.
Tipo de iluminação (lighting)
Exemplos: luzes neon (neon lights), luz ambiente (ambient light), iluminação de estúdio (studio lighting).
Local (environment)
Exemplos: ambiente externo (outdoor), interno (indoor), debaixo d'água (underwater), no espaço (in space).
Esquema de cores (color scheme)
Exemplos: vibrantes (vibrant), patéis (pastel), monocromática (monochromatic).
Ponto de vista (point of view)
Exemplos: frontal (front), vista aérea (overview), lateral (side).
Fundo da imagem (background)
Exemplos: cor sólida (solid color), florest (forest), montanhas (mountains).
Estilo da arte (art style)
Exemplos: render 3D (3D render), Disney, cartaz de filme (movie poster).
A lista de opções é virtualmente infinita.
Links de sites com prompts para você se inspirar
Links
Exemplo:
A painting of an old man reading newspaper, natural lighting, in a park, vibrant colors, watercolor style A ordem em que as palavras entram no prompt alteram o resultado. A watercolor painting of an old man in a park, reading newspaper, natural lighting, vibrant colors |
Os modificadores são palavras ou frases específicas que podem alterar diversas qualidades da imagem.
Fotografia (Photography)
Desenho, Pintura e Recortes
Escultura, Paper craft e Render 3D
Artistas
A escolha do estilo de um artista pode mudar completamente a composição da imagem.
Closeup of a ballerina by the window and a city skyline in the background, photography
Ruth Bernhard | Peter Kemp | Ray Earnes | Janek Sedlar |
---|---|---|---|
Portrait of a cyberpunk samurai
Derek Gomes | Miles Aldridge | Jean Baptiste-Carpeaux | Anne-Louis Girodet |
---|---|---|---|
Misture estilos diferentes!
A ballerina samurai, by Miles Aldridge | A ballerina samurai, by Anne-Louis Girodet | A ballerina samurai, by Anne-Louis Girodet and Miles Aldrigde |
---|---|---|
Lista de referências de artistas com seus estilos
Modificadores Especiais
Emoções positivas
Emoções negativas
Modificadores Mágicos
Alta definição
Profissionais
Photo of a bee on a red flower | Professional photo of a bee on a red flower | A cool samurai sword | A cool samurai sword, studio lighting |
---|---|---|---|
Popularidade
CFG - Classifier Free Guidance
Quanto menor o valor, mais liberdade a IA tem para gerar uma imagem.
Prompt: A blue monkey holding a red ball, 3D render
CFG: 1 | CFG: 5 | CFG: 15 | CFG: 21 | CFG: 30 |
---|---|---|---|---|
Contador de Passos de Amostragem
Quanto maior o valor, maior a definição da imagem e mais tempo para gerar.
Prompt: A blue monkey holding a red ball, 3D render
Passos: 1 | Passos: 5 | Passos: 10 | Passos: 20 | Passos: 30 | Passos: 50 | Passos: 100 | Passos: 150 |
---|---|---|---|---|---|---|---|
Seed
É o valor do ruído inicial de onde a imagem será gerada. Se você deixar com apenas 1 passo, é uma aproximação do ruído inicial referente àquela seed.
Prompt: A blue monkey holding a red ball, 3D render
Seed: 2148213317 | Seed: 3534937562 | Seed: 2325907017 | Seed: 3915754044 |
---|---|---|---|
Tipos de Amostragem
É o metodo usado para os passos da geração de imagens.
Prompt: A blue monkey holding a red ball, 3D render
Seed: 3915754044
CFG: 10
Passos: 20
Euler a | Euler | LMS | Heun |
---|---|---|---|
Prompt: A blue monkey holding a red ball, 3D render
Seed: 3915754044
CFG: 10
Passos: 20
DPM2 | DPM2 a | DPM++ 2S a | DPM++ 2M |
---|---|---|---|
Prompt: A blue monkey holding a red ball, 3D render
Seed: 3915754044
CFG: 10
Passos: 20
DPM fast | DPM adaptive | LMS Karras | DPM2 Karras |
---|---|---|---|
Prompt: A blue monkey holding a red ball, 3D render
Seed: 3915754044
CFG: 10
Passos: 20
DPM2 a Karras | DPM++ 2S a Karras | DPM++ 2M Karras | DDIM | PLMS |
---|---|---|---|---|
Eficiência de Tokens
O prompt é limitado a 75 tokens (mais ou menos 75 palavras).
Seed: 2282239514
CFG: 12,5
Passos: 50
Amostragem: Euler a
Prompt: A blue monkey holding a red ball, 3D render
Heading com summary
Contorno de tabela
Sumários inception
nome topo
nome interno inicial 1
Nome interno final 1nome interno inicial 2
Nome interno final 2