Executando verificação de segurança...
2

DALL·E Party: um laço de iterações entre o DALL·E 3 e o GPT-4 com Vision

Vi um projeto curioso onde uma pessoa resolveu desenvolver um laço de repetição entre o GPT-4 com Vision e o DALL·E 3 para ver até onde algo poderia chegar. O nome do site é DALL·E Party e o custo fica em torno de 10 centavos de dólar por execução (fonte).

Ciclo entre imagem gerada pelo DALL·E e prompt gerado pelo GPT 4 com Vision

O desenvolvedor fez isso em um final de semana, inspirado numa brincadeira chamada translation party, onde um texto é traduzido pelo Google Tradutor entre Inglês e Japonês algumas vezes, e isso faz com que o texto fique diferente, muitas vezes sem sentido e até engraçado. Talvez isso não funcione mais hoje em dia, mas funcionava 15 anos atrás (o artigo é de 2009), quando o Google Tradutor não era tão bom quanto é hoje.

Eu não conhecia o translation party, mas ler sobre isso me fez lembrar do Traduzindo, do canal Castro Brothers, onde eles jogavam uma música no Google Tradutor e mudavam para vários idiomas até voltar ao Português e ver como ficou. De certa forma, o DALL·E Party também lembra a brincadeira "telefone sem fio".

O autor menciona que alguns prompts podem ficar bem "estáveis", enquanto outros mudam completamente. Ele deixou alguns vieses disponíveis para tornar o resultado menos previsível:

  • Padrão (default).
  • Torne mais engraçado (make it funnier).
  • Torne mais esquisito (make it weirder).
  • Torne mais extravagante/charmoso (make it more whimsical).
  • Substitua tudo por gatos (replace everything with cats).
  • Aumente a intensidade dos adjetivos (increase intensity of adjectives).

Além dos vieses acima, é possível criar o seu própiro prompt de viés.

Talvez quem use mais as redes socias já tenha visto algum "meme" onde as pessoas fazem um vídeo de várias iterações de prompt e resposta com o ChatGPT para gerar uma imagem "mais intensa" em algum sentido, o que seria parecido com o último viés que mencionei acima.

Selecionei alguns resultados gerados por outras pessoas que eu mais gostei (clique no link para ver todas as iterações):

Prompt inicial (traduzido)Imagem inicial
Uma cabra em fúria em uma cidade aterrorizada e em chamas (...)Cabra na cidade em chamas
Um gato ensinando ratos sobre comidaO gato e os ratos
Paisagem de inverno nevado no meio do verão na praiaUma ilha metade nevada e metade ensolarada
Um empacotador de lego descansando sob um guarda-chuva com sua cara-metadeDois bonecos de lego debaixo de um guarda-sol

Alguns exemplos com menor variação são: Um híbrido futurista de um trem a vapor e uma máquina voadora DaVinci e Chapeuzinho Vermelho encontrando o Lobo Mau em uma floresta escura, hiperrealista.

Achei esse projeto bem diferente dos genéricos que vimos sendo lançado ao longo de 2023 para pegar o hype do ChatGPT, mesmo que não esteja num estado "monetizável".

Além de ser uma brincadeira legal, o projeto mostra como o ChatGPT pode vir a auxiliar na criatividade de alguém — eu, mesmo que poucas vezes, já pedi para o ChatGPT gerar algumas sugestões sobre algo que eu já tinha em mente para me ajudar a elaborar o assunto.