Stable Diffusion

modelo de aprendizagem automática de geração de imagens

Stable Diffusion é um modelo de aprendizagem profunda para transformação de texto para imagem, lançado em 2022. É utilizado principalmente para gerar imagens detalhadas através de descrições textuais que condicionam o resultado, também sendo utilizado para inpainting e outras técnicas.[1]

Stable Diffusion
Captura de tela
Stable Diffusion
Uma imagem criada a partir da frase "a photograph of an astronaut riding a horse"
Desenvolvedor Stability AI
Lançamento 22 de agosto de 2022 (1 ano)
Página oficial
Repositório github.com/Stability-AI/stablediffusion

O Stable Diffusion implementa um modelo de difusão latente, uma espécie de rede neural generativa profunda desenvolvida pelo grupo CompVis na Universidade de Munique,[2] em conjunto com a startup Runway.[3][4] Sua implementação é fruto de uma colaboração da CompVis, Runway, e Stability AI, com apoio da EleutherAI e LAION.[5] Tanto a implementação como os pesos do modelo foram lançados como código aberto.[6]

O modelo foi lançado com licenciamento permissivo - o Stable Diffusion concede todos os direitos sobre as imagens geradas aos usuários, com a condição de que elas não sejam ilegais ou prejudiciais. O licenceamento permissivo, bem como o uso de imagens com direitos autorais para treinamento do modelo, gerou controversas relacionadas a propriedade intelectual, a criação de símbolos associados ao nazismo, e pornografia ilegal..[4][7] Alguns artistas[8] e empresas abriram processos judiciais contra a Stability AI por conta do uso de suas imagens para treinamento do modelo.[9][10][11]

Ver também editar

Referências

  1. «Diffuse The Rest - a Hugging Face Space by huggingface». huggingface.co. Cópia arquivada em 5 de setembro de 2022 
  2. Rombach; Blattmann; Lorenz; Esser; Ommer (Junho de 2022). High-Resolution Image Synthesis with Latent Diffusion Models (PDF). International Conference on Computer Vision and Pattern Recognition (CVPR). New Orleans, LA. pp. 10684–10695. arXiv:2112.10752  
  3. «High-Resolution Image Synthesis with Latent Diffusion Models| Runway Research». Runway (em inglês) 
  4. a b Cai, Kenrick. «Startup Behind AI Image Generator Stable Diffusion Is In Talks To Raise At A Valuation Up To $1 Billion». Forbes (em inglês). Consultado em 31 de outubro de 2022 
  5. «Revolutionizing image generation by AI: Turning text into images». LMU Munich 
  6. Stable Diffusion, CompVis - Machine Vision and Learning LMU Munich, 4 de novembro de 2022 
  7. Heikkilä, Melissa (16 de setembro de 2022). «This artist is dominating AI-generated art. And he's not happy about it.». MIT Technology Review 
  8. James Vincent "AI art tools Stable Diffusion and Midjourney targeted with copyright lawsuit" The Verge, 16 January, 2023.
  9. Korn, Jennifer (17 de janeiro de 2023). «Getty Images suing the makers of popular AI art tool for allegedly stealing photos». CNN (em inglês). Consultado em 22 de janeiro de 2023 
  10. Vincent, James (15 de setembro de 2022). «Anyone can use this AI art generator — that's the risk». The Verge (em inglês). Consultado em 27 de março de 2023 
  11. «This AI Tool Is Being Used to Make Freaky, Machine-Generated Porn». www.vice.com (em inglês). 24 de agosto de 2023. Consultado em 27 de março de 2023 
  Este artigo é um esboço. Você pode ajudar a Wikipédia expandindo-o. Editor: considere marcar com um esboço mais específico.