Automatic1111 : l'interface de Stable Diffusion

Avant tout quelques définitions, c'est important pour la suite !

Même si vous êtes fort en anglais, il y a certains termes qui se doivent d’être expliqués un peu plus en détail.

Checkpoint

C'est le modèle principal de SD

Il est générer par compilation de plusieurs images afin d'obtenir un style unique. C'est un fichier lourd (~2 à 7 Go) qui se place dans le dossier "models\Stable-diffusion".
-

Prompt

Prompt négatif

C'est le texte qui défini ce que l'on ne veut pas dans les images. Vous pouvez mettre des mots clefs spécifiques mais cela fonctionne aussi avec des modules négatifs nommé :

+

Prompt

Prompt positif

Le prompt est la description de l’image que vous désirez générer. Il est recommandé d'écrire les prompts en anglais. Il possède une syntaxe particulière à apprendre.

LoRA

Low-Rank Adaptation

C'est un modèle secondaire

Il permet d'affiner le concept pour obtenir des images plus spécifique dans le style du LoRA choisi. Ce sont des plus petits fichiers présent dans le dossier "models\Lora".
Click Here
Principaux paramètres de génération (2 premiers onglets)

Premièrement il faut savoir que Stable Diffusion (SD) forme une image pas à pas en la débruitant. Ce procédé se nomme échantillonnage.

Dans SD, il existe actuellement 19 de ces méthodes que je présenterais plus tard dans un article scientifiques.

Cela correspond au « pas à pas » dont je parlais avant. Il défini le nombre d’étapes pour générer l’image par succession en fonction de la méthode choisie.

La fourchette varie de 1 à 150. Sachant que j’utilise principalement des valeurs entre 20 et 40. Pourquoi ? En dessous de 20 c’est trop bruité et après 40 cela prends trop de temps et de ressources pour mon PC. De plus, si vous voulez faire des tests, je vous conseille de faires des images de basse résolution entre 20 et 28 max pour ensuite les agrandir via l’onglet « Extras » (voir ci-dessous).

C’est le paramètre qui sert à dire à l’ia de plus ou moins respecter notre prompt. Une valeur basse générera une image sans rapport avec notre texte alors qu’une plus haute fera l’inverse.

La fourchette varie de 1 à 30. La valeur par défaut étant 7.

Si vous êtes un joueur comme moi vous savez forcément ce que c’est 😋.

Sinon, elle permet de générer une variation bien particulière d’une image. La valeur par défaut est « -1 » soit aléatoire. Si par exemple la valeur est 123456789 et que vous voulez avoir la même variation pour une autre image vous pouvez alors reprendre votre seed. Il y a deux sous options utile :

  • 🎲 : pour générer un seed aléatoire.
  • ♻️ : pour reprendre le dernier seed utilisé.
  • Restore faces : permet de réparé les erreurs sur les visages.
  • Batch count et 
  • La taille des images, je la laisse souvent en par défaut au format 1:1 soit 512*512. Mais je change parfois pour obtenir du 16:9, 9:16, ou des formats pour instagram comme du 4:5.
  • Script : J’utilise seulement le X/Y/Z plot qui permet de générer des grilles d’images avec différentes méthodes, modèles ou prompts.

Les différents onglets et leurs usages :

Et si on passait à l'exemple 😀

Pour l’exemple j’ai choisi de faire une vidéo car je pense que le format est plus simple pour comprendre.

error: Le contenu est protégé !