Automatic1111 : l'interface de Stable Diffusion
Avant tout quelques définitions, c'est important pour la suite !
Même si vous êtes fort en anglais, il y a certains termes qui se doivent d’être expliqués un peu plus en détail.
Principaux paramètres de génération (2 premiers onglets)
Premièrement il faut savoir que Stable Diffusion (SD) forme une image pas à pas en la débruitant. Ce procédé se nomme échantillonnage.
Dans SD, il existe actuellement 19 de ces méthodes que je présenterais plus tard dans un article scientifiques.
Cela correspond au « pas à pas » dont je parlais avant. Il défini le nombre d’étapes pour générer l’image par succession en fonction de la méthode choisie.
La fourchette varie de 1 à 150. Sachant que j’utilise principalement des valeurs entre 20 et 40. Pourquoi ? En dessous de 20 c’est trop bruité et après 40 cela prends trop de temps et de ressources pour mon PC. De plus, si vous voulez faire des tests, je vous conseille de faires des images de basse résolution entre 20 et 28 max pour ensuite les agrandir via l’onglet « Extras » (voir ci-dessous).
C’est le paramètre qui sert à dire à l’ia de plus ou moins respecter notre prompt. Une valeur basse générera une image sans rapport avec notre texte alors qu’une plus haute fera l’inverse.
La fourchette varie de 1 à 30. La valeur par défaut étant 7.
Si vous êtes un joueur comme moi vous savez forcément ce que c’est 😋.
Sinon, elle permet de générer une variation bien particulière d’une image. La valeur par défaut est « -1 » soit aléatoire. Si par exemple la valeur est 123456789 et que vous voulez avoir la même variation pour une autre image vous pouvez alors reprendre votre seed. Il y a deux sous options utile :
- 🎲 : pour générer un seed aléatoire.
- ♻️ : pour reprendre le dernier seed utilisé.
- Restore faces : permet de réparé les erreurs sur les visages.
- Batch count et
- La taille des images, je la laisse souvent en par défaut au format 1:1 soit 512*512. Mais je change parfois pour obtenir du 16:9, 9:16, ou des formats pour instagram comme du 4:5.
- Script : J’utilise seulement le X/Y/Z plot qui permet de générer des grilles d’images avec différentes méthodes, modèles ou prompts.
Les différents onglets et leurs usages :
C’est pour moi l’onglet principal de cette interface. C’est ici que l’on va écrire nos prompts pour générer des images.
Comme son nom l’indique il permet d’obtenir une image à partir d’une image source. Cela est principalement utilisé pour retoucher une partie d’une image ou bien pour changer le style graphique de cette image comme le font la plupart des applications présentes sur le marchés actuellement.
La principal utilité de ce menu réside dans l’augmentation de la résolution d’une image. Il est fortement utilisé après la génération d’une image depuis les deux premiers onglets.
Il permet de voir et de récupérer les métadonnées d’une image. Pour que cela fonctionne, il faut récupérer une image comportant des métadonnées. Les images généré par SD comportent ces données de générations mais pour les autres ça ne fonctionnera pas forcément.
Cela permet de fusionner plusieurs checkpoint entre eux. Pour le moment, je n’ai pas obtenu de bon résultat avec cette fonction. Les paramètres sont nombreux et avec la communauté et les nombreux modèles déjà existants, je n’y passe mon temps.
Permet de créer de nouveau LoRA mais pareil cela demande beaucoup d’investissement en temps que je n’ai pas pris pour le moment. De plus, j’utilise SeaArt.ai qui permet de générer des LoRA plus simplement et rapidement.
Ce n’est pas un onglet par défaut, il permet de visualiser la bibliothèque des images déjà générées et les annoter (un peu comme sur Adobe Lightroom).
C’est l’onglet de configuration de l’interface web. Il permet principalement d’ajouter de nouvelles fonctions dans les onglets principaux mais aussi de modifier l’interface global en ajoutant par exemple des onglets comme l’image browser.
Il est sous divisé en 4 autres onglets :
- Installed : Montre la liste des extensions installées, permet leurs mises à jour, leurs activations ou non, ainsi qu’appliquer et de ré-démarrer l’interface.
- Available : Liste les extensions disponibles et permet leur installation.
- Install from URL : Même fonction que le deuxième onglet mais depuis une url à spécifier.
- Backup/Restore : Sauvegarder l’interface et la restaurer. Utile si votre version post mise à jour rencontre des bugs par exemple. Penser à l’utiliser !
Et si on passait à l'exemple 😀
Pour l’exemple j’ai choisi de faire une vidéo car je pense que le format est plus simple pour comprendre.