Les usages du deep learning en reconnaissance / génération d’image progressent rapidement. Une étape a été franchie dans la génération d’images à partir de textes descriptifs, appelés prompt, sur des outils comme Midjourney ou Dall-e. Ce mémo explique la génération d’images avec Midjourney. J’ai ouvert un compte en juillet 2022 et mes créations, majoritairement de style réaliste, sont visibles sur Instagram sur le profil @Gribolux .
La grammaire
L’ordre a de l’importance.
SUJET + DETAILS / DECOR + STYLE + PARAMETRES
Eviter les propositions, utiliser des verbes d’action (mange), du vocabulaire précis, éviter les redondances (neige blanche), s’appuyer sur des archetypes (un pompier). Si image prompt, placer l’URL en premier. Descriptions détaillées.
- Doubles tirets pour les paramètres – – aspect 16:9
- Deux points :: pour les valeurs ::0.5
- Virgule pour séparer les entrées ex: Ours en peluche, larges oreilles
- Tiret du 6 (ou tiret quart de cadratin) pour relier des mots
Les paramètres
- Récupérer le Job ID : réagir à l’image avec l’émoji ✉️ et le bot envoie un message d’info
- –hd : haute définition mais moins bonne composition
- –q 1 : spécifie le niveaux de qualité, par défaut 1 et maximum 2 (le cout fait aussi x2)
- –Stylize 2500 : puissance du style, par défaut 2500
- –no : supprime un élément
- –seed XXXX : utiliser un nombre random et garder le même pour générer des images proches
- Sur les prompt d’image, ajouter du texte reprenant le sujet afin de mieux cibler
- Style::2 sert à modifier le poids de ce qu’il y a avant, ici x2
Tips : la commande /settings permet de définir les paramètres par défaut.
Le vocabulaire
Quelques exemples de termes reconnu par Midjourney. Cette liste est mise à jour régulièrement.
Sujet : wearing, background, utiliser des archétypes et remplacer les composantes (ex: 3 amies buvant du thé, 3 trolls buvant du thé )
Réalisme : Photorealistic, hyper realistic, ultra realistic, photographic, 4K, HD, realistic, realism, intricate detail. a ne pas utiliser, ca ramène sur du dessin. Utiliser le vocabulaire photographie :
Eclairage : soft natural lightning, spotlight, backlight, concert lightning, direct sunlight, fluorescent, blacklight, ultra-realistic, cinematic lighting
Background : isolated on white paper, isolated on white background, on white plain isolated
Photo : DSLR, 360 panorama, pinhole lens, 50 mm, full focus, focal blur, post-processing, colour portrait, rule of thirds, kodachrome film, color street photography, 1/3 portrait, 3 point lighting
Photographie : [Portrait] dans le style de [Nadar], cinematic still shot [car] in [James Bond], digital painting::-0.5 Wide angle, drone footage, satellite view. Full body shot, top-down shot, ground-shot, photographic lighting, –testp
Style : inspired, cyberpunk, steampunk, old photograph, da vinci, Da Vinci drawing, anatomical drawing, anime, blue print, cartoon, computer chip, dune, horror, latex, marble statue, origami, radioactive, sketch drawing, stranger things, –niji (manga)
Text : « text » bold, style, metallic
Matière : Aluminium, brick, bronze, cotton, glass, leather, metallic
Mindset : frightened, joyful, smiling
Artistes : Andy Warhol, Banksy, Caravaggio, Eugene Delacroix, JMW Turner, Monet, Paul Cezanne, Rembrandt, Van Gogh
Palettes de couleurs : autumnal colors, winter colors, cold colors, warm colors, vibrant colors, muted colors, tropical colors.
Le prompt d’image
URL .png .jpg .gif Il est possible de charger une image sur le discord et de reprendre son url ensuite
Ajouter une description correspondant à l’image aide
L’influence de l’image peut être dosée –iw (0.25 par défaut) mais pas encore opérationnel sur V4
Réutiliser les personnages : https://docs.google.com/document/u/1/d/e/2PACX-1vRahIr3-h_V31w2dMZXTAV9R2aXMB9Yoi-bIMQsRIanMXUO9rDtj5x7cL__hG05bmow-GvP7vcLlAcX/pub?utm_source=docs.google.com&utm_medium=tutorial&utm_campaign=midjourney
Trucs & astuces
La documentation de Midjourney et le site pour voir quelles images sont utilisées pour l’entraînement des altos : Have I been trained ?
Si les premières images en conviennent pas ; utiliser les boutons de re-génération ou de de versioning. Lorsque l’image générée plait, faire un upscale. Upscaler avant de faire d’autres variations.
Les chapeaux passent mal.
Mélanger les styles. Utiliser les focales photo pour définir le cadrage. Appliquer un style à chaque objet
Ne pas hésiter à tester les beta, y compris en redo.
2 manières de procéder : commencer par une description longue, ou itérer en sélectionnant jusqu’à trouver l’image qui plait.
Les générateurs de prompts fleurissent sur Internet. Ce sont principalement des aspirateurs à clics sans grand intérêt. Il peut cependant être utile de s’en inspirer pour démarrer : Midjourney Prompt Helper, Midjourney prompt generator,
La génération d’image est une activité addictive.