Midjourney notebook : Prompt engineering

Les usages du deep learning en reconnaissance / génération d’image progressent rapidement. Une étape a été franchie dans la génération d’images à partir de textes descriptifs, appelés prompt, sur des outils comme Midjourney ou Dall-e. Ce mémo explique la génération d’images avec Midjourney. J’ai ouvert un compte en juillet 2022 et mes créations, majoritairement de style réaliste, sont visibles sur Instagram sur le profil @Gribolux .

La grammaire

L’ordre a de l’importance.

SUJET + DETAILS / DECOR + STYLE + PARAMETRES

Eviter les propositions, utiliser des verbes d’action (mange), du vocabulaire précis, éviter les redondances (neige blanche), s’appuyer sur des archetypes (un pompier). Si image prompt, placer l’URL en premier. Descriptions détaillées.

Doubles tirets pour les paramètres – – aspect 16:9
Deux points :: pour les valeurs ::0.5
Virgule pour séparer les entrées ex: Ours en peluche, larges oreilles
Tiret du 6 (ou tiret quart de cadratin) pour relier des mots

Prompt token matrix generated with Midjourney

Les paramètres

Récupérer le Job ID : réagir à l’image avec l’émoji ✉️ et le bot envoie un message d’info
–hd : haute définition mais moins bonne composition
–q 1 : spécifie le niveaux de qualité, par défaut 1 et maximum 2 (le cout fait aussi x2)
–Stylize 2500 : puissance du style, par défaut 2500
–no : supprime un élément
–seed XXXX : utiliser un nombre random et garder le même pour générer des images proches
Sur les prompt d’image, ajouter du texte reprenant le sujet afin de mieux cibler
Style::2 sert à modifier le poids de ce qu’il y a avant, ici x2

Tips : la commande /settings permet de définir les paramètres par défaut.

Le vocabulaire

Quelques exemples de termes reconnu par Midjourney. Cette liste est mise à jour régulièrement.

Sujet : wearing, background, utiliser des archétypes et remplacer les composantes (ex: 3 amies buvant du thé, 3 trolls buvant du thé )

Réalisme : ~~Photorealistic, hyper realistic, ultra realistic, photographic, 4K, HD, realistic, realism, intricate detail.~~ a ne pas utiliser, ca ramène sur du dessin. Utiliser le vocabulaire photographie :

Eclairage : soft natural lightning, spotlight, backlight, concert lightning, direct sunlight, fluorescent, blacklight, ultra-realistic, cinematic lighting

Background : isolated on white paper, isolated on white background, on white plain isolated

Photo : DSLR, 360 panorama, pinhole lens, 50 mm, full focus, focal blur, post-processing, colour portrait, rule of thirds, kodachrome film, color street photography, 1/3 portrait, 3 point lighting

Photographie : [Portrait] dans le style de [Nadar], cinematic still shot [car] in [James Bond], digital painting::-0.5 Wide angle, drone footage, satellite view. Full body shot, top-down shot, ground-shot, photographic lighting, –testp

Style : inspired, cyberpunk, steampunk, old photograph, da vinci, Da Vinci drawing, anatomical drawing, anime, blue print, cartoon, computer chip, dune, horror, latex, marble statue, origami, radioactive, sketch drawing, stranger things, –niji (manga)

Text : « text » bold, style, metallic

Matière : Aluminium, brick, bronze, cotton, glass, leather, metallic

Mindset : frightened, joyful, smiling

Artistes : Andy Warhol, Banksy, Caravaggio, Eugene Delacroix, JMW Turner, Monet, Paul Cezanne, Rembrandt, Van Gogh

Palettes de couleurs : autumnal colors, winter colors, cold colors, warm colors, vibrant colors, muted colors, tropical colors.

Le prompt d’image

URL .png .jpg .gif Il est possible de charger une image sur le discord et de reprendre son url ensuite

Ajouter une description correspondant à l’image aide

L’influence de l’image peut être dosée –iw (0.25 par défaut) mais pas encore opérationnel sur V4

Réutiliser les personnages : https://docs.google.com/document/u/1/d/e/2PACX-1vRahIr3-h_V31w2dMZXTAV9R2aXMB9Yoi-bIMQsRIanMXUO9rDtj5x7cL__hG05bmow-GvP7vcLlAcX/pub?utm_source=docs.google.com&utm_medium=tutorial&utm_campaign=midjourney

Trucs & astuces

La documentation de Midjourney et le site pour voir quelles images sont utilisées pour l’entraînement des altos : Have I been trained ?

Si les premières images en conviennent pas ; utiliser les boutons de re-génération ou de de versioning. Lorsque l’image générée plait, faire un upscale. Upscaler avant de faire d’autres variations.

Les chapeaux passent mal.

Mélanger les styles. Utiliser les focales photo pour définir le cadrage. Appliquer un style à chaque objet

Ne pas hésiter à tester les beta, y compris en redo.

2 manières de procéder : commencer par une description longue, ou itérer en sélectionnant jusqu’à trouver l’image qui plait.

Les générateurs de prompts fleurissent sur Internet. Ce sont principalement des aspirateurs à clics sans grand intérêt. Il peut cependant être utile de s’en inspirer pour démarrer : Midjourney Prompt Helper, Midjourney prompt generator,

La génération d’image est une activité addictive.