Midjourney notebook

Les usages du deep learning en reconnaissance / génération d’image progressent rapidement. Une étape a été franchie dans la génération d’images à partir de textes descriptifs, appelés prompt, sur des outils comme Midjourney ou Dall-e. Ce mémo explique la génération d’images avec Midjourney. J’ai ouvert un compte en juillet 2022 et mes créations, majoritairement de style réaliste, sont visibles sur Instagram ou sur mon profil Midjourney.

La grammaire

L’ordre a de l’importance.

SUJET + DETAILS / DECOR + STYLE + PARAMETRES

Eviter les propositions, utiliser des verbes d’action (mange), du vocabulaire précis, éviter les redondances (neige blanche), s’appuyer sur des archetypes (un pompier). Si image prompt, placer l’URL en premier. Descriptions détaillées.

  • Doubles tirets pour les paramètres – – aspect 16:9
  • Deux points :: pour les valeurs ::0.5
  • Virgule pour séparer les entrées ex: Ours en peluche, larges oreilles
  • Tiret du 6 (ou tiret quart de cadratin) pour relier des mots
Funny blender generated with Midjourney

Les paramètres

  • –hd : haute définition mais moins bonne composition
  • –q 1 : spécifie le niveaux de qualité, par défaut 1 et maximum 2 (le cout fait aussi x2)
  • –Stylize 2500 : puissance du style, par défaut 2500
  • –no : supprime un élément
  • –seed XXXX : utiliser un nombre random et garder le même pour générer des images proches
  • Sur les prompt d’image, ajouter du texte reprenant le sujet afin de mieux cibler
  • Style::2 sert à modifier le poids de ce qu’il y a avant, ici x2

Tips : la commande /settings permet de définir les paramètres par défaut.

Le vocabulaire

Quelques exemples de termes reconnu par Midjourney. Cette liste est mise à jour régulièrement.

Sujet : wearing, background,

Réalisme : Photorealistic, hyper realistic, ultra realistic, photographic, 4K, HD, realistic, realism, intricate detail. a ne pas utiliser, ca ramène sur du dessin. Utiliser le vocabulaire photographie :

Eclairage : soft natural lightning, spotlight, backlight, concert lightning, direct sunlight, fluorescent, blacklight, ultra-realistic, cinematic lighting

Photo : DSLR, 360 panorama, pinhole lens, 50 mm, full focus, focal blur, post-processing, colour portrait, rule of thirds, kodachrome film, color street photography, 1/3 portrait, 3 point lighting

Photographie : [Portrait] dans le style de [Nadar], cinematic still shot [car] in [James Bond], digital painting::-0.5 Wide angle, drone footage, satellite view. Full body shot, top-down shot, ground-shot, photographic lighting,

Style : inspired, cyberpunk, steampunk, old photograph, da vinci, Da Vinci drawing, anatomical drawing, anime, blue print, cartoon, computer chip, dune, horror, latex, marble statue, origami, radioactive, sketch drawing, stranger things

Matière : Aluminium, brick, bronze, cotton, glass, leather, metallic

Mindset : frightened, joyful, smiling

Artistes : Andy Warhol, Banksy, Caravaggio, Eugene Delacroix, JMW Turner, Monet, Paul Cezanne, Rembrandt, Van Gogh

Le prompt d’image

URL .png .jpg .gif

Ajouter une description correspondant à l’image aide

L’influence de l’image peut être dosée –iw (0.25 par défaut) mais pas encore opérationnel sur V4

Trucs & astuces

La documentation de Midjourney et le site pour voir quelles images sont utilisées pour l’entraînement des altos : Have I been trained ?

Si les premières images en conviennent pas ; utiliser les boutons de re-génération ou de de versioning. Lorsque l’image générée plait, faire un upscale. Upscaler avant de faire d’autres variations.

Les chapeaux passent mal.

Mélanger les styles. Utiliser les focales photo pour définir le cadrage. Appliquer un style à chaque objet

Ne pas hésiter à tester les beta, y compris en redo.

2 manières de procéder : commencer par une description longue, ou itérer en sélectionnant jusqu’à trouver l’image qui plait.

Les générateurs de prompts fleurissent sur Internet. Ce sont principalement des aspirateurs à clics sans grand intérêt. Il peut cependant être utile de s’en inspirer pour démarrer : Midjourney Prompt Helper, Midjourney prompt generator,

La génération d’image est une activité addictive.