L’IA créative te passionne ?
Image, vidéo, son, design génératif : le meilleur chaque soir en 5 min. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
Midjourney a récemment dévoilé une version préliminaire de son modèle V8, qui est actuellement en phase de test communautaire. Ce nouveau modèle se distingue par sa capacité à générer des images environ cinq fois plus rapidement que les versions précédentes. Parmi les nouveautés, le mode --hd permet de produire des images en résolution native 2K, répondant ainsi aux attentes des utilisateurs en quête de haute qualité visuelle.
Le modèle V8 est conçu pour suivre les instructions détaillées avec une précision accrue, produisant des images plus cohérentes et améliorant le rendu du texte au sein des images. Midjourney affirme que ce modèle est nettement meilleur pour comprendre les esthétiques individuelles grâce à la personnalisation, aux références de style et aux moodboards, qui peuvent être transférés depuis le V7. Cependant, malgré ces améliorations, le modèle reste basé sur une architecture de diffusion à 1000%, ce qui le rend moins performant que les modèles autoregressifs pour des prompts complexes.
Midjourney a mis à disposition cette version sur son site Alpha, encourageant les utilisateurs à tester et à fournir des retours. Bien que V8 soit présenté comme un modèle fondamentalement nouveau, il pourrait nécessiter des stratégies de prompt inédites pour exploiter pleinement ses capacités. Les utilisateurs peuvent expérimenter avec divers paramètres comme --chaos, --weird, --exp, et --raw, et le modèle prend en charge plusieurs rapports d'aspect.
Malgré ces avancées, le modèle V8 montre encore des limites face à des prompts complexes. Lors de tests avec des concepts abstraits, tels qu'un cheval montant un astronaute, V8 a produit des résultats inférieurs aux modèles autoregressifs comme Nano Banana de Google et GPT image 1.5 d'OpenAI. Même le concurrent direct de Midjourney, Flux, a obtenu de meilleurs résultats dans certains cas.
Concernant les coûts, les fonctionnalités premium de V8, telles que --hd, --q 4, ou l'utilisation de moodboards, sont actuellement quatre fois plus lentes et plus coûteuses que les travaux standard. Le mode relax, qui permettait de générer des images à moindre coût, n'est pas disponible pour l'instant. Midjourney travaille sur un nouveau cluster de serveurs pour réintroduire cette option et sur des modes de rendu plus économiques. Ces augmentations de coûts pourraient influencer la décision des utilisateurs, notamment ceux qui recherchent un contrôle précis des prompts à moindre coût.
Le modèle de diffusion de Midjourney V8, bien qu'amélioré, reste en retrait par rapport aux architectures hybrides qui intègrent des composants autoregressifs. Ces dernières, utilisées par des modèles comme Nano Banana de Google et GPT image 1.5 d'OpenAI, offrent une meilleure précision des prompts. Les premiers tests montrent que V8 n'a pas encore comblé cet écart, notamment lors de l'exécution de prompts complexes comme le concept abstrait d'un cheval montant un astronaute. Même Flux, un concurrent direct, a montré des performances légèrement supérieures dans certains scénarios.
En conclusion, bien que Midjourney V8 apporte des améliorations significatives en termes de vitesse et de qualité d'image, les limitations liées à son architecture de diffusion et les coûts accrus des fonctionnalités premium pourraient limiter son adoption par les utilisateurs exigeant un contrôle précis et économique des prompts.



