Brief IA : Midjourney V8 : vitesse multipliée, coûts premium en hausse

Midjourney V8 : vitesse multipliée, coûts premium en hausse

Brief IA
Tom Levy·3 min·1 vues

Midjourney a lancé une version préliminaire de son modèle V8, offrant une génération d'images cinq fois plus rapide et introduisant un mode --hd pour des images en résolution 2K. Cependant, certaines fonctionnalités coûtent désormais quatre fois plus cher, ce qui pourrait influencer l'adoption par les utilisateurs et redéfinir le rapport coût-efficacité dans la génération d'images par IA.

En bref
1Midjourney V8 offre une génération d'images cinq fois plus rapide et introduit un mode --hd pour des rendus en 2K.
2Malgré des améliorations, le modèle reste basé sur la diffusion, moins précis que les approches autoregressives pour des prompts complexes.
3Les fonctionnalités premium, comme --hd et --q 4, sont quatre fois plus coûteuses, et le mode relax n'est pas disponible.
💡Pourquoi c'est importantL'augmentation des coûts pour les fonctionnalités avancées pourrait freiner l'adoption par les utilisateurs cherchant un contrôle précis à moindre coût.
Le brief IA que lisent les pros

L’IA créative te passionne ?

Image, vidéo, son, design génératif : le meilleur chaque soir en 5 min. Gratuit.

Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.

Choisis ton rythme

Gratuit · Pas de spam · Désabonnement en 1 clic

📄
L'analyse en français

Midjourney a récemment dévoilé une version préliminaire de son modèle V8, qui est actuellement en phase de test communautaire. Ce nouveau modèle se distingue par sa capacité à générer des images environ cinq fois plus rapidement que les versions précédentes. Parmi les nouveautés, le mode --hd permet de produire des images en résolution native 2K, répondant ainsi aux attentes des utilisateurs en quête de haute qualité visuelle.

Le modèle V8 est conçu pour suivre les instructions détaillées avec une précision accrue, produisant des images plus cohérentes et améliorant le rendu du texte au sein des images. Midjourney affirme que ce modèle est nettement meilleur pour comprendre les esthétiques individuelles grâce à la personnalisation, aux références de style et aux moodboards, qui peuvent être transférés depuis le V7. Cependant, malgré ces améliorations, le modèle reste basé sur une architecture de diffusion à 1000%, ce qui le rend moins performant que les modèles autoregressifs pour des prompts complexes.

Midjourney a mis à disposition cette version sur son site Alpha, encourageant les utilisateurs à tester et à fournir des retours. Bien que V8 soit présenté comme un modèle fondamentalement nouveau, il pourrait nécessiter des stratégies de prompt inédites pour exploiter pleinement ses capacités. Les utilisateurs peuvent expérimenter avec divers paramètres comme --chaos, --weird, --exp, et --raw, et le modèle prend en charge plusieurs rapports d'aspect.

Malgré ces avancées, le modèle V8 montre encore des limites face à des prompts complexes. Lors de tests avec des concepts abstraits, tels qu'un cheval montant un astronaute, V8 a produit des résultats inférieurs aux modèles autoregressifs comme Nano Banana de Google et GPT image 1.5 d'OpenAI. Même le concurrent direct de Midjourney, Flux, a obtenu de meilleurs résultats dans certains cas.

Concernant les coûts, les fonctionnalités premium de V8, telles que --hd, --q 4, ou l'utilisation de moodboards, sont actuellement quatre fois plus lentes et plus coûteuses que les travaux standard. Le mode relax, qui permettait de générer des images à moindre coût, n'est pas disponible pour l'instant. Midjourney travaille sur un nouveau cluster de serveurs pour réintroduire cette option et sur des modes de rendu plus économiques. Ces augmentations de coûts pourraient influencer la décision des utilisateurs, notamment ceux qui recherchent un contrôle précis des prompts à moindre coût.

Le modèle de diffusion de Midjourney V8, bien qu'amélioré, reste en retrait par rapport aux architectures hybrides qui intègrent des composants autoregressifs. Ces dernières, utilisées par des modèles comme Nano Banana de Google et GPT image 1.5 d'OpenAI, offrent une meilleure précision des prompts. Les premiers tests montrent que V8 n'a pas encore comblé cet écart, notamment lors de l'exécution de prompts complexes comme le concept abstrait d'un cheval montant un astronaute. Même Flux, un concurrent direct, a montré des performances légèrement supérieures dans certains scénarios.

En conclusion, bien que Midjourney V8 apporte des améliorations significatives en termes de vitesse et de qualité d'image, les limitations liées à son architecture de diffusion et les coûts accrus des fonctionnalités premium pourraient limiter son adoption par les utilisateurs exigeant un contrôle précis et économique des prompts.

Suivez Brief IA

L'actu IA du jour, aussi dans votre fil.

Commentaires