MidJourney était déjà l'un des générateurs d'images AI les plus impressionnants, et avec la sortie de la version 5.1, il est maintenant devenu beaucoup plus puissant. La mise à jour de l'algorithme signifie que, même pour les débutants, il est maintenant incroyablement facile de créer des œuvres d'art époustouflantes avec un effort minimal - et des deepfakes. Beaucoup de deepfakes.
Le générateur d'images AI est entré dans la conscience publique le mois dernier après que des images deepfake du Pape François en doudoune blanche soient devenues virales. La controverse a suscité des conversations sur l'éthique des générateurs d'IA comme MidJourney, et la société a agi peu de temps après.
L'utilisation du mot «pape» sur MidJourney est maintenant interdite, mais la création de deepfakes d'autres personnes, comme le président Joe Biden, est toujours autorisée - probablement jusqu'à ce que nous voyions une image virale de Biden portant une combinaison de yoga en spandex rose néon dans le bureau ovale.
Ou peut-être une image de Biden portant un costume de spartiate intergalactique qui ressemble un peu à Iron Man.
MidJourney permet également aux utilisateurs de créer des deepfakes de haute qualité en utilisant des photos comme référence. Cette fonctionnalité a considérablement augmenté la popularité de MidJourney en raison des résultats impressionnants qu'elle fournit et de sa courbe d'apprentissage faible. Pour le moment, c'est le modèle d'image IA le plus populaire en termes d'intérêt des utilisateurs, dépassant Dall-e et Stable Diffusion.
La dernière mise à jour de MidJourney promet des améliorations dans la façon dont l'algorithme interprète les instructions des utilisateurs. La version 5.0 a été publiée il y a seulement trois mois et a marqué un départ significatif de la version 4.
V5.1 is now available! Images are more coherent, sharp, and beautiful. It's easier to use and should respond more precisely to instructions. We've also added a "RAW" mode for expert users to reduce the 'opinionatedness' of our model and give you more creative control.
— Midjourney (@midjourney) May 3, 2023
Ce nouveau modèle offre une plus grande cohérence, une plus grande précision pour les prompts, moins de bordures indésirables ou d'artefacts de texte (les choses étranges et aléatoires qui apparaissent parfois sur les images), et des résultats plus nets dans l'ensemble, selon MidJourney. La cerise sur le gâteau est que la nouvelle version a été formée pour être plus «opinionnée».
Être opinionné signifie que le modèle a la liberté d'être plus créatif lors de l'interprétation d'un prompt d'utilisateur. Cela se traduit par de meilleures images avec des prompts simples, même avec des commandes absurdes de seulement un ou deux mots.
Par exemple, simplement en comparant les résultats pour les prompts «Portefeuille Bitcoin» en utilisant les versions 5.1 et 5.0, on peut constater les différences et les améliorations. La version 5.1 imagine un portefeuille en cuir, avec un logo Bitcoin brodé et placé sur une table. La version 5 montre simplement un portefeuille avec un Bitcoin sur une surface plane.
La nouvelle version met encore plus en avant les forces qui ont conduit à l'explosion de MidJourney, sans oublier les utilisateurs expérimentés qui disposent désormais d'un mode RAW s'ils souhaitent des résultats plus précis et moins «subjectifs».
Et que dire des mains à plusieurs doigts ? MidJourney v5.1 a considérablement progressé. Les représentations de mains réussissent désormais dans la plupart des cas, bien que le générateur produise encore quelques erreurs.
L'équipe de MidJourney affirme que nous pourrions voir la version 5.2 à l'avenir, améliorant encore les capacités de cet outil. Si la troisième fois est la bonne, alors les jours où les générateurs d'IA se trompaient dans les mains de nos deepfakes préférés pourraient enfin être derrière nous.