Imaginez une machine capable de créer une image qui vous traverse l’esprit à partir d’un texte descriptif. C’est le projet fou mené par OpenAI, les créateurs de l’intelligence artificielle DALL-E 2 qui vient d’être annoncé.
Quand vous consultez des images sur un ordinateur, des lignes de code permettent de vous afficher le rendu sur votre écran. Mais le rapport du texte à l’image pourrait devenir bien plus direct d’ici peu.
En associant un personnage ou un objet avec une situation, l’intelligence artificielle de DALL-E 2 choisit des images qui lui semblent les plus à même de retranscrire la description écrite.
Comment ça marche ?
Comment cela fonctionne ? Un algorithme de Deep Learning (comme on parle ici) permet à la machine de retranscrire en images les textes. Plus il est utilisé, meilleur il devient. Chaque requête par une personne améliore le resultat et renforce la corrélation text-image.
À chaque texte tapé, il propose plusieurs images et différents styles qui rendent le choix possible. Une véritable prouesse puisqu’il s’adapte aux spécificités des images à chercher pour entrer dans le cadre d’un « dessin au crayon à papier », par exemple, ou d’une « peinture à l’huile » qui font partie des options disponibles avec le logiciel.
L’ordinateur est également capable de faire des points de vue sous tous les angles. Mieux, la seconde version de DALL-E devine les effets d’ombre, la position de certains objets qu’elle vient ajouter à l’image. Le logiciel s’adapte aux effets de reflet et à la disposition des formes pour réaliser une retranscription réaliste.
En plus de la création de photo inédites, les retouches seraient facilitées par la technologie dite « in-painting ». En utilisant un outil de sélection, il est possible par exemple de transformer la coupe de cheveux de la Joconde ou bien de remplacer un chien par un chat sur une photo. Pour ce faire, un bloc de texte apparaît et interagit avec l’image. C’est-à-dire que les utilisateurs pourraient apporter les modifications nécessaires à une photo aussi simplement que par la modification d’un texte.
Une autre possibilité offerte par la technologie de cet outil est la proposition de variations à une image préexistante. On ne peut qu’imaginer le potentiel de cette invention capable de créer des œuvres dignes des fameux diptyques d’Andy Warhol représentant Marilyn Monroe. Une technologie telle que celle de DALL-E 2 pourrait pourquoi pas démocratiser la technique du sampling, technique en musique d’utilisation d’un extrait d’un morceau afin d’en créer un autre, dans l’art graphique !
Une entreprise d’Elon Musk, encore ?
OpenAI est une entreprise apparue sous la forme d’une organisation à but non lucratif qui se donne pour mission de trouver des technologies d’intelligence artificielle qui profitent « à toute l’humanité ». Fondée en 2015 par Elon Musk et Sam Altman, entre autres, OpenAI entends bien démocratiser l’intelligence artificielle.
Pourtant, selon ce même Elon Musk, l’intelligence artificielle serait « la plus grande menace » que connaisse l’être humain. Il pense qu’un monopole imposé par un groupe restreint d’humains sur cette innovation pourrait créer une dictature qui, à la différence d’un régime humain, ne meurt jamais.
Venant de la première fortune du monde, la réflexion peut paraître étonnante. Vous l’aviez peut-être deviné par son nom et son idée collaborative, OpenAI publie ses recherches sur son site tout comme ses logiciels en open source, accordant l’accès aux internautes et fait part de ses difficultés rencontrées dans la conception. C’est donc sous cette justification humaniste que le patron de Tesla veut participer au développement de ces technologies.
En 2018, l’entreprise se transforme avec le départ d’Elon Musk et la prise de la direction par Sam Altman. L’open source est progressivement délaissée au profit de communiqués en ligne qui viennent informer sur les avancées de la compagnie. Un an plus tard, OpenAI devient une organisation à but lucratif plafonné afin de s’ouvrir aux financements. Financements qui viendront rapidement en partie de Microsoft.
En 2020, le GPT-3 avait déjà créé un réel engouement. Cette intelligence artificielle avait appris la grammaire, la syntaxe et les règles d’écriture en analysant des millions de pages web. Elle était ainsi capable de tenir une conversation cohérente ou d’écrire des nouvelles littéraires.
Ainsi, le développement des technologies d’intelligence artificielle par OpenAI semble voué à influencer notre conception des arts dans les années futures.
Une version améliorée de DALL-E
Le projet DALL-E, présenté en janvier 2021, est désormais équipé d’une résolution quatre fois supérieure dans sa seconde version. Le rendu qui apparaît sous nos yeux est la synthèse des 32 meilleurs résultats trouvés par l’algorithme en relation avec un mot.
Avec une telle invention, il est possible d’observer en haute définition des éléments de très près et d’avoir un effet qui donne le rendu de l’image dans le style rayon-X.
Vous pouvez déjà faire quelques tests du logiciel DALL-E 2 sur le site internet dédié à l’expérience à partir de résultats prédéfinis.
Le bouleversement du monde de l’art
Le premier domaine concerné est bien sûr celui des arts graphiques. A chaque instruction, le logiciel serait capable de créer une image inédite. Sera-t-il possible de capitaliser sur ce nouvel outil pour un plus large public ? On peut déjà imaginer un potentiel immense pour cette technologie.
Le monde des NFT artistiques semble intéressé par l’innovation qui pourrait rendre encore plus accessible la création artistique. Alors que les artistes commencent à comprendre les bénéfices que peuvent apporter les NFT pour la valorisation de leur travail, la technologie inventée par OpenAI doit les aider à proposer des œuvres en des temps plus restreints.
Mieux, elle redéfinirait notre perception de l’art, réduisant peut-être la création à l’imagination sans borne quand la machine nous épargnera le moment de création technique. L’évaluation de la valeur des œuvres serait attribuée en fonction de la créativité de l’artiste plutôt que pour sa virtuosité stylistique et technique.
Ensuite, l’architecture pourrait s’approprier ce genre de pratiques pour proposer aux agences immobilières de plonger leurs clients encore davantage dans la projection d’un terrain inhabité par exemple. Avec une présentation intuitive, le logiciel permet de décider du placement d’un objet comme un canapé ou un meuble.
Enfin, comment ne pas penser à l’industrie du cinéma qui doit observer toutes ces innovations en anticipant la disparition des décors qu’elle n’aura plus à modéliser. Aujourd’hui, la majorité des grands films hollywoodiens sont tournés dans de grands studios avec des fonds verts. Le procédé resterait le même, mais le montage deviendrait bien plus aisé grâce aux technologies d’IA.
Les ratés sur les travaux de CGI (Computer Generated Imagery) seraient vraisemblablement réduits à néant. D’ici quelques années, les créateurs du projet DALL-E pourront-ils transformer leur invention en une commande du texte à la vidéo ? Serait-ce alors les débuts d’un YouTube ou Netflix dont les vidéos et séries seraient rédigées par leurs propres consommateurs ?
Les IA en plein boom technologique
Le fait que DALL-E se base sur de vraies images pourrait dans un premier temps menacer la perception de la réalité. Il suit dans cette direction les Deep Fake, ces vidéos créées à partir notamment de discours d’hommes politiques. Une fois la synchronisation labiale appliquée, il ne manquait plus qu’à utiliser un sosie vocal de la personnalité en question pour créer une ressemblance presque parfaite.
Ces Deep Fakes sont déjà considérés comme un danger pour la démocratie puisqu’ils donneraient une excuse aux politiciens pour réfuter tout propos tenu. Une situation qui ferait perdre tout intérêt de la population envers la politique.
En 2017, AlphaGo, la machine développée par Google battait dans quatre parties sur cinq le champion du monde du jeu de go. Quelques mois seulement après le développement d’AlphaGo, sa version évoluée AlphaGoZero venait battre 100 victoires à 0 son illustre prédécesseur.
L’intelligence artificielle commence à trouver sa place dans les créations artistiques. Ainsi, toujours en 2017, Stromae avait participé avec la chanteuse Kiesza à la création d’un morceau composé en partie par l’intelligence artificielle. Capable d’associer des accords entre eux pour faire des progressions cohérentes, celle-ci pourrait permettre d’accélérer encore un peu plus le processus de production de musique.
Depuis quelques jours, OpenAI alimente un nouveau compte Instagram consacré à l’annonce de DALL-E et qui réalise des démonstrations impressionnantes des capacités de l’algorithmes.
Les évolutions des professions
De nombreux métiers sont susceptibles d’être remplacés à terme par la machine. Dans le cas où le projet DALL-E démocratiserait ses outils, les artistes digitaux ou les photographes seraient contraints de réinventer leur profession pour continuer d’exister.
DALL-E compte baser son machine learning sur des milliards de liens entre des images et des photos. Et comment faire subsister le copyright dans tout cela ? Pour l’instant, pas de réponse précise, OpenAI se défend en affirmant que sa base de données est accessible à tous en ligne. Il est probable que la justice ait à inventer de nouvelles réglementations pour protéger les artistes, photographes et journalistes d’utilisations abusives de leurs œuvres.
Pour le marché de l’art graphique, il faudra voir à l’usage si les machines remplacent entièrement les artistes humains. Avec des peintures qui rappellent le style des grands peintres, saurons-nous encore reconnaître les œuvres originales ? Et la reproduction de ces styles ne rendra-t-il pas l’exceptionnel moins exceptionnel ?
On pourrait aussi penser au domaine de la mode qui pourrait y trouver son compte. Une entreprise pourrait ne plus avoir besoin d’un mannequin pour promouvoir ses collections. Une simple image d’un modèle suffirait, ce dernier étant habillé selon les collections par le biais d’un logiciel tel que DALL-E 2. Ces innovations supprimeraient également le coût d’un photographe et de la location d’un studio pour les campagnes de promotion.
Pour l’instant, la liste d’attente est ouverte pour quelques partenaires qui pourront s’estimer extrêmement privilégié une fois choisis. Le but d’OpenAI n’est pas de rendre DALL-E accessible au grand public tout de suite afin de laisser le temps à ses équipes de trouver des solutions éthiques que posent ces découvertes.
Quelles questions éthiques posent les IA ?
Le projet se penche lui-même sur ses propres limites. Selon Open AI, l’algorithme doit encore être perfectionné de manière qu’une communauté de trolls ne lui apprenne pas à associer des images violentes, pornographiques ou simplement erronées.
En effet, on voit mal comment un logiciel qui ne serait pas certain de ses capacités sur le domaine de la sécurité et de la collecte des données pourrait voir le jour dans un monde post-Cambridge Analytica. Ce genre de dérives, qui expliquent que le logiciel n’est pas encore accessible au plus grand nombre, seront d’ailleurs fortement restreintes par des détections automatisées des contenus problématiques.
Se pose aussi la question de l’accessibilité d’une telle innovation pour les artistes. Si OpenAI insiste sur sa volonté de démocratiser les intelligences artificielles, on ne peut pas penser que ces technologies resteront gratuites à l’avenir. Cela signifierait la création d’un marché de l’art à deux vitesses entre des artistes qui en disposeraient ou non.
Pour la presse à scandales, on peut penser qu’il s’agit d’une opportunité en or pour utiliser les images des célébrités afin de choquer ses lecteurs par des images fausses tout en demeurant réalistes. Mais OpenAI a fait savoir qu’il ne sera pas possible de générer des images à partir de noms existants pour empêcher ce genre de désinformation. Les fausses informations et théories complotistes seront bannies, toujours dans cet objectif de ne pas laisser son utilisation dénaturer le logiciel DALL-E.
On pourrait se satisfaire de la réponse donnée par OpenAI à ces problèmes, mais ces technologies vont bien finir par arriver dans notre vie de tous les jours. Peut-on réellement imaginer les dégâts que feraient des montages aussi bien faits sur des carrières, la méfiance que cela génèrera dans la population vis-à-vis des médias ?
Le nom du projet DALL-E est un mélange entre Salvador Dali, l’artiste surréaliste, et le robot Wall-E du film Pixar du même nom.
Une fusion entre l’esprit humain et les compétences de la robotique donc. Nous l’avons vu, l’entreprise OpenAI pense pouvoir aider l’humanité en rendant son existence moins difficile grâce à l’intelligence artificielle. Mais prenant Wall-E comme référence, elle pourrait bien repousser certaines personnes se souvenant que, dans ce film d’animation, les humains sont devenus des consommateurs débarrassés de toute activité intellectuelle comme physique.
Le futur, c’est pas pour maintenant ?
En réalité, au niveau de la création artistique, le digital est déjà bien présent et commence à faire émerger d’autres disciplines. Par exemple, la modélisation 3D animée plus vrai que nature de Zaeoyo.
Cependant, on l’a vu avec le street artiste Banksy ces dernières années, créer une œuvre d’art suppose de pouvoir en parler, de la communiquer. Pour l’instant, l’intelligence artificielle ne mettra pas en œuvre un plan d’elle-même pour que les internautes réagissent et fassent d’un contenu un phénomène viral.
Elle n’est pas capable de créer du sens à partir d’une œuvre, mais simplement d’associer des images entre elles. La décision de faire une fresque à Calais dénonçant le sort des migrants comme l’a déjà fait Banksy, ce n’est pas encore de l’ordre des compétences des machines.