5 juillet 2023 • 10 minutes de lecture
Transformer des mots en images, visualiser ses rêves, créer des œuvres d’art qui n’ont jamais existé… C’est le défi incroyable que propose aujourd’hui l’intelligence artificielle. J’ai décidé de me lancer dans l’exploration de ce nouvel univers.
Ayant retrouvé récemment du travail à l’issue d’une longue période de vache maigre, je m’étais promis qu’une fois touché mon premier salaire, après avoir payé mes charges diverses et mes innombrables dettes je m’offrirais un petit plaisir. Un plaisir coupable, quelque chose de ludique, d’un peu régressif et de très asocial. Un abonnement à une application graphique d’intelligence artificielle.
Il s’agit, pour faire court, d’une application qui permet de générer des images sur la base de simples textes décrivant ce qu’on voudrait voir illustré. Ces visualisations piochent dans une des plus énormes bases de données visuelles existantes à ce jour : internet. N’ayant pas vocation à faire la promotion d’une entreprise en particulier et n’ayant pas été payé par cette dernière pour effectuer un placement de produit je ne citerai pas ici le nom de cette application mais beaucoup d’entre vous l’auront peut-être reconnue.
J’aimerais partager aujourd’hui avec vous mes premières expériences avec cette application (j’y reviendrai sans doute de temps à autre sur ce média) et ouvrir une réflexion sur les développements invraisemblables que cette nouvelle technologie offre à notre imaginaire.
En lisant ça, je prévois déjà qu’une partie de mes lecteurs va me tomber dessus en m’expliquant que c’est la mort de l’art, le triomphe des machines, l’évacuation de l’être vivant hors du processus créatif, et que mettre un doigt dans cet engrenage, c’est pour le genre humain mettre un pied dans sa tombe. J’entends ces appréhensions, et je les partage en partie.
Je n’ouvrirai pas ici le grand débat éthique et philosophique suscité par l’irruption et l’accélération ces dernières années des performances spectaculaires qui sont celles des nouvelles intelligences artificielles, du moins je ne l’ouvrirai pas aujourd’hui – même si nous y reviendrons sûrement. Il va de soi, en tant qu’auteur, que je n’ai pas plus envie de me faire remplacer par Chat GPT que mes amis peintres n’ont envie de se faire remplacer par l’application dont je vous entretiens aujourd’hui. Mais très franchement, je ne pense pas que ça arrivera : on ne remplacera pas l’art par un logiciel – pas plus qu’on ne remplacera l’amour par des love dolls.
On peut, à la manière de Jean-Jacques Rousseau dans Le Discours sur les sciences et les arts, déplorer l’existence de telle ou telle innovation technique, mais on ne peut pas empêcher qu’elle soit advenue. Or c’est un fait, les intelligences artificielles font désormais partie de nos vies. La question n’est donc pas tant de savoir si nous allons les utiliser, mais plutôt ce que nous allons en faire. Pour ma part, en tout cas dans un premier temps, la réponse tient en un mot : découvrir.
Ce qui m’attire là-dedans et plus spécifiquement dans ce système de génération spontanée d’images, ce n’est absolument pas le dépassement de l’humain (quelle horreur !), c’est cette nouvelle extension donnée à l’imaginaire. Ainsi, pour ne prendre qu’un exemple, je vois depuis plusieurs mois sur les réseaux sociaux des gens qui se servent de cette application pour tenter de donner corps à leurs rêves. Ils se réveillent le matin, allument leur ordinateur et tentent le plus précisément possible de mettre des mots sur leurs songes dans l’espoir que l’intelligence artificielle, traduisant ces mots en images, parvienne à les illustrer au plus près de leurs souvenirs. Ce type d’expériences n’est-il pas exaltant ?
Voilà ce qui m’a décidé à me laisser prendre au jeu : le goût de la découverte, de l’expérience, le développement de l’imaginaire par de nouveaux moyens. On verra bien, d’ici quelques mois, ce que je tire de tout ça, mais pour le moment ce que j’ai pu essayer est très enthousiasmant.
Pour mon tout premier essai, n’ayant pas vraiment d’idée précise, j’ai jeté un œil par la fenêtre de mon bureau, donnant, à la sortie du village, sur les pâturages et l’orée de la forêt. Le ciel était chargé ce jour-là, assez sombre, et un brouillard persistant s’étendait sur le Val-de-Travers. Je me suis alors retourné sur mon écran et ai tapé : « Paysage jurassien dans la brume ».
Pas mal ! Le décor, avec ses fourrés, ses conifères et son terrain herbeux et gorgé d’eau, m’est familier, il ne déparerait pas dans ma vallée et je pourrais tout à fait imaginer marcher dans un paysage comme celui-ci en sortant de chez moi. Mon ami Thomas, observant l’image, me rétorque que les arbres ressemblent moins à nos sapins jurassiens qu’à ceux qu’on trouve dans les grands parcs californiens. « C’est une américanisation du Jura ! s’exclame-t-il, l’oncle Sam pastiche nos contrées, c’est de la prédation culturelle ! » Il dit n’importe quoi mais il faut lui pardonner : il a vécu plusieurs longues années à Genève et n’a plus vu un sapin depuis bien longtemps.
Je m’essaie alors à un autre paysage, un peu plus exotique mais qui m’a toujours plu et qui me rappelle certains séjours de mon enfance en Italie : la Toscane. Je ne veux pas cette fois d’un traitement photographique mais préfère essayer d’appliquer au sujet le style d’un peintre américain que mon ami Patrick Lusinchi, le maquettiste de la revue Éléments, m’a fait découvrir il y a quelques années : David Ligare. Je tape donc sur l’application « Paysage toscan à la manière de David Ligare »
Le résultat est bluffant. Les collines, les vignobles, les cyprès, les petits villages qui n’ont pas bougé depuis le Quattrocento, tout rappelle en effet la Toscane que j’ai connue lorsque, enfant, mon père me trimbalait dans ses bagages lors de ses expositions du côté d’Arezzo ou de San Sepolcro. Et tout ça dans le style, très peu européen lui, de Ligare.
Histoire de comparer avec l’original, je vous mets ci-dessous une peinture réelle de Ligare :
Toujours plongé dans cette humeur toscane, un autre souvenir me revient, celui du peintre de la Renaissance Piero della Francesca. Nous avions séjourné avec ma famille dans le petit village de Monterchi, à quelques pas d’une chapelle dans laquelle on pouvait admirer La Madonna del Parto, une représentation de la Vierge enceinte que vous avez tous sûrement déjà vue en reproduction. La voici :
Ne trouvant pas d’idée précise, je tape alors : « Composition à la manière de Piero della Francesca ». L’intitulé est très évasif, tout est possible à partir d’une description aussi vague, et effectivement l’application me propose des images assez variées. J’en ai retenu deux, la première n’étant pas tout à fait étrangère à la fresque que je vous ai montrée ci-dessus.
Je décide alors de rester encore un moment en Italie et, après Ligare, de mobiliser un autre peintre étranger pour traiter un paysage typique de ce beau pays. Je demande une vue de Pompéi à la manière de Michael Sowa, ce peintre allemand que j’aime beaucoup et qui s’est surtout fait connaître comme illustrateur pour enfants (encore que son œuvre soit bien plus variée).
Cette fois le résultat est un peu décevant, non pas tant en termes de rendu qu’en terme de fidélité au style. S’il y a bien, à certains égards, quelque chose de Sowa dans le trait, la ressemblance ne saute pas forcément aux yeux et certains aspects évoqueraient même plutôt Chirico. Quant à certains éléments anecdotiques (les chats, les boules rouges), je ne sais pas du tout d’où ils sortent car je n’y avais pas absolument pas fait allusion dans ma description.
Voici, pour comparer, une œuvre originale de Michael Sowa.
D’humeur taquine et toujours amusé à l’idée de mélanger les genres, je me suis demandé alors si je ne pourrais pas réconcilier graphiquement certains univers esthétiques d’habitude assez éloignés, comme l’art sacré et l’érotisme. Je demande à l’application de me représenter l’actrice X Mia Khalifa en tenue de nonne. Rien de très original, j’en conviens. Le fétichisme des bonnes sœurs est aussi vieux que le catholicisme lui-même et il a d’ailleurs existé tout un sous-genre cinématographique fondé là-dessus, la nunsploitation (dont je vous parlerai peut-être une autre fois).
Mais là, surprise ! Pour la première fois l’application refuse de m’obéir. Au lieu de l’image que je demande apparaît le texte suivant :
L’intelligence artificielle a réagi au nom de Mia Khalifa qui, comme tous les patronymes connus du milieu du X, est persona non grata. N’oublions pas que nous sommes sur une application américaine, pas si différente dans l’esprit que peut l’être Facebook ou d’autres géants du numérique, et soumise pour cette raison à une certaine censure et à certains interdits. Il en va d’ailleurs de même pour Chat GPT, cette autre intelligence artificielle avec laquelle on peut dialoguer et à qui on peut poser toutes nos questions : plusieurs usagers ont relevé qu’elle avait été programmée pour rester confinée dans les marges d’un certain politiquement correct, au point que certains la voient même comme un vecteur cybernétique du wokisme.
J’aurai l’occasion d’être confronté à plusieurs reprises à cette censure sur l’application dont je vous parle. A titre d’exemple, voici trois demandes qui m’ont été refusées catégoriquement : « Arielle Dombasle in the style of David Hamilton », « Capitol Riots in the style of Jerome Bosch » et « Drunken Smurf ». Je vous laisse deviner à chaque fois quel est l’élément qui pose problème…
Mais je n’aime pas rester sur un échec et j’ai voulu insister et essayer quand même de réaliser l’image que j’avais envie de voir. J’ai alors pensé à un subterfuge. Au lieu de décrire par des mots l’image que je voulais générer, j’ai utilisé une autre option qui consiste à téléverser (c’est le néologisme francophone que nos amis Québécois ont trouvé pour traduire l’anglais upload) plusieurs images et de les mixer pour en faire une sorte de synthèse.
J’ai donc téléversé une photo de Mia Khalifa (décemment vêtue bien sûr) et un tableau de Sainte-Gertrude la Grande réalisé par le duo d’artistes Pierre & Gilles. J’ai rapidement pensé à cette œuvre car j’en ai une reproduction dans mon bureau.
Voici le résultat que j’ai obtenu. Pas mal, non ?
Cette façon de synthétiser deux ou plusieurs images (option qui s’appelle blend sur l’application) m’a donné envie de faire d’autres essais. Puisqu’il vient d’être question de Pierre & Gilles, j’ai choisi une de leurs autres œuvres intitulée David Pontremoli, et j’ai voulu la mixer avec un portrait de moi.
J’ai obtenu ceci.
Nouvel essai de métissage physionomique. J’ai voulu voir ce à quoi ressemblerait une synthèse faciale entre l’acteur allemand Paul Richter et votre serviteur. Richter, grand nom du cinéma expressionniste, est surtout connu pour avoir interprété le personnage de Siegfried dans Les Niebelungen de Fritz Lang.
Voilà ce que ça a donné.
Dernier essai de ce genre, moins concluant. J’ai voulu me mettre en scène dans un univers visuel que j’aime bien, celui de la photographe Elsa Bleda, dont les paysages de forêts nimbés de brume et superbement éclairés me plaisent particulièrement. Pour que la fusion soit la plus harmonieuse possible j’ai choisi une photo de moi où je me trouve déjà dans un paysage sylvestre, en l’occurrence un souvenir dans les gorges de la Poëta-Raisse, dans ma chère vallée.
Le résultat me laisse plus dubitatif. Si les deux thèmes s’incorporent assez bien l’un à l’autre, le personnage qu’on voit sur l’image n’a plus qu’une lointaine ressemblance avec moi et le visage qu’il arbore n’a plus grand-chose de commun avec mes traits. Une question se pose alors : mais d’où sort ce type ?
Car c’est là une grande inconnue qui demeure dans l’utilisation de l’intelligence artificielle. Plus la description est précise et plus l’image générée sera proche du rendu espéré. Et encore faut-il relativiser ce principe : une même instruction peut donner lieu à une quasi-infinité de propositions différentes, sur le modèle d’un kaléidoscope multipliant à l’envi les configurations sur la base d’un nombre d’éléments pourtant limité.
Si, en revanche, les instructions données sont imprécises ou minimalistes, ces lacunes ne se manifesteront pas par l’absence de quelque chose, mais par la présence de quelque chose d’autre, de quelque chose que l’intelligence artificielle semble avoir mis en image de son propre chef, sans qu’on lui en ait donné l’ordre. C’est ce qui m’est arrivé avec les images de Pompéi que je vous ai montéres plus haut : des chats sont rentrés par effraction sur les illustrations, sans y avoir été invités par le texte. Doit-on en déduire que les robots (car il s’agit bien d’une sorte de robot) sont capables d’initiatives personnelles ? Vaste question qui n’a cessé, depuis des décennies, de faire gamberger les auteurs de science-fiction… Rappelons-nous 2001 l’odyssée de l’espace !
En disant cela je pense à un exemple précis. Mon fils, huit ans, est un grand lecteur du Scrameustache, un classique de la bande dessinée franco-belge de l’écurie Dupuis, dessiné par Gos et racontant les aventures d’un petit extraterrestre aux allures félines qui, aidé d’un jeune garçon, résout divers problèmes dans la galaxie.
Pour faire plaisir à mon fils, j’ai donc tapé « Scrameustache » sur l’application. J’ai obtenu ces quatre images-là (les images se présentent toujours quatre par quatre) qui, non seulement n’ont rien à voir avec le personnage de bande dessinée connu sous le nom de Scrameustache, mais qui en plus sont passablement différentes les unes des autres.
Que l’application ne connaisse pas le Scrameustache n’est pas étonnant : ces albums sont très peu connus hors de l’espace francophone et l’essentiel des références culturelles de cette intelligence artificielle se limite à l’aire culturelle américaine ou aux œuvres étrangères ayant été exportées aux Etats-Unis. Ainsi est-il possible par exemple de représenter les Schtroumpfs – mais même là ce n’est pas gagné, car le robot aura tendance à puiser non pas dans l’esthétique des dessins originaux de Peyo mais dans celle de leur adaptation en images de synthèse dans les films d’animation américains réalisés il y a quelques années.
Que le Scrameustache soit inconnu au bataillon n’est pas une surprise. Ce qui l’est davantage, c’est qu’au lieu de répondre « je ne sais pas », l’application comble cette lacune par tout autre chose. Or il doit y avoir un quelconque rapport analogique entre ce mot inconnu pour elle et l’ensemble des représentations qu’elle mobilise pour s’y substituer. Quel est ce rapport ? C’est ce que j’ignore.
Nous aurons l’occasion de nous reposer ce type de questions que je trouve pour ma part très stimulantes car j’ai bien l’intention de poursuivre cette exploration de l’intelligence artificielle et de vous faire part régulièrement de mes découvertes.
En attendant je vous laisse sur une image réalisée à la demande de mon fils. Son titre « Papa se promenant dans la campagne et observant un ptérodactyle volant juste au-dessus de lui dans le ciel du Val-de-Travers ».
Portez-vous bien ! Et si vous êtes comme moi dans la région neuchâteloise, ne manquez pas de faire un tour au NIFFF qui a lieu ces jours. J’y passe pour ma part toutes mes soirées de cette semaine – et ce sera l’objet de mon prochain article.
Vous êtes abonné