L'intelligence artificielle et la médiation interactive

Nicolas D'Alessandro, CTO & conception multimédia
Date de publication
-
15.3.2024

Quelques bases sur l’IA générative

L'IA générative se réfère à des systèmes capables de créer automatiquement du contenu original, que ce soit du texte, des images, de la musique, etc. Parmi les IA génératives, on trouve les large language models (LLM), comme ChatGPT, qui génèrent du dialogue textuel (et vocal) à partir de vastes bases de données, et les diffusion models (DM), utilisés pour créer des images ou d'autres formes de médias visuels à partir de descriptions textuelles.

Un LLM est un modèle de langage de grande envergure formé sur d'énormes corpus de texte. Il prédit les mots suivants dans une phrase en fonction du contexte des mots précédents, permettant ainsi des conversations d’apparence naturelles et cohérentes. D'autre part, les DM, comme DALL-E ou Midjourney, utilisent des algorithmes de diffusion pour générer des images originales à partir de simples descriptions textuelles. Ces modèles sont révolutionnaires car ils redéfinissent les contours de la créativité humaine en permettant de matérialiser des idées et des concepts avec une échelle de temps drastiquement courte.

Une approche centrée sur les usages et impacts de l'IA

Chez Hovertone, nous nous démarquons par une approche sensible de ces technologies. Plutôt que de simplement vanter les prouesses de l'IA, nous nous concentrons sur ses usages innovants et sur l'impact réel qu'elle peut avoir sur les processus créatifs et l'engagement du public. Nous croyons fermement que la technologie est un moyen, et non une fin en soi.

En effet, nous explorons comment elle peut transformer concrètement, en interne, les pratiques créatives et, dans les projets, offrir de nouvelles opportunités de médiation, d’interaction et d’engagement avec les différents types de publics. Pour nous, l'IA n'est pas seulement une nouveauté technologique, mais un outil qui, bien utilisé, peut enrichir et diversifier les expériences immersives et interactives en espace public.

Dans cet article, nous proposons trois angles pour approcher l’utilisation de l’IA: l’impact sur le processus créatif, les LLMs comme nouvel outil de médiation et notre pari du temps-réel. Nous souhaitons que ces retours d’expérience servent avant tout à ouvrir un débat constructif entre les lieux où se déroulent la médiation publique et, nous, les créateurs d’expériences.

1 – Impact sur le processus créatif

En matière de design, la créativité commence souvent par la recherche de la bonne question. Les LLM, tels que ChatGPT, offrent une nouvelle manière d'aborder cette recherche. Contrairement à une simple recherche par mots clés, les interactions avec ces modèles permettent de raffiner progressivement les questions posées. Bien que les réponses de l'IA doivent être prises avec prudence, ce processus de raffinement est extrêmement précieux. Il nous aide à identifier les incohérences et à clarifier les zones floues de nos projets créatifs.

Un exemple concret de cette utilisation se trouve dans le développement de concepts. Plutôt que de partir de zéro, les designers peuvent interagir avec un LLM pour générer des idées, poser des questions et explorer différentes avenues créatives. Ce dialogue itératif permet de cristalliser des idées qui auraient peut-être été ignorées dans un brainstorming plus traditionnel. Par exemple, d’une certaine manière, l’IA peut permettre de réaliser des démonstrations par l’absurde, ce qui est assez innovant. En effet, si une question est incomplète ou mal posée, l’IA aura tendance à magnifier ces vides/incohérences, textuellement ou visuellement, les rendant plus évidents, et permettant au designer de rebondir. C’est particulièrement vrai en texte vers image où tout ce qui n’est pas spécifié clairement dans le prompt est un espace libre pour l’IA, pour le meilleur ou pour le pire.

L'IA peut également jouer un rôle crucial dans la phase de prototypage. Par exemple, les modèles de diffusion (DM) peuvent générer rapidement des visuels qui servent de base de discussion pour les équipes créatives. Ces images générées peuvent inspirer de nouvelles idées et aider à visualiser des concepts abstraits. En réduisant le temps et les ressources nécessaires pour produire des prototypes, l'IA permet aux créateurs de se concentrer davantage sur l'itération et l'amélioration de leurs idées de manière très rapide.

Cependant, il est crucial de comprendre que ces modèles ne sont pas des êtres humains, mais des machines de prédiction. Leur capacité à simuler des conversations humaines repose sur la prévisibilité des données qu'ils ont assimilées. En dépit de cette limitation, l'itération et l'affinement des prompts avec ces modèles peuvent être aussi instructifs que les réponses elles-mêmes. C'est dans ce processus de va-et-vient que se trouve la véritable innovation: l'IA aide à poser les bonnes questions, ce qui est souvent le plus difficile en design.

2 – Médiation interactive par les LLMs

L'utilisation des LLMs ne se limite pas aux processus internes. Chez Hovertone, nous explorons comment ces modèles peuvent transformer la médiation de contenus en espaces publics. Par exemple, nous avons développé des projets où des personnages historiques interagissent avec les visiteurs en "reparlant" grâce aux LLMs. La médiation interactive devient ainsi plus immersive et engageante. Imaginez une exposition où un personnage historique, recréé par un LLM, raconte ses propres histoires et répond aux questions des visiteurs. Cela crée une expérience riche et éducative, plus dynamique que la lecture de panneaux d'information.

Un des défis majeurs est de trouver le bon équilibre entre l'interactivité et l'authenticité. Cette approche pose également des questions éthiques et pratiques importantes. Quelle distance historique doit être respectée pour garantir l'authenticité ? Comment assurer la précision historique des contenus générés par l’IA ? Les LLMs peuvent produire des réponses convaincantes et vivantes, mais ils peuvent aussi générer des informations incorrectes.

Notre travail consiste donc à nous assurer que les contenus générés par l’IA ne sortent pas du champ de ce qui est décrit dans les documents d’archives et les témoignages. Pour ce faire, nous développons des techniques hybrides où nous “forçons” l’IA à restituer des extraits authentiques pour répondre aux questions des visiteurs. De plus, nous investiguons beaucoup le prompt engineering pour cadrer l’IA générative et éviter les hallucinations.

Nous privilégions aussi des modèles open-source comme LLAMA pour avoir un contrôle total sur les données et les algorithmes utilisés, évitant ainsi les biais et les limitations des plateformes cloud propriétaires. Cette indépendance technologique nous permet également d'adapter les modèles à des contextes spécifiques et à des besoins particuliers. Par exemple, nous pouvons entraîner le modèle sur des archives régionales pour offrir une expérience encore plus pertinente et personnalisée. Cette personnalisation renforce l'engagement des visiteurs, car ils se sentent connectés à l'histoire et à la culture de leur propre communauté.

3 – Notre pari sur l'interactivité en temps réel

L'une des tendances les plus passionnantes que nous observons est l'essor des technologies de vision par intelligence artificielle pour l'interactivité en temps réel. En espace public, les caméras et les algorithmes de reconnaissance de formes remplacent de plus en plus les capteurs embarqués. Ces outils permettent de suivre en temps réel les mouvements des visiteurs et des objets, créant ainsi des expériences interactives riches et immersives.

La reconnaissance de formes en temps réel ouvre un monde de possibilités pour la médiation interactive. Par exemple, dans une exposition, les visiteurs peuvent interagir avec les contenus en utilisant des gestes ou des mouvements. Les caméras détectent ces interactions et déclenchent des réponses visuelles ou sonores, transformant l'expérience passive de la visite en une interaction dynamique et engageante. Cela permet non seulement d'attirer l'attention des visiteurs, mais aussi de les encourager à explorer et à découvrir davantage.

Un autre développement prometteur est la génération d'images par IA en temps réel. Cette capacité ouvre des possibilités extraordinaires pour la création de mondes virtuels interactifs. Imaginez un "miroir virtuel" où les visiteurs se voient intégrés dans des univers fictifs et engageants, augmentant ainsi leur engagement et leur connexion émotionnelle avec le contenu. Cette technologie peut être utilisée dans des contextes variés, comme les expositions muséales, l’activation du public en rue ou encore pour des événements.

Nous pensons qu’avec une approche davantage centrée sur les usages et en mettant les utilisateurs au centre du débat, les technologies d’intelligence artificielle ont le potentiel de créer un véritable renouveau de la médiation interactive en espace public. Elles permettent la création d’expériences fluides, riches et personnalisées. Elles aident à la création de scénographies immersives, poétiques et engageantes, car moins contraintes par les impératifs du déclenchement via des capteurs embarqués, RFID, contacteurs, etc. Les technologies interactives de demain se veulent invisibles, entièrement au service du propos.

contactez-nous

autres articles

plus d'articles