Étiquette : Cognition

  • Je propose une courte contribution pour une histoire récente des IA génératives (et quelques questions à se poser). Je veux montrer ici que les IA génératives font partie d’un système plus large qui s’est structuré depuis plus de vingt ans dans l’écosystème du numérique, avec l’économie de l’attention et l’expérience utilisateur en toile de fond.

    Photo by Steve Johnson on Unsplash

    Les IA génératives se sont récemment imposées comme vedettes dans le champ du numérique avec la mise en ligne de ChatGPT. Difficile, aujourd’hui, de ne pas inclure une IA dans une appli ou un service qui se voudrait innovant ! Au-delà du phénomène récent, quelles sont les dynamiques à l’œuvre depuis deux décennies ?

    Algorithme cherche données… désespérément

    Ce retour en force de l’IA dans le champ médiatique peut surprendre tant ce domaine était tombé dans une forme de désuétude pour le grand public, cantonné à un vague souvenir de science-fiction. Cela ne signifie pas que la recherche dans le domaine de l’IA soit restée inactive, mais la diversité des approches en même temps qu’une révision à la baisse de leurs ambitions a contribué à rendre le concept moins saillant.

    Il existe en effet de différentes formes d’IA. Les IA génératives sont fondées sur une approche dite connexionnistes. Ces IA apprennent à généraliser un comportement (souvent une classification) depuis une base d’entraînement vers de nouveaux stimuli qui n’ont encore jamais été rencontrés. La capacité d’apprentissage de ces IA est fondée sur un système d’unités (parfois appelé des neurones formels, car simplifié) connectées les unes aux autres et dont la force de relation est modifiée en fonction des apprentissages réalisés lors de l’entraînement.

    Cette technologie semble fondamentalement nouvelle : les outils comme ChatGPT donnent l’impression d’interagir avec une forme d’IA anthropomorphique et créative, ce qui fait forte impression sur les utilisateurs !

    Pourtant, les fondements de l’approche connexionniste sont plutôt anciens : leur ancêtre, le perceptron de Frank Rosenblatt date de 1957 ! Malgré des recherches continues, ces modèles vont peiner à s’imposer (sauf dans certains domaines comme la vision artificielle).

    Fondamentalement, ces systèmes sont limités par la quantité de données qui peut leur être donné comme entraînement. De plus, leur capacité d’apprentissage dépend de leur structure qui peut nécessite une grande capacité de calcul pour les modèles les plus complexes.

    Bien que le modèle particulier d’apprentissage sur lequel est fondé GPT soit un développement plutôt récent, la popularité récente de ces formes d’IA ne peut s’expliquer seulement par une découverte inattendue.

    Le succès de ces technologies est dû à l’aboutissement d’une évolution du numérique qui s’est mise en place depuis une vingtaine d’années.

    Le tournant de l’UX

    Comme je l’ai dit plus haut, les deux facteurs limitants de ces systèmes sont la puissance de calcul et le jeu de donnée utilisé pour l’entraînement. Il ne fait aucun doute que la puissance de calcul augmente constamment, tirée par des industries très consommatrices comme le jeu vidéo.

    Ce qui va faire sauter le verrou des données est la modification profonde des usages du numérique au tournant des années 2000. Or, que s’est-il passé au tournant des années 2000 ?

    1. L’apparition des moteurs de recherche (fin 90)
    2. L’avènement du Web 2.0 (fin 90 / début 2000)
    3. Les premiers réseaux sociaux (courant 2000)
    4. Les smartphones (courant 2000)

    Que nous disent ces évolutions : le numérique se centre depuis les années 2000 sur l’échange de contenus, la mobilité et la collecte de données. Dès lors, le numérique est devenu le centre de ce que l’on peut appeler une économie de l’attention dont le moteur est la collecte des données utilisateurs.

    En parallèle, sont apparues les sciences des données qui théorisent et organisent le process industriel d’exploitation de ces données.

    Enfin, l’essor de l’expérience utilisateur (UX, USer eXperience) s’est imposé comme doctrine de conception. L’expérience utilisateur ne s’intéresse pas uniquement à la facilité d’usage (sujet classique de l’ergonomie et de l’utilisabilité) mais aussi aux émotions et aux motivations.

    L’expérience utilisateur devient le moyen évident de capter l’attention de l’utilisateur et donc de favoriser la collecte de données qui en retour pourra améliorer cette expérience… mais pas seulement.

    Aujourd’hui, l’exploitation des données personnelles pour des fins publicitaires est bien documentée. C’est moins le cas pour ce qui est du rôle des pratiques de conception sur la collecte de données à des fins d’entraînement d’IA.

    Entre la mise en ligne de ChatGPT en 2022 et les débuts du Web 2.0, un système cohérent (industriel) s’est mis en place : d’abord facilitation de l’échange de contenu et la captation de données utilisateur ; ensuite, instauration d’une économie de l’attention dans laquelle l’expérience utilisateur est le moyen de capter l’attention des utilisateurs ; enfin exploiter massivement ces données dans une optique de développement d’IA fondées sur l’apprentissage automatique.

    Remettre l’utilisateur au centre de l’UX

    Que les pratiques de conception centrées sur l’UX et l’exploitation des données utilisateurs permettent de créer de meilleurs produits (fondés sur l’IA ou non) est une bonne chose.

    Au-delà des régulations qui commencent à émerger (RGPD, DSA), ou la réflexion éthique de plus en plus présente, il faut se demander comment les pratiques de conceptions peuvent aider l’utilisateur à regagner le contrôle de sa sphère informationnelle.

    La question que je me pose est donc plus du côté des utilisateurs : comment rendre accessibles et compréhensibles les transactions qui sont souvent largement invisibles ?

    Le manque de culture numérique, l’usage massif de dark patterns et la difficulté d’utilisabilité des outils technologiques sont autant d’obstacles pour une utilisation lucide et un partage équitable de la valeur des données qui émergent de ce système d’interaction.

    Les spécialistes du comportement humain ont un rôle à jouer pour lever ces freins en travaillant sur une cybersécurité centrée sur l’humain en visant ces différents aspects :

    • Sensibilisation et formation à la sécurité de l’information ;
    • Utilisabilité, accessibilité et explicabilité des produits impliquant la sécurité de l’information ;
    • Identification et développement de contremesures face aux dark pattenrs.

    Les questions de confiance numérique ne se limitent plus aux services SI et aux organisations : chaque individu possède sa propre sphère informationnelle et les actes hostiles se multiplient tandis que de nouvelles menaces apparaîtront mécaniquement avec les nouveaux usages (XR, métavers, cryptos, IA). Plus que jamais, l’UX (innovateurs, designers, chercheurs) a un rôle à jouer pour remettre l’humain au centre de ses systèmes !

  • Le 13 mars 2024, j’ai le plaisir de donner un séminaire invité au département des sciences de l’information de l’Université de Tōhoku au Japon.

    Photo de Clauxz depuis Wikimedia.

    Ce séminaire permettait à la fois de faire le point sur une recherche menée antérieurement sur l’attention visuelle lors de la lecture de bandes dessinées, mais surtout de présenter le projet de recherche que nous menons actuellement avec les chercheurs Naoko Morita et Yuichi Wada sur les aspects interculturels de la lecture-compréhension de BD (Mangas au Japon).

    La BD est une forme d’expression extrêmement populaire, parfois utilisée dans le contexte de l’éducation et qui subit fortement les évolutions des médias numériques. Pourtant, les BD sont-elles si simples à lire ?

    Les recherches en psychologie et linguistique cognitive semble montrer que non : nous explorons l’espace visuel de la BD avec différents niveaux d’attention, ce qui pourrait impliquer une expertise spécifique.

    Mieux comprendre les mécanismes cognitifs sous-tendant la lecture-compréhension de BD est important, car la BD est un format précurseur des médias audiovisuels et numériques modernes (jeux vidéo, réalité augmentée).

    Les implications de cette recherche se trouvent à la fois du côté de la conception de nouveaux modes de lecture et de celui de l’étude de l’expertise dans la compréhension de documents complexes.