Nous parlions il y a quelques temps des différentes méthodes utilisées pour créer un chatbot “intelligent”, du mot clé à la détection d’intention. Il est temps de se pencher sur l’optimisation de cette compréhension du langage au fil des semaines et des mois de mise en production et d’entraînement. Pour cela, nous allons nous intéresser à un nouveau métier souvent fantasmé : éleveur de robots. Derrière ce terme bien marketé se cachent beaucoup de choses très différentes, de la mise en place à l’optimisation. Revu de détails.
Au commencement était la data
Vous le savez, pour entraîner un algorithme qui utilise du machine learning, il faut des données passées sur le sujet qui nous intéresse. A partir de ce jeu de données, l’algorithme va être capable de faire des rapprochements mathématiques pour analyser correctement (on l’espère), une nouvelle phrase qui va se présenter à lui. Sur le papier, ça paraît simple. Mais dans la pratique, ça l’est moins. Car il faut que ces données, que l’on appelle données d’entraînement, soient de bonne qualité. Bien classées dans un fichier propre, nettoyées de doublons ou d’erreurs humaines, etc…
Du côté des chatbots, on s’intéresse par exemple aux données texte issues d’échanges avec les utilisateurs que l’on vise. Plusieurs mois de conversations avec le support téléphoniques retranscrites en texte par exemple, ou d’historique d’échanges d’emails. Bref, beaucoup de données sur les attentes des utilisateurs mais aussi sur leurs formulations de ces attentes et besoins. Un premier scan automatique pourra être fait pour effectuer un premier tri, mais il faut bien des humains, que l’on pourrait appeler des “éleveurs de robots” valident ces traitements pour certifier la bonne tenue de la base de données.
Si nous n’avons pas ce genre de data à disposition, il faut ruser. Pour cela, 3 choix s’offrent à vous :
– faire remplir des lignes et des lignes de formulations d’intentions à vos collaborateurs
– faire remplir des lignes et des lignes de formulations d’intentions à des travailleurs du clic payés à la tâche
– faire remplir des lignes et des lignes de formulations d’intentions à des agences offshore spécialisées
Dans tous les cas, ce sont des vrais humains qui travaillent, dans les conditions que l’on connaît, pour contribuer à la conception du data set de base qui fournira de quoi faire tourner votre algorithme de reconnaissance du langage.
Une optimisation de la compréhension du langage naturel en continu
Même si vous avez le meilleur historique possible, et que vous avez passé du temps à nettoyer cette donnée, il est peu probable que votre solution de compréhension du langage gère parfaitement 100% des cas qui vont se présenter à lui une fois face aux utilisateurs. Pas de panique, c’est normal, et il y a une solution toute simple : l’optimisation continue.
Je dis toujours qu’un projet de chatbot n’est jamais terminé. Cela vaut pour l’optimisation de l’arborescence “statique” créée pour créer la structure de base du bot, pour l’éditorial et la rédaction, mais aussi bien sûr pour le moteur de compréhension du langage naturel.
Revenons à nos éleveurs de robots. Ce sont eux qui, lors de la phase de test puis en production, vont entraîner l’algorithme au quotidien. Car si certains prestataires vous vantent les mérites de chatbots “auto-apprenants”, ce sont bien des petites mains humaines qui viennent faire les ajustements nécessaires. Une phrase n’a pas été comprise, ou une réponse a été jugée non satisfaisante par un utilisateur ? L’éleveur de robot va indiquer pourquoi, et corriger avec la bonne réponse. Lorsque l’algorithme sera de nouveau confronté à ce cas, il générera alors la réponse attendue. De quoi éviter la répétition des faux positifs et des faux négatifs, mais aussi ajouter des domaines de compétence au chatbot au fil du temps.
La patte des collaborateurs fins connaisseurs du métier et des tâches confiées au chatbot est primordiale ! C’est cet entraînement au fil de l’eau qui va permettre à votre moteur de compréhension du langage naturel de se muscler, et de devenir réellement fiable.
Pour bien vous lancer sur la conception de votre chatbot, téléchargez gratuitement ce livre blanc !
Leave a Reply