Bonjour à tous !
💎 Comme promis la semaine dernière, parlons chez @Bazal d'extraction d'information. Nous avons pour cette démo développé un outil permettant d'extraire des informations clés d'un Excel.
✍️ Simple d'utilisation, le principe derrière est élémentaire : émettre des requêtes en langage "naturel", sans code, à un outil récupérant par la suite lesdites informations. Concrètement : discuter avec son Excel, sans passer pour un fou.
🛠️ Pour créer cet outil, nous avons divisé le développement en deux chantiers. Premièrement, un classificateur d'intention permettant d'extraire le sujet de la demande émise par l'utilisateur. Deuxièmement, un pipeline permettant d'analyser les données du Google Sheets pour répondre à cette demande.
Comme précisé auparavant, nous avons traité deux problématiques pour déployer ce chatbot. La première est la suivante : comment comprendre ce que l'utilisateur écrit ? Pour ce faire, nous avons développé un ANN (artificial neural network) tout ce qu'il y a de plus classique, permettant de classifier les requêtes de l'utilisateur. Avant d'arriver dans l'ANN, ces mêmes requêtes sont au préalable vectorisées, en utilisant un embedding pré entraîné sur une tâche de génération de texte. Les datasets d'entraînement peuvent être trouvés ici et ici
Pour tester notre démo, c'est ici. Elle restera disponible une semaine après cette publication.
À bientôt !