IA et Traitement Automatique du Langage
Derrière chaque mot, un vécu.
Derrière chaque vécu, une clé pour mieux prévenir et mieux soigner.

L’IA de TAL (Traitement Automatique du Langage) donne du sens à la parole des citoyens pour transformer leur expérience en savoir utile, renforcer la participation citoyenne et la démocratie en santé, et construire ensemble une santé plus juste et plus humaine.
NutriVieSanté et la 1ère application de participation citoyenne en santé, qui permet via un système de cartes, évoquant des situations en lien avec les thématiques à explorer, de donner littéralement la parole aux patients. Ces derniers enregistrent des messages vocaux, ou écrits, pour s’exprimer sur leur expérience face aux différentes situations évoquées. On parle alors d’un « verbatim », correspondant à un message vocal, ou écrit, qui comprend leurs mots, voire plusieurs phrases. Comme nous l’apprennent les Sciences Humaines et Sociales, cette expression libre, par la parole, permet de révéler des sujets infras ou inconnus, ce que ne permet pas un questionnaire classique qui s’appuie sur une connaissance a priori des possibles réponses données par les répondants, hormis dans les champs libres qui sont en moyenne complétés par moins de 5% des répondants *(HAS • Expérience des patients hospitalisés en France : Analyse nationale des commentaires libres du dispositif e-Satis • juin 2022).*
Les verbatims, ou transcriptions textuelles des propos oraux ou écrits, sont analysés par une Intelligence Artificielle (IA) spécialisée en Traitement Automatique du Langage (TAL) ou Natural Language Processing (NLP) en anglais.
Le TAL utilise des algorithmes avancés de Machine Learning *(apprentissage automatique)* et de Deep Learning *(apprentissage profond)* pour traiter et analyser les données textuelles. L’une des techniques employées par le TAL est le Topic Modeling, qui permet d’identifier les thèmes dominants à travers un ensemble de verbatims en utilisant des modèles probabilistes tels que le Latent Dirichlet Allocation (LDA). Une autre approche consiste en le Clustering, qui regroupe les textes en fonction de leur similarité sémantique en utilisant des méthodes de partitionnement comme le K-means ou l’analyse hiérarchique.
Le TAL permet également de comprendre les sujets exprimés en analysant le sentiment positif ou négatif avec lequel le sujet est abordé. Cette analyse, appelée « Sentiment Analysis » ou « Opinion Mining », repose sur des techniques de classification supervisées ou non supervisées, telles que le Support Vector Machine (SVM) et les réseaux de neurones convolutifs (CNN).Le résultat de l’analyse de sentiment est généralement exprimé sous la forme d’un score numérique compris entre -1 et +1, où -1 représente le sentiment le plus négatif, 0 est neutre, et +1 indique le sentiment le plus positif. Ce score est souvent divisé en intervalles de 1 dixième pour obtenir une granularité plus fine dans la mesure du sentiment exprimé.