Sur les réseaux sociaux, forums et blogs, nombreux sont les patients qui se rassemblent en communauté numérique. Libre expression de l’histoire de leur maladie, la perception de leurs traitements, des retours d’expériences et soutien face aux fardeaux de leurs symptômes. D’un point de vue santé, ces témoignages constituent des données de vie réelle. Ces informations facilitent la compréhension de la vie quotidienne des patients, partageant leur quotidien sur les réseaux sociaux.
Des indicateurs de qualité de vie, questionnaires, échelles, servent à évaluer comment un profil de santé peut impacter les populations de patients au quotidien. Afin de permettre une méthodologie d’analyse standardisée des impacts de qualité de vie liée à la santé, un algorithme d’intelligence artificielle, basé sur les questionnaires génériques validés SF-36 et EQ-5D, a été développé par la société Kap Code. Cet algorithme de machine learning, utilisant des techniques de Traitement Automatisé du Langage a été entraîné à reconnaître, dans les verbatims patients, les expressions témoignant d’un impact de qualité de vie.
La qualité de vie liée à la santé
Selon l’OMS [1], la qualité de vie est définie comme
« La perception qu’a un individu de sa place dans l’existence, dans le contexte de la culture et du système de valeurs dans lesquels il vit, en relation avec ses objectifs, ses attentes, ses normes et ses inquiétudes. Il s’agit d’un large champ conceptuel, englobant de manière complexe la santé physique de la personne, son état psychologique, son niveau d’indépendance, ses relations sociales, ses croyances personnelles et sa relation avec les spécificités de son environnement. »
Organisation Mondiale de la Santé (OMS)
Une personne malade peut voir sa qualité de vie impactée par son état de santé. Le plus souvent, des outils validés permettent d’évaluer cette qualité de vie liée à la santé. Parmi ces derniers, l’EQ-5D et le SF-36 sont recommandés par la Haute Autorité de Santé (HAS) pour standardiser les tests de mesures de la qualité de vie.
A l’aide de ces outils, l’impact sur la qualité de vie des patients au travers de leurs messages sur les réseaux sociaux est quantifiable. Cela au niveau de cinq dimensions : relationnel, physique, psychologique, financière et activités quotidiennes.
Le développement de l’algorithme
Un corpus de 20 000 messages a été extrait entre 2000 et 2019, à partir de 19 sources de forums santé francophones en fonction de la présence d’un traitement ou d’une maladie (aléatoire) dans le corps du texte. De manière aléatoire un corpus final de 1 400 messages de patients, a été constitué.
Ce corpus comportant 71% de mentions de maladie (cancers, diabètes, endométriose, …) et de 29% de mentions de traitements (vaccins, Levothyrox, …) a par la suite été annoté de façon manuelle par un professionnel de santé et un data scientist. L’étape d’annotation a permis de classifier les messages dans les cinq dimensions d’impacts : physique, psychologique, activités financières, relationnel et financière.
En adaptant les variables à chaque dimensions, l’algorithme a pu gagner en performance et en spécificité.
Avec une courbe ROC présentant un score de 0,785, l’algorithme de qualité de vie développé par Kap Code apparait performant [2]. Une performance permise par la qualité de l’extraction de l’outil Detec’t, mais aussi grâce aux différents niveaux de validation du modèle. Une validation en partie humaine : en effet, l’Homme est encore plus à même à comprendre les subtilités du langage de surcroit sur les réseaux sociaux.
A l’ère du Big Data, où l’usage des réseaux sociaux continue de croître et où les communautés de patients se retrouvent et s’expriment librement, un tel outil capable d’analyser le profil d’impact de qualité de vie d’une population spécifique de patients, serait un vecteur de compréhension forte du quotidien des patients, du vécu de leurs fardeaux associés, afin de continuer à œuvrer dans le but d’optimiser leur prise en charge.