Les futurs enjeux de la data science en santé

By Juliette Olivier
Published on 1 October 2021

Kap Code vous propose de découvrir la vision des spécialistes en santé digitale sur les enjeux actuels et futurs de la data science en santé.

La data science connait une expansion fulgurante depuis les 10 dernières années. Parmi les très nombreux secteurs qu’elle transforme, l’industrie de la santé n’échappe pas à la règle.

Kap Code vous propose de découvrir au travers de plusieurs articles les regards croisés de trois spécialistes de la santé digitale. Décelez à travers leurs visions cette transformation du monde de la santé, par le biais du digital et de la data-science.

Dans ce troisième et dernier volet, les trois intervenants nous font part de leur vision sur les enjeux actuels et futurs de la data science en santé et les problématiques auxquelles nous devons faire face aujourd’hui.

Merci aux trois spécialistes :

Isabelle Hilali : fondatrice & CEO de datacraft
Emmanuel Capitaine : Médecin passionné de l’innovation en santé
Pierre Foulquié : Responsable Data Science chez Kap Code

Kap Code : Quels sont selon vous les challenges et les freins concernant la data science dans la santé aujourd’hui, à la fois pour vous et plus globalement ?

IH : « La santé est un secteur qui est traditionnellement très protecteur et c’est bien d’ailleurs ! Quand on est un acteur de la santé on doit veiller à bien respecter la réglementation, à faire attention au cadre des relations avec les patients, avec les professionnels de santé. Ce sont beaucoup de précautions nécessaires mais qui peuvent aussi amener de la lenteur sur l’avancement des projets et des limitations.

Les acteurs de la tech se posent beaucoup moins de questions et prennent des « risques ». Ainsi, les projets vont plus vite et s’aventurent plus facilement hors du cadre. Un décalage peut donc se créer dans l’avancement de projets communs santé et tech.

La plupart des acteurs de santé ont encore assez peu de compétences sur tout ce qui va permettre une utilisation du digital et des données, mais de nombreux recrutements de “nouveaux” profils sont en cours et en parallèle on voit une vraie réflexion stratégique sur la façon dont l’utilisation de la donnée peut contribuer aux missions des différents acteurs de la santé. L’écosystème de la santé manque encore de maturité pour mettre en œuvre des projets stratégiques sur la donnée mais il y a une appétence des acteurs de la santé et également des data scientists qui s’est beaucoup accéléré ces derniers mois.

La santé est un secteur qui génère énormément de données, qui est porteur de sens – ce qui est très important pour les data scientists – et qui dispose de moyens importants, autant d’éléments qui en feront un des domaines phare de la data science dans les années à venir.

De très nombreux projets sont en train d’être initiés, avec une digitalisation accélérée de l’écosystème de la santé, renforcée par la période de gestion de la crise du COVID. Ils ont pour but d’améliorer le parcours de soin, de développer la recherche, inventer de nouveaux services, mieux comprendre les besoins des patients et des professionnels de santé…

Pour illustrer par un projet auquel je suis associée, l’AP-HP et notamment l’équipe en charge de l’Entrepôt de Données de santé, en partenariat avec datacraft et le Sorbonne Center for Artificial Intelligence, souhaite donner envie à une communauté la plus large possible de collaborer sur des sujets de santé et favoriser l’émergence de projets collaboratifs pluridisciplinaires et l’échanges de bonnes pratiques sur des sujets tels que le NLP, la vision par ordinateur ou la FAIRification des données appliqués à la santé.

Un des principaux challenges de l’utilisation des données est la responsabilité qui y est associée. On parle beaucoup des sujets de fiabilité et de biais des algorithmes. Il est nécessaire à la fois que chacun en prenne conscience et devienne acteur de l’utilisation des données et des valeurs qu’il souhaite y associer. Pour une entreprise par exemple, recruter un data scientist ce n’est pas seulement le casse-tête de s’assurer de ses compétences et de savoir l’intégrer dans l’organisation, mais c’est aussi s’assurer qu’il partage les valeurs de l’entreprise car cela peut être moins facile à mesurer par la suite pour quelqu’un qui va développer des algorithmes que pour un directeur juridique ou marketing !

Il y a une véritable acculturation à faire à l’utilisation des données et à son utilisation responsable et durable. Aujourd’hui, dans toutes les écoles qui forment des data scientistes il y a une sensibilisation à ce sujet. datacraft a été créé notamment avec la mission de permettre aux data scientists réfléchir à pourquoi ils font les choses, comment ils les font, quelles limites ils se donnent. Plusieurs de nos membres ont par exemple décidé de rédiger ensemble une charte du bon usage des données. Il y a une vraie valeur à le faire de façon collaborative, en permettant des regards croisés entre secteurs d’activités et natures d’organisations.

C’est un sujet compliqué, si on compare la France avec la Chine ou les USA, nous n’avons pas les mêmes visions, il n’est qu’à regarder les débats éthiques sur les décisions à prendre dans la programmation d’une intelligence artificielle qui aurait à décider d’éviter une personne plutôt qu’une autre en cas d’accident. Il y a vraiment un échange à avoir, une prise de responsabilité au niveau international à développer. Je ne pense pas que l’éthique peut être une vision uniquement nationale. »

PF : « Pour cadrer ma réponse, je vais parler de ce que je connais le mieux : les opportunités et les freins que l’on rencontre en interne chez Kap Code avec notre outil Detec’t.

Dans un premier temps, on peut identifier des problématiques au niveau des données elles-mêmes :

Les données sont-elles de bonne qualité ?
Comment retrouver dans la masse les informations cohérentes et intéressantes ?

Comme nos données viennent des réseaux sociaux on doit aussi apprendre à travailler avec du texte très peu formaté (longueur, fautes, langage spécifique), et on n’a pas de grosses bases de données pré-annotées, ce qui nous demande beaucoup de temps pour en créer et entraîner nos algorithmes par la suite. C’est donc un premier frein au niveau de la disponibilité et de la qualité des données.

Une autre difficulté rencontrée est au niveau du recrutement. En effet, la data-science étant un nouveau métier il a été compliqué de trouver des candidats avec une formation en NLP (Natural Language Processing). Peu de profils se forment à cette technologie et d’autres entreprises sur le marché recrutent. Moi-même à mes débuts je n’avais pas assez d’expérience pour juger la compétence d’autrui. Néanmoins, aujourd’hui on commence à voir de plus en plus de formations orientées NLP, beaucoup d’écoles se lancent dans ce type de formation, mais il manque encore des profils autonomes et qualifiés.

On a aussi des challenges propres à la R&D : en cas de problème, nous pouvons rarement nous référer à des travaux existants. On se base sur de la bibliographie, des forums, mais souvent on ne sait pas si nos projets vont fonctionner, on tente différentes méthodes, et on ajuste ensuite en fonction des résultats. Il est arrivé qu’on se rende compte qu’un de nos objectifs était irréalisable.

Enfin, au niveau technique, on a des modèles qui prennent longtemps à tourner, des technologies pas encore optimisées en interne et qui peuvent nous faire perdre du temps et nous freiner. On s’améliore chaque jour en s’organisant de plus en plus, mais on a encore du chemin. »

EC : « Depuis plus de 15 ans dans la pharma et travaillant sur ces sujets depuis presque 10 ans, j’ai observé et vécu bien des évolutions et des étapes de maturités de notre écosystème français. Les challenges sont protéiformes, nombreux et en constante évolution, en particulier sur le sujet de l’IA en santé.

Aujourd’hui, les plus forts sont certainement la gouvernance, l’accès au marché et l’intégration pérenne dans les usages et la mesure de son impact/valeur.

Commençons par la gouvernance : C’est le premier aspect : qui à la main ? Qui décide ? Qui pilote les choix stratégiques ? Comment on se met tous d’accord ensemble ? Quand on voit la complexité de la gouvernance dans certaines initiatives digitales on se rend compte qu’il y a tellement de monde qui est partie prenante pour décider que les temps de décision sont très long.

Vu que le digital va très vite, si les processus de décision sont lents, on perd en compétitivité, on crée même une perte de chance pour le patient : on n’arrive pas à mettre la solution sur le marché simplement parce qu’il faut mettre 5, 10, 15 ou 20 acteurs d’accord ensemble.

De plus, dans la notion de gouvernance la perception de la valeur et des assets de chacun peut être assez variable. Chacun a envie de garder la valeur qu’il a, on peut donc arriver à des points de blocages majeurs quand on doit prendre des décisions tous ensemble.

Deuxième point, l’accès au marché : Si on veut mettre en place et déployer de manière équitable et sécurisée des solutions de santé, des dispositifs technologiques et numériques, alors ce sont des Dispositifs Médicaux (DM). Cependant, aujourd’hui beaucoup d’acteurs se disent « bon bah voilà, j’ai fait mon truc, je l’ai testé, il fonctionne : je peux y aller ! » Alors qu’en fait, ils n’ont aucun niveau de maturité sur tout ce qui est réglementaire, certification DM, dossiers d’enregistrement.

Il y a beaucoup d’acteurs, pas forcément des start-ups mais aussi des structures de moyenne taille, voir de grande taille qui, quand on leur dit que leur solution sera un DM, répondent « mais non pas du tout ». Alors que n’importe quel spécialiste dira que oui, c’est un DM.

Ils veulent éviter toutes les notions de qualité, de développement, de sécurité IT qui permettent un cahier des charges suffisant pour accéder au marché, alors que ce sont des enjeux importants mais nécessitant une maturité suffisante du produit.

Et au-delà du niveau de maturité il y a aussi la volonté. Il y a des acteurs du numérique en santé qui ont vu à quel point être un DM allait augmenter leur délai sur leur roadmap et coûter plus cher. Donc ils essayent d’éviter ça, ils sont dans des stratégies de contournement, qui font qu’ils lanceront plus rapidement et pour moins cher leur solution mais qui courent le risque de se faire rattraper par les autorités européennes ou françaises.

C’est pourquoi la notion d’accès au marché et tout ce qui est réglementaire et qualité est encore majeur. Peut-être qu’il le sera moins dans 5 ans parce que l’écosystème aura progressé.

Troisième point : L’utilisation pérenne dans les usages. Quand on regarde le nombre d’applications mobiles en santé qu’il y a sur le store et quand on voit celles qui sont utilisées il y a un taux de perdition énorme. Quand on voit le nombre de bracelets ou traqueurs d’activités qui sont achetés et ceux qui sont utilisés au bout de 3 mois ou 6 mois, c’est catastrophique. Une fois que les innovations ont passé les problématiques de gouvernance et d’accès au marché, ce n’est pas suffisant pour que les gens les utilisent dans le temps de manière pérenne.

Donc il faut se poser la question à mon avis à plusieurs niveaux : est-ce que la solution vient vraiment répondre à un besoin ? Si elle ne répond pas à un besoin, est-ce que ce besoin va apparaître ?

Et si, au contraire, on se dit qu’il y a une partie prenante décisionnaire, on risque aussi d’arriver à la rupture parce que les autres parties prenantes se font aspirer leur valeur et vont soit mourir soit ne pas être d’accord. C’est pour ça que la notion de gouvernance vient pour moi en premier, c’est un bon point de départ. Aujourd’hui dans un projet, par exemple de plateforme de données, la complexité ce n’est pas la technologie c’est la gouvernance très clairement. Et qui sous-entend gouvernance sous-entend business model. The business model est inclus dans la notion de gouvernance.

Si c’est le cas, tant mieux, mais dans ce cas-là comment on déploie ? Comment on distribue ? Comment on vend ? Et comment on aide les gens à l’adopter ? Tout ça ce sont de vrais challenges. C’est quand même dommage de voir le nombre de boîtes qui développe des trucs sympas, qui déploient en ayant sué sang et eau pour qu’au final il y ait une indifférence totale au bout de 6 mois.

Deuxième aspect sur l’intégration dans les usages : quand on parle de solutions numériques, par exemple pour les hôpitaux, ça peut impacter l’organisation des soins, la définition des métiers, les périmètres de responsabilité. Par exemple dans des solutions de télémédecine, assez régulièrement évoquées, la possibilité de faire une délégation d’acte du médecin vers une infirmière.

Quand on pose une solution numérique dans un hôpital il ne faut pas juste la mettre à disposition mais aussi se dire « Qu’est-ce que ça change ? Comment ça réorganise le parcours de soin ? Comment ça réorganise la distribution des tâches et des responsabilités des professionnels ? ».

Parce que si on ne fait pas cet effort-là, les gens vont rester avec leur organisation normale, existante, et la solution sera perçue comme « en plus ». Vu qu’ils ne changent pas l’organisation, ils vont continuer à fonctionner comme avant et les solutions ne seront pas utilisées plus de quelques mois.

Enfin, quatrième et dernier point : L’impact et la valeur. Parmi les nombreuses solutions technologiques en santé développées ou déployées, combien font l’objet de publications, dans des revues à comité de lecture, pour évaluer la valeur créée en termes d’évolution de la santé ? Très peu. Et ça c’est une chose qui manque.

Quelle valeur ça apporte au patient ? Quelle valeur ça apporte au point de vue médico-économique du système de soin ? Quelle valeur organisationnelle ? Quelle efficience économique pour un établissement de santé ? Ça, il faut prendre le temps de le mesurer, de formaliser cette mesure, de la suivre dans le temps.

Un peu comme un médicament ! Par exemple comme une étude de phase 3. Pour les applications de santé on pourrait faire une mini étude de phase 3. Et, sur le même principe de la pharmacovigilance pour les médicaments, il faut réussir à suivre la solution dans le temps quand elle est en vraie vie, pour voir à la fois son risque et/ou si elle répond bien avec l’amplitude d’effet qui a été mesuré dans les études de phase 3. »

Kap Code : Et enfin, quels sont les enjeux à venir dans la data science en santé ?

EC : « J’ai le sentiment que nous vivons une époque formidable où l’émerveillement est quotidien. Beaucoup s’accordent à qualifier la massification du numérique et le développement de l’IA comme une révolution civilisationnelle aussi profonde que celle de la littératie. C’est l’opportunité pour nous et les quelques générations à venir de définir le futur souhaitable.

Plus pragmatiquement, le secteur de l’IA est en hyper-croissance (+50% / an) en santé avec une taille qui devrait atteindre plus de 23 milliards d’ici deux ans.

A ce titre, pour garder le contrôle et l’exploiter positivement, le sujet de l’éthique doit concentrer les énergies car ce sujet est encore sous considéré (20% des acteurs), non maitrisé et sur des champs trop restreints : Vie privée et gouvernance. C’est très insuffisant.

Il faut impliquer très largement les acteurs publiques et privés dans cette réflexion éthique et étendre le champ :

Aux droits fondamentaux individuels vs intérêt général
A l’autonomie et au libre arbitre
A la responsabilité légale

Nous en sommes encore à l’intelligence artificielle très faible ce qui nous laisse l’opportunité de travailler des grands sujets qui, de mon point de vue, pourront être :

La robustesse des solutions qui génèreront des connaissances aidant à la décision et aux évolutions de comportements.
La transparence compréhensible des systèmes complexes.
Le caractère non discriminatoire et inclusif du progrès en regard du pacte social en France.
La responsabilité au sens large et plus spécifiquement légal par exemple avec la définition du « droit des robots ».
La transformation des métiers, le réforme en profondeur des formations et éducations.
La démonstration de la valeur et l’évaluation de l’impact positif pour les patients à court, moyen et long terme
Et enfin la notion de gouvernance…

Et j’aimerais revenir sur le sujet de la gouvernance qui est pour moi primordial. Il faut la mise en place d’une gouvernance clair et efficiente, animée par l’intérêt général. Il faudra mettre en place cette structure de manière adaptée donc sur le même modèle que le web s’est développé : Pas de centralisation pour adresser les sujets ni de délocalisation mais plutôt en réseau distribué en faisant le pari de l’intelligence collective afin de créer une valeur pérenne.

En effet, si le modèle de gouvernance était centralisé par exemple au niveau des politiques et des gouvernements, il y aurait obligatoirement un effet d’opposition des acteurs de la technologie.

Regardez les tensions qu’il y a entre les GAFAM et les gouvernements. Chacun essaye de ne pas aller au point de rupture parce que chacun a besoin de l’autre. Et pourquoi ça a apparu ? Parce qu’il y a eu un système de gouvernance ultra centralisé. Des deux côtés. Si on est sur un système délocalisé on va rendre les tensions diffuses, mais il y en aura toujours.

C’est pour ça que je parle de réseau distribué, quand je parle de réseau distribué ça veut dire qu’il faut que la part de voix de chacun dans la gouvernance soit à la fois équilibrée mais aussi diversifiée.

Quand on a une solution fonctionnelle qui répond à des besoins, avant de prendre de face la régulation, il faut que les personnes qui fabriquent ces solutions soient animées d’une éthique et d’un sens de la responsabilité importants pour eux-mêmes participer à la régulation de leur solution plutôt que de jouer les pirates en disant « il y a une opportunité marché, je me lance, j’y vais, et puis ils essaieront de me rattraper mais en attendant j’aurais fait du business ». C’est ça le modèle distribué : la responsabilité et la notion d’éthique doit être au cœur des préoccupations, non pas de certains stakeholders mais de tout le monde. Pour adresser efficacement ce périmètre qui appartient à tout le monde et à personne, qui a une valeur infinie mais qui n’a pas de prix … La santé ! »

PF : « Il faut bien garder en tête que la data science se base avant tout sur les données ! Et dans le cadre de la santé, de données sensibles, critiques sur la santé du patient. On n’est pas sur un site de commerce, les enjeux issus vont avoir un gros impact sur le patient, comme par exemple savoir si une personne a un cancer ou non. Il y a donc une grosse notion de responsabilité à prendre en compte : si le programme se trompe, à qui la faute ? Au programmeur ? Au médecin ?

Le vrai enjeu pour moi aujourd’hui est donc au niveau éthique et c’est un sujet fascinant. Il y a beaucoup de travail pour réussir à ne pas perpétrer les bais et à voir au-delà du programme.

Ensuite il y a évidemment des enjeux techniques. De 1990 à 2010 ils utilisaient des programmes basés sur les connaissances des années 40, via les nouvelles puissances de calculs. Aujourd’hui on arrive vraiment à des innovations en termes de maths, il y a beaucoup de progrès, même si les résultats pour l’instant permettent simplement de reconnaître une banane sur une image (rire).

Et pour finir, si on se concentre sur une vision plus globale et long terme, je dirais qu’il y a un enjeu sociétal. Les IA en santé cherchent à permettre aux gens de vivre plus longtemps et en meilleure de santé. Pour moi ça rejoint les polémiques sur les retraites, et sur le système de soin actuel : les nouvelles technologies coûtent chères, il faut trouver leur place au sein du système de santé. »

IH : « C’est vrai dans tous les domaines, mais notamment dans la santé, l’un des enjeux est de développer des projets concrets ! C’est-à-dire, partir de choses simples mais qui auront un vrai impact, peu importe si c’est une utilisation assez basique des données et pas du big data ou de l’intelligence artificielle.

Il faut vraiment essayer de se recentrer sur ses missions et sur des choses concrètes, et à partir de là se dire : avec les données que j’ai ou qui sont accessibles à l’extérieur, qu’est-ce que je peux faire pour mieux remplir mes missions ?

Alors que parfois aujourd’hui on a tendance à partir sur des projets pharaoniques qui vont prendre plusieurs années : la construction d’énormes bases de données, d’entrepôts de données… sans savoir nécessairement quel en est l’objectif et surtout alors que rien de concret ne se fera entre temps qui permettrait d’en démontrer l’utilité. C’est un scénario assez classique, pas que dans le secteur de la santé, avec pour résultat des data scientists démotivés et qui ne restent pas et le reste de l’organisation qui ne voit pas l’intérêt des projets mis en œuvre et des ressources mobilisées car personne ne voit de résultats.

Sur les projets mobilisant la donnée,on a besoin d’une vraie vision liée à ses missions, mais aussi de « victoires rapides », de projets qui fédèrent et d’apprendre en faisant.

Dans la santé on a besoin d’associer tous les acteurs y compris les patients et les professionnels de santé et comme dans tous les autres domaines de créer du lien avec les experts en data. En France, on a besoin d’accompagner les projets, parce qu’il y a un accès à la donnée plus compliqué que dans certains autres pays. Il y a beaucoup de startup et de grands acteurs comme les laboratoires pharmaceutiques qui vont utiliser des données étrangères. C’est très dommage, alors qu’on voit bien l’intérêt d’avoir des données de proximité.

Il y a véritable effort national qui est fait avec le Health Data Hub, mais on en est encore au début. Il y aurait une vraie politique publique à mener, avec plus de moyens, ce que certains pays font d’ailleurs. »

Ce dernier article présentant les regards croisés de spécialistes de l’innovation en santé met en lumière les challenges et opportunités de la Data Science en santé. Ce domaine est en pleine évolution dans un écosystème jeune. Ainsi, les enjeux font principalement écho au rôle de l’humain, son éthique et sa responsabilité dans la création et l’utilisation de nouveaux modèles. On retrouve également des enjeux organisationnels sur la gouvernance et la place des solutions développées dans le système de soin et de réglementation actuel.

Nous espérons que cette série « Regards Croisés » vous aura plu et vous aura éclairé quant à la vision de la Data Science en santé grâce à nos trois spécialistes.

Encore merci à Isabelle Hilali, Emmanuel Capitaine et Pierre Foulquié de s’être prêtés à l’exercice et nous avoir fait part de leur vision.

Data, Data science, Crossed views

Les futurs enjeux de la data science en santé

La place de l’humain au sein des nouvelles technologies

L’apport de la data science dans le monde de la santé

Kap Code : Quels sont selon vous les challenges et les freins concernant la data science dans la santé aujourd’hui, à la fois pour vous et plus globalement ?

Kap Code : Et enfin, quels sont les enjeux à venir dans la data science en santé ?

Share this article

In the same category

Kap Code : l’année 2020

Octobre Rose – Cancer du sein

Why must AI and humans collaborate?

Fake News Covid-19 #2 – Un vaccin en quelques mois

Latest articles

Observatoire de l’expression et du ressenti des patients

La dépression du post-partum, au delà du « baby blues »

Health Social Data Day, the event dedicated to health data from social networks

Prairie : Kap Code associated partner

Follow us

Newsletter

In the same category

Why must AI and humans collaborate?

Le rôle de l’éthique face à l’utilisation des Big Data et de l’IA en santé

Le nouveau rôle du patient dans l’industrie pharmaceutique

L’apport de la data science dans le monde de la santé

Kap Code

Our solutions

Resources

Contact

About us

Receive our newsletter

Les futurs enjeux de la data science en santé

À lire également

Kap Code : Quels sont selon vous les challenges et les freins concernant la data science dans la santé aujourd’hui, à la fois pour vous et plus globalement ?

Kap Code : Et enfin, quels sont les enjeux à venir dans la data science en santé ?

Share this article

In the same category

Latest articles

Follow us

Newsletter

In the same category

Kap Code

Our solutions

Resources

Contact

About us

Receive our newsletter