@unpublished{publications50553, month = {March}, title = {Am{\'e}lioration des explications attributives locales pour appuyer l'analyse pr{\'e}dictive par apprentissage automatique : application au secteur de la sant{\'e} et aux outils d'aide {\`a} la d{\'e}cision m{\'e}dicale.}, author = {Elodie Escriva}, year = {2024}, url = {https://publications.ut-capitole.fr/id/eprint/50553/}, abstract = {Dans le domaine de sant{\'e}, l'analyse des donn{\'e}es est un enjeu fort dans l'am{\'e}lioration des prises en charge, la pr{\'e}vention des maladies ou l'adaptation des th{\'e}rapies {\`a} chaque patient. Initialement, cette analyse de donn{\'e}es est bas{\'e}e sur des m{\'e}thodes statistiques telles que les statistiques descriptives et inf{\'e}rentielles, afin de d{\'e}couvrir de nouvelles connaissances dans les donn{\'e}es. L'apparition de l'apprentissage automatique a permis de nouveaux cas d'usages gr{\^a}ce {\`a} son pouvoir pr{\'e}dictif. Son essor a {\'e}galement {\'e}t{\'e} favoris{\'e} par des applications aux retomb{\'e}es positives.Cependant, les mod{\`e}les pr{\'e}dictifs sont qualifi{\'e}s de boite noires {\`a} cause de leur complexit{\'e}, leur architecture ou de leur statut propri{\'e}taires. Comprendre leur fonctionnement et leur pr{\'e}diction est alors critique, notamment dans les domaines sensibles. Le domaine de l'Explicabilit{\'e} du Machine Learning (XML) a {\'e}merg{\'e} afin d'expliquer le comportement des mod{\`e}les pr{\'e}dictifs et leur pr{\'e}diction. Deux approches s'opposent entre les mod{\`e}les intrins{\`e}quement interpr{\'e}tables et les m{\'e}thodes post-hoc d'explication. Les mod{\`e}les interpr{\'e}tables ont des structures pouvant {\^e}tre directement analys{\'e}, tel que les arbres ou les r{\`e}gles de d{\'e}cisions. Les m{\'e}thodes post-hoc, {\`a} l'oppos{\'e}, s'appliquent sur des mod{\`e}les d{\'e}j{\`a} entra{\^i}n{\'e}s pour expliquer leur fonctionnement et leurs pr{\'e}dictions. Les m{\'e}thodes post-hoc agnostic d'explication locale permettent notamment d'expliquer individuellement chaque pr{\'e}diction, quelque soit le mod{\`e}le. Ces m{\'e}thodes populaires subissent cependant de nombreuses critiques quant {\`a} leur efficacit{\'e}, leurs hypoth{\`e}ses restrictives et la n{\'e}cessit{\'e} de privil{\'e}gier les mod{\`e}les interpr{\'e}tables dans les domaines sensibles. Cependant, ces derniers peuvent devenir boite-noire {\`a} cause de leur complexit{\'e} ou pour des raisons propri{\'e}taires. Les m{\'e}thodes post-hoc sont alors la seule alternative restante actuellement pour expliquer les pr{\'e}dictions. Pour int{\'e}grer les explications post-hoc dans des applications m{\'e}dicales, plusieurs probl{\'e}matiques se posent autour des forces et des faiblesses des explications locales, de leur analyse et de leur utilisation par des personnels de sant{\'e} non-expert en mod{\`e}le pr{\'e}dictif. Le comportement et les limites des m{\'e}thodes explicatives sont un point critique lors de leur utilisation, notamment dans les domaines sensibles. De plus, afin de comprendre les liens entre les pr{\'e}dictions, le mod{\`e}le et les donn{\'e}es, les explications peuvent {\^e}tre vues comme de nouvelles donn{\'e}es {\`a} analyser et {\`a} explorer. Enfin, dans le cadre d'application m{\'e}tier, les utilisateurs finaux sont souvent peu impliqu{\'e}s dans la conception des applications int{\'e}grant des mod{\`e}les pr{\'e}dictifs et des explications.Dans cette th{\`e}se, nous contribuons {\`a} l'am{\'e}lioration et l'impl{\'e}mentation des explications dans le domaine de la sant{\'e} sous quatre axes. Premi{\`e}rement, nous dressons un {\'e}tat de l'art du domaine, des m{\'e}thodes post-hoc locale et leurs {\'e}valuations, des diff{\'e}rentes utilisations des explications et des tests r{\'e}alis{\'e}s avec des utilisateurs. Puis, nous am{\'e}liorons la m{\'e}thode d'explication locale Coalitionnelle et la comparons {\`a} la litt{\'e}rature afin de mettre en lumi{\`e}re leurs forces, faiblesses et limites. Nous montrons les meilleurs contextes d'utilisation de chaque m{\'e}thode et qu'un gap existe encore pour les larges jeux de donn{\'e}es. Ensuite, nous proposons une approche d'analyse des explications bas{\'e}e sur le clustering afin d'extraire des informations sur le mod{\`e}le, les donn{\'e}es et les pr{\'e}dictions, offrant des perspectives d'analyse de ces explications. Enfin, nous {\'e}tudions, en d{\'e}finissant les besoins des utilisateurs, comment impl{\'e}menter efficacement les explications dans des applications m{\'e}dicales, en combinant plusieurs approches et des analyses statistiques. Nous proposons ainsi notre protocole de tests utilisateurs {\'e}valuant l'apport des explications pour des professionnels de sant{\'e}, r{\'e}alis{\'e} en collaboration avec des experts m{\'e}tiers.} }