Présentation générale et objectifs

Le projet IS2 effectue des recherches en modélisation statistique. Plus spécifiquement, nous nous intéressons à la modélisation, à l'identification des modèles obtenus et à leur validation pour des systèmes ou des situations complexes pouvant intervenir dans le domaine industriel ou biomédical.

IS2 s'intéresse essentiellement aux modèles, dits à structure de données incomplètes, où intrinsèquement une partie de l'information nécessaire à l'identification du phénomène étudié est manquante. Ces modèles sont courants (durées de vie censurées, modèles hétéroscédastiques, ...) et puissants (modèles à structure cachée, ...). Ils apparaissent dans de nombreux problèmes statistiques qui se posent en milieu biomédical et en milieu industriel. Ces modèles à observation partielle sont difficiles à estimer, de par leur nature intrinsèque et aussi parce qu'ils concernent eux-mêmes des systèmes complexes (montage industriel compliqué, existence d'une structure de dépendance temporelle ou spatiale, nombreuses variables en jeu,...). De ce fait, ces modèles sont en général faiblement identifiables en ce sens que, au vu des observations effectivement recueillies, plusieurs jeux différents de paramètres peuvent apparaître également bons. Cela se traduit par une multiplicité des extrema locaux des fonctions de contrastes utilisées pour procéder à l'identification (vraisemblance, probabilité a posteriori, ...). Ainsi, ces modèles requièrent une grande rigueur conceptuelle et méthodologique, le recours raisonné à un principe de parcimonie (retenir le modèle le moins complexe pour une qualité d'ajustement acceptable), et l'utilisation d'outils algorithmiques sophistiqués.

L'un des objectifs de IS2 est de proposer des méthodes d'estimation et d'évaluation efficaces de ces modèles. En particulier, nous nous intéressons à l'utilisation et à l'étude théorique d'algorithmes stochastiques (versions stochastiques de l'algorithme EM, algorithmes MCMC (Markov Chain Monte Carlo, algorithmes de rééchantillonnage) dont le dénominateur commun est la restauration des données manquantes par simulation ainsi qu'à des algorithmes d'approximation stochastique pour l'estimation adaptative dans un cadre non paramétrique.

Les modèles considérés par IS2 sont par ailleurs souvent dictés par les problèmes qui nous sont soumis. Ainsi le choix de modèles bayésiens pour des problèmes d'analyse de défaillance s'explique par l'existence effective d'informations a priori et par la rareté des données de retour d'expérience. Dans le même ordre d'idée, notre intérêt pour la modélisation des événements rares et la prise en compte et la quantification d'opinions de plusieurs experts viennent de problèmes qui nous ont été soumis par EDF. Les modèles hétéroscédastiques sont eux issus de problèmes concrets dans les domaines de la sélection en génétique, le contrôle de production ou l'analyse de séries financières... Dans ce souci de proposer des modèles bien reliés aux préoccupations des utilisateurs, nous nous intéressons à une stratégie de modélisation par un principe de maximum d'entropie. Ce principe produit à la fois une relecture éclairante de modèles classiques, et fournit aussi les moyens d'obtenir, plus ou moins automatiquement, des modèles réalistes à partir de quantités jugées pertinentes par les utilisateurs.

La validation des modèles construits et identifiés est bien sûr un élément important de la recherche. Nous l'abordons par des tests non paramétriques ou, dans une perspective bayésienne, par le calcul de critères de parcimonie.


Principaux axes de recherche IS2


Retour à la page d'accueil d' IS2 .