--- title: "Affiche ACFAS: Inférence statistique distribuée en présence de données hétérogènes" date: "2021-05-05" collaborators: event: "AFCAS" event_url: "https://www.acfas.ca/evenements/congres/programme/88/600/614/c" location: "Université de Sherbrooke" media: "[Video](https://vimeo.com/542213584/f3e4f0a73a)" language: "fr" #tags: [fr, federated datasets, heterogeneity, distributed inference, distributed datasets] MOC: "[[Talks]]" publish: true --- # Affiche ACFAS: Inférence statistique distribuée en présence de données hétérogènes **[88e congrès de l'ACFAS](https://www.acfas.ca/evenements/congres/programme/88/600/614/c)** **[Vidéo](https://vimeo.com/542213584/f3e4f0a73a)** L'analyse distribuée réfère à l'interrogation statistique de données pouvant se trouver à différents endroits physiques, requérant ainsi des processus de calculs et d'analyse indépendants. Cette classe de méthode est de plus en plus demandée, notamment en sciences biomédicales au Canada, où les dossiers de santé sont collectés dans les hôpitaux partagés au niveau provincial, mais où il est souvent difficile de rassembler ce type de données à l'échelle fédéral en une banque placée en un seul lieu physique, en raison de considérations éthiques liées à la confidentialité des données des patients ainsi qu'à l'indépendance de la gestion des données médicales des différentes provinces. Or, de nombreuses questions de nature épidémiologique nécessitent l'interrogation de telles banques de données et appellent à l'utilisation et à la mise en œuvre de méthodes suffisamment souple pour produire des analyses inférentielles valides en contexte distribuées. Il existe des méthodes de la sorte, mais elles ne s’appliquent pas à toutes les situations. Entre autres, il arrive que les données soient issues de sources où les protocoles sont légèrement différents, ce qui mène à l’introduction d’hétérogénéité statistique. L’affiche présente mon projet, qui vise à définir un modèle statistique fidèle au contexte de données distribuées de façon hétérogène, à déterminer les propriétés intéressantes d’estimateurs adaptés à ce modèle statistique et à valider le tout en contexte d’application.