Recherche

Ma recherche s'organise autour de deux axes principaux, l'un substantif et l'autre méthodologique.

Axe substantif

Politiques publiques, science et technologie

(Politiques fondées sur les preuves, impact de l'IA sur les processus politiques, interface science-politique, influence de l'expertise, systèmes de conseil en politiques publiques)

15 projets Explorer
Axe méthodologique

Machine Learning and LLMs for Social Science Research

(Text-as-data, NLP pipelines, research infrastructure, collaborative platforms)

5 projets Explorer

Politiques publiques, science et technologie

(Politiques fondées sur les preuves, impact de l'IA sur les processus politiques, interface science-politique, influence de l'expertise, systèmes de conseil en politiques publiques)

2026

Analyse computationnelle de la relation entre crédibilité scientifique et influence politique des agences de santé publique au Canada.

Résumé

Cette étude examine la relation entre crédibilité scientifique et influence politique des agences publiques de recherche en santé publique au Canada. En utilisant des méthodes computationnelles avancées, nous analysons comment l'autorité épistémique de ces institutions se traduit (ou non) en influence sur les décisions de politique publique. L'étude porte sur plusieurs agences clés, incluant l'INSPQ, Santé Canada et l'Agence de santé publique du Canada, et examine leur rôle durant les crises sanitaires récentes.

Santé publique Autorité épistémique Conseil scientifique Canada INSPQ Analyse computationnelle

L'interface science-politique collaborative de la Suède s'est avérée plus résiliente que le modèle politiquement centralisé du Québec.

Résumé

Cette étude examine comment les configurations d'interface science-politique (ISP) ont façonné leur résilience institutionnelle durant la pandémie de COVID-19, à travers une analyse comparative du Québec et de la Suède. Alors que les deux juridictions ont affronté des conditions épidémiologiques similaires, leurs ISP différaient fondamentalement : le modèle politiquement subordonné du Québec concentrait la prise de décision au sein du gouvernement, tandis que le modèle scientifiquement autonome de la Suède accordait à son Agence de santé publique une indépendance substantielle. Les résultats montrent que l'ISP collaborative de la Suède a démontré une résilience supérieure, maintenant la confiance et l'optimisme malgré la détérioration des indicateurs épidémiologiques.

COVID-19 Résilience Confiance publique Interface science-politique Québec Suède Projet ENDURE

Le cadrage influence les décisions politiques liées à la COVID-19 au Québec et en Suède, souvent indépendamment des preuves disponibles.

Résumé

Cette étude examine comment le cadrage, les preuves et les rôles des scientifiques et des décideurs politiques dans l'élaboration des politiques influencent les décisions de politique de santé publique pendant la pandémie de COVID-19 au Québec et en Suède. En utilisant un ensemble de données complet de transcriptions de conférences de presse, nous appliquons le traitement automatique du langage naturel (TALN) pour évaluer l'impact de différents cadrages sur les politiques de suppression et d'atténuation. Notre analyse révèle que le cadrage affecte les décisions politiques, souvent indépendamment des preuves. Au Québec, où les décideurs politiques étaient centraux, un cadrage Dangereux, qui souligne les graves menaces sanitaires de la COVID-19, est associé à une augmentation des politiques de suppression strictes, même en l'absence de preuves solides.

COVID-19 Cadrage Politiques publiques TALN Santé publique Analyse comparative
2025

Les décisions politiques durant la pandémie ont été façonnées par un mélange de preuves scientifiques et de jugement humain, pas par la science seule.

Résumé

Ce chapitre explore la relation entre la science, le jugement humain et les politiques publiques durant la pandémie de COVID-19. Il souligne que, contrairement à la rhétorique prédominante selon laquelle les décisions politiques peuvent être strictement fondées sur la science, la réalité est bien plus complexe. Les décisions politiques sont influencées par un mélange de preuves scientifiques et de jugement humain, qui inclut les instincts, les croyances et les attitudes.

Science et politique Jugement humain COVID-19 Politiques fondées sur les preuves

Les projections scientifiques catastrophiques entraînent d'abord des politiques strictes, mais finissent par éroder le soutien public envers les politiques et les experts eux-mêmes.

Résumé

Face à des crises prolongées comme le changement climatique ou les pandémies, l'influence des projections scientifiques expertes sur les politiques publiques est cruciale mais évolue dans le temps. Cette étude offre une démonstration empirique d'une théorie jusqu'ici fragmentée : la diminution progressive de l'influence des projections scientifiques sur les politiques. En mobilisant une analyse mixte, nous dévoilons l'interaction complexe entre projections expertes, rigueur des politiques et soutien public durant la pandémie de COVID-19.

COVID-19 Influence des experts Projections scientifiques Rigueur des politiques Soutien public
DOI
2024

Analyse de réseaux montrant comment la densité, la centralisation et l'ouverture des réseaux consultatifs ont façonné la circulation du conseil expert.

Résumé

Cette étude présente une approche à double méthode pour analyser systématiquement les réseaux de conseil en santé publique durant la pandémie de COVID-19 dans quatre juridictions : la Belgique, le Québec, la Suède et la Suisse. En utilisant l'analyse de réseaux inspirée de l'analyse égocentrique et une approche par sous-systèmes adaptée à la santé publique, la recherche examine les structures de réseaux et leur ouverture aux nouveaux acteurs et idées.

Systèmes de conseil Analyse de réseaux COVID-19 Conseil scientifique Analyse comparative
DOI

Des indices dérivés par TALN montrent que l'incertitude a conduit à des politiques strictes au Québec, tandis que le discours scientifique encourageait leur assouplissement.

Résumé

Cet article examine l'interaction entre l'incertitude, les émotions et le discours scientifique dans la formation des politiques COVID-19 au Québec. Par l'application de techniques de traitement automatique du langage naturel (TALN), des indices ont été développés pour mesurer les sentiments d'incertitude des décideurs, leurs sentiments négatifs et la prévalence des déclarations scientifiques. L'étude révèle que les sentiments d'incertitude ont conduit à l'adoption de politiques strictes, tandis que les déclarations scientifiques étaient associées à un assouplissement de ces politiques.

Incertitude Émotions Discours scientifique COVID-19 TALN Analyse des politiques
DOI
2022

La Suède a privilégié l'information de l'OMS tandis que le Québec s'est appuyé sur les expériences étrangères, menant à des décisions radicalement différentes sur la fermeture des écoles.

Résumé

La pandémie de COVID-19 a donné à la science et aux experts en santé un rôle prépondérant dans la conception des politiques publiques. Cependant, les décisions politiques découlent rarement automatiquement de l'information scientifique. Dans ce chapitre, nous nous concentrons sur le rôle de la sélection et du traitement de l'information dans la conception des politiques, en étudiant les décisions de fermeture des écoles au début de la pandémie.

Conception des politiques Sélection de l'information COVID-19 Fermetures d'écoles Québec Suède
DOI
2026

Près de cinq décennies de couverture climatique canadienne, 9,2 millions de phrases annotées selon 65 catégories par des classifieurs BERT et CamemBERT.

Résumé

La base de données Canadian Climate Framing (CCF) est un corpus exhaustif annoté par apprentissage automatique, conçu pour permettre l'analyse à grande échelle du discours climatique dans la presse écrite canadienne. Elle comprend 266 271 articles issus de 20 grands quotidiens canadiens couvrant près de cinq décennies (1978-2024), traités en 9 198 158 phrases bilingues. Les modèles atteignent un score F1 macro de 0,866.

Changements climatiques Analyse médiatique Apprentissage automatique BERT CamemBERT Canada Cadrage
2025

Sur quatre décennies, 78 % des liens causaux entre événements climatiques et couverture médiatique impliquent un changement de cadrage. La science a perdu sa position dominante.

Résumé

En 1988, les médias canadiens couvraient le changement climatique comme un problème scientifique. En 2023, la pire saison de feux de forêt de l'histoire a produit un débat politique sur la taxe carbone. En analysant 266 271 articles de 20 quotidiens canadiens (1978-2024), nous montrons que les événements climatiques sont de plus en plus réinterprétés à travers des cadrages politiques et économiques. Sur quatre décennies, 78 % des liens causaux entre événements et couverture médiatique impliquent un changement de cadrage. La configuration politico-économique qui domine le discours climatique canadien forme un paradigme qui n'a pas besoin d'être activement défendu. Pendant ce temps, la science a perdu sa position dominante (de 81 % à 23 % des jours), sa part d'attention médiatique (de 25 % à 11 %), et la voix de ses propres messagers (de 39 % à 21 %).

Changements climatiques Paradigme Cadrage médiatique Canada Économie politique Communication scientifique

Utilisation de 250 000+ articles annotés pour tester si le discours politique sur le climat suit les appels scientifiques dans les médias canadiens.

Résumé

Cette étude utilise un corpus de plus de 250 000 articles de journaux canadiens (1988 à aujourd'hui) annotés à l'aide de techniques d'apprentissage automatique, afin d'examiner si les interventions médiatiques des décideurs politiques en matière de climat font suite aux appels des scientifiques. Elle s'inscrit dans le cadre du projet CCF, dirigé par Alizée Pillod. L'étude vise à comprendre les dynamiques temporelles entre discours scientifique et réponse politique dans le contexte canadien des changements climatiques.

Changements climatiques Cadrage médiatique Discours politique Communication scientifique Canada TALN
2026

18 062 phrases issues de 5 842 articles en cinq langues, annotées selon six dimensions de la souveraineté numérique via un pipeline hybride LLM.

Résumé

Nous présentons AI.SOVEREIGNTY, un jeu de données multilingue à grande échelle de 18 062 phrases tirées de 5 842 articles publiés dans 39 médias en cinq langues (anglais, français, allemand, espagnol, portugais) entre 2012 et 2024. Chaque phrase est annotée selon six dimensions thématiques de la souveraineté numérique (Autorité, Économie, Éthique et Droits, Régulation, Sécurité et Technosolutionnisme) via un pipeline d'annotation hybride en quatre étapes. La validation manuelle sur 556 phrases donne un Micro F1 global de 72,7 %.

Souveraineté numérique Corpus multilingue Gouvernance de l'IA Annotation LLM Sciences sociales computationnelles

Les théories canoniques du processus politique reposent sur cinq prémisses informationnelles que l'IA et les LLM rendent désormais intenables. Propose un cadre théorique, l'Epistemic Policy Process (EPP).

Résumé

Le Multiple Streams Framework, la Punctuated Equilibrium Theory, l'Advocacy Coalition Framework et le Narrative Policy Framework reposent sur cinq prémisses tacites concernant l'information politique, si évidentes au moment de leur formulation qu'elles n'ont jamais été rendues explicites. Or, une transformation radicale de l'écosystème informationnel bouleverse ces prémisses : les machines produisent désormais de l'information politique indiscernable de celle produite par les humains. Cet article propose une nouvelle théorie, l'Epistemic Policy Process (EPP), fondée sur trois dimensions, pour circonscrire les conditions sous lesquelles les théories classiques peuvent encore tenir.

Théories du processus politique Mise à l'agenda IA générative Grands modèles de langage Crise épistémologique
2026

Un observatoire continuellement mis à jour du contenu vidéo politique, avec 24 678 vidéos, 2,95 millions de phrases annotées et 7,6 millions de commentaires.

Résumé

Nous présentons YouPol (YouTube and TikTok Political Observatory and Longitudinal database), une infrastructure de recherche continuellement mise à jour qui capture ce que les créateurs de contenu politique disent réellement sur les plateformes vidéo. En date d'avril 2026, le corpus comprend 24 678 vidéos provenant de 64 chaînes en France et au Québec, avec des transcriptions complètes diarisées par locuteur (605 134 segments, 2,95 millions de phrases annotées) et 7,6 millions de commentaires archivés.

YouTube TikTok Discours politique Extrême droite Infrastructure de recherche TALN
2025

Un Score Idéologique d'Extrême Droite (SIED) basé sur le TALN révèle une montée constante des idées d'extrême droite dans les discours des Premiers ministres français depuis les années 1970.

Résumé

Cette étude analyse la diffusion des idées d'extrême droite dans les déclarations de politique générale des Premiers ministres français (1959-2024) à l'aide de méthodes de traitement automatique du langage naturel. Elle développe et introduit le Score Idéologique d'Extrême Droite (SIED), un indicateur quantitatif mesurant la proportion d'idées d'extrême droite dans le discours politique. Les résultats mettent en lumière trois périodes significatives : un pic pendant la guerre d'Algérie, un déclin après Mai 68, et une montée constante à partir des années 1970, s'intensifiant après 2005.

Idéologie d'extrême droite Politique française TALN Discours politique Analyse longitudinale
DOI

Machine Learning and LLMs for Social Science Research

(Text-as-data, NLP pipelines, research infrastructure, collaborative platforms)

2026

18 062 phrases issues de 5 842 articles en cinq langues, annotées selon six dimensions de la souveraineté numérique via un pipeline hybride LLM.

Résumé

Nous présentons AI.SOVEREIGNTY, un jeu de données multilingue à grande échelle de 18 062 phrases tirées de 5 842 articles publiés dans 39 médias en cinq langues (anglais, français, allemand, espagnol, portugais) entre 2012 et 2024. Chaque phrase est annotée selon six dimensions thématiques de la souveraineté numérique via un pipeline d'annotation hybride en quatre étapes.

Souveraineté numérique Corpus multilingue Gouvernance de l'IA Annotation LLM

24 678 vidéos transcrites, 2,95 millions de phrases annotées et un réseau de calcul collaboratif pour des mises à jour en temps réel.

Résumé

Nous présentons YouPol, une infrastructure de recherche continuellement mise à jour qui capture ce que les créateurs de contenu politique disent réellement sur les plateformes vidéo. Le corpus comprend 24 678 vidéos provenant de 64 chaînes en France et au Québec, avec des transcriptions complètes diarisées par locuteur et 7,6 millions de commentaires archivés. L'infrastructure inclut un pipeline de transcription indépendant et un cadre d'annotation LLM-in-the-loop. YouPol introduit également le Réseau de Calcul Collaboratif YouPol (YCCN), qui permet à tout chercheur collaborateur de contribuer sa capacité de calcul.

YouTube TikTok Infrastructure de recherche Transcription TALN Calcul collaboratif

9,2 millions de phrases bilingues issues de 20 quotidiens, annotées selon 65 catégories par des classifieurs BERT et CamemBERT (F1 macro = 0,866).

Résumé

La base de données Canadian Climate Framing (CCF) est un corpus exhaustif annoté par apprentissage automatique, conçu pour permettre l'analyse à grande échelle du discours climatique dans la presse écrite canadienne. Elle comprend 266 271 articles issus de 20 grands quotidiens canadiens couvrant près de cinq décennies (1978-2024), traités en 9 198 158 phrases bilingues. Les modèles atteignent un score F1 macro de 0,866 par rapport à un étalon-or indépendant avec une fiabilité intercoder confirmée.

Changements climatiques Analyse médiatique Apprentissage automatique BERT CamemBERT Canada Cadrage
2025

Un Score Idéologique d'Extrême Droite appliqué à 65 ans de discours des Premiers ministres français par TALN.

Résumé

Cette étude analyse la diffusion des idées d'extrême droite dans les déclarations de politique générale des Premiers ministres français (1959-2024) à l'aide de méthodes de traitement automatique du langage naturel. Elle développe et introduit le Score Idéologique d'Extrême Droite (SIED), un indicateur quantitatif mesurant la proportion d'idées d'extrême droite dans le discours politique.

Idéologie d'extrême droite Politique française TALN Discours politique Analyse longitudinale
DOI
2026

Un pipeline open source combinant étiquettes générées par LLM et distillation BERT, avec une accélération de 109 à 395 fois par rapport à l'annotation directe par LLM.

Résumé

Les grands modèles de langage annotent désormais régulièrement les textes en sciences sociales computationnelles, mais ils ne résistent pas à des corpus de plusieurs millions de phrases. Les LLM propriétaires sont financièrement prohibitifs, les LLM locaux open source nécessitent des jours ou des semaines de calcul, et tous deux restent opaques et difficiles à reproduire. Nous présentons LLM Tool, un package Python open source qui exécute le flux de travail hybride complet depuis la ligne de commande. Sur un corpus bilingue de 38 451 débats parlementaires et textes médiatiques canadiens codés sur quatre dimensions, les classifieurs entraînés sur les meilleures étiquettes LLM atteignent un Micro F1 moyen de 68,9 %.

LLM BERT Annotation automatique Sciences sociales computationnelles TALN Apprentissage automatique Open source

Plateformes et infrastructures

CCF Project

266 000+ articles climatiques canadiens annotés par 60+ modèles ML, couvrant 1978-2024.

YouPol

Vidéos politiques transcrites depuis YouTube et TikTok, avec diarisation et annotation.