Boucher, Hippolyte (2023) Essais sur les tests de spécification et la sélection de modèles à variables instrumentales. Toulouse School of Economics (Toulouse).

[thumbnail of BoucherHippolyte2023.pdf]
Preview
Text
Download (6MB) | Preview

Abstract

Cette thèse contient quatre chapitres sur les tests de spécifications et la sélection de modèles à variables instrumentales (IVs). Les IVs sont devenues un outil majeur en sciences sociales et en évaluation des politiques publiques car elles permettent d'estimer l'effet causal de variables endogènes sur des variables expliquées sans biais (due, par exemple, à des variables omises) en projetant ces variables endogènes sur les IVs. Pour que cette stratégie fonctionne, les IVs doivent être valides, autrement dit elles doivent être exogènes et significativement corrélées aux variables endogènes. Donc, dans cette thèse, j'élabore des tests et des méthodes pour sélectionner des modèles à IVs dans le but d'estimer le véritable effet causal d'une variable sur une autre. Sa contribution est importante car la littérature statistique et économétrique s'est principalement concentrée sur la sélection de modèle dans un but de prédiction et sur la sélection de modèles causaux dans des cas simples (modèle linéaire, classificateur binaire) sans IVs.Le premier chapitre s'appelle "A Pivotal Nonparametric Test for Identification-Robust Inference in Linear IV Models" et se fonde en grande partie sur les travaux de Antoine et Lavergne (2022). Dans celui-ci, je construis un test de spécification nonparamétrique pour modèle linéaire à IVs qui, après inversion, permet de faire de l'inférence sur l'effet causal homogène d'une ou plusieurs variables endogènes. Ce test a trois caractéristiques notables : Il est robuste aux problèmes d'IVs faibles, il capture toute l'information comprise dans les relations entre les IVs et les variables endogènes, et il est pivotal rendant la procédure très simple à appliquer.Le second chapitre s'appelle "Testing and Relaxing Distributional Assumptions on Random Coefficients in Demand Models" et est coécrit avec Gökçe Gökkoca et Max Lesellier. Dans ce chapitre, nous considérons un modèle de demande pour produits différenciés à IVs et à coefficients aléatoires et proposerons un test et une procédure de sélection de la distribution de ces coefficients aléatoires. Ces nouveaux outils sont une contribution significative car toute analyse contrefactuelle dépend de la validité de la spécification des coefficients aléatoires.Le troisième chapitre s'appelle "Selecting Strong and Exogenous Instruments via Structural Error Criteria". Dans celui-ci je considère le modèle linéaire à IVs et effet homogène et suppose que ces IVs ne sont pas forcément valides (ils peuvent être faibles et / ou endogènes) et je développe trois critères de sélection qui trouvent le sous-ensemble d'IVs valides. Ces méthodes de sélection se fondent sur la validation hors échantillon, en pratique validation croisée, ce chapitre est donc une contribution à la littérature en économétrie et en statistiques sur la sélection de modèle causal.Le quatrième et dernier chapitre est la vignette de la librairie "SpeTestNP" developée sur R en collaboration avec Pascal Lavergne qui m'a fourni son code. Cette librairie permet d'effectuer des tests nonparamétriques de spécifications paramétriques. Cinq tests robustes à l'hétéroscédasticité sont à disposition, Bierens (1982), Zheng (1996), Escanciano (2006), Lavergne et Patilea (2008), et Lavergne et Patilea (2012), avec de nombreuses options, notamment l'option calcul parallèle pour calculer rapidement des p-valeurs basées sur le bootstrap.

,

This thesis contains four chapters on specification testing and model selection in instrumental variable models. Instrumental variables (IVs) have become a major tool in the social sciences and in the evaluation of public policies as they allow researchers to estimate causal effects of endogenous variables on outcomes without bias (for instance due to omitted variables) by projecting said endogenous variables on the IVs. For this strategy to work the IVs must be valid, in other words they must be exogenous and relevant. Thus, in this thesis, I design tests and methods to choose IV models in order to estimate the true causal effect of one variable on another. Its contribution is important because the statistics and econometrics literature has mainly focused on choosing the best model to perform prediction and finding the best causal model in simpler cases (linear model, binary classifier) without IVs.The first chapter is called "A Pivotal Nonparametric Test for Identification-Robust Inference in Linear IV Models" and is largely based on the ideas developped in Antoine and Lavergne (2022). In it, I develop a nonparametric specification for linear IV models which allows, after inversion, to perform inference on the causal homogenous effect of one or more endogenous variables. This test has three notable characteristics: It is robust to weak IVs, it also captures all the information contained in the relation between the IVs and the endogenous variables, and it is pivotal so that the inference procedure is very easy to apply.The second chapter is called "Testing and Relaxing Distributional Assumptions on Random Coefficients in Demand Models" and is co-authored with Gökçe Gökkoca and Max Lesellier. In this chapter, we consider a demand model for differentiated goods with IVs and random coefficient and propose a validity test and a selection method for the distribution of said random coefficients. These new tools are a significant contribution because any counterfactual analysis depends on the validity of the specification of the random coefficients.The third chapter is called "Selecting Strong and Exogenous Instruments via Structural Error Criteria". In it, I consider the linear IV model with homogenous effect and allow some of the IVs to be invalid (they can be weak and / or endogenous). In practice, this model is very common and the choice of IVs is arbitrary which is why I propose a data-driven method to select the good IVs. I coin three criteria which consistently select the subset of IVs which is valid. These methods are based on out-of-sample validation, in practice cross-validation, thus this chapter is a contribution to econometrics and statistics literature on causal model selection.The fourth and last chapter is the vignette of the library "SpeTestNP" developed on R in collaboration with Pascal Lavergne. This R package performs nonparametric tests of parametric specifications. Five heteroskedasticity-robust tests are available: Bierens (1982), Zheng (1996), Escanciano (2006), Lavergne and Patilea (2008), and Lavergne and Patilea (2012). Specific bandwidth and kernel methods can be chosen along with many other options. Allows parallel computing to quickly compute p-values based on the bootstrap.

Item Type: Thesis (UNSPECIFIED)
Other titles: Essays on Specification Testing and Model Selection in Instrumental Variable Models
Language: English
Date: 19 April 2023
Keywords (French): Économétrie, Évaluation des politiques publiques, Variables instrumentales (statistique)
Subjects: B- ECONOMIE ET FINANCE
Divisions: TSE-R (Toulouse)
Ecole doctorale: Toulouse School of Economics (Toulouse)
Site: UT1
Date Deposited: 23 Apr 2024 08:22
Last Modified: 23 Apr 2024 08:22
URI: https://publications.ut-capitole.fr/id/eprint/49325
View Item

Downloads

Downloads per month over past year