@unpublished{publications50554, month = {October}, title = {Apprentissage automatique pour l'histoire {\'e}conomique}, author = {Philipp Koch}, year = {2024}, url = {https://publications.ut-capitole.fr/id/eprint/50554/}, abstract = {Les m{\'e}thodes d'apprentissage automatique ont contribu{\'e} {\`a} {\'e}largir la bo{\^i}te {\`a} outils de l'{\'e}conomie au cours des derni{\`e}res d{\'e}cennies. Des contributions r{\'e}centes ont commenc{\'e} {\`a} explorer l'intersection des m{\'e}thodes d'apprentissage automatique et de l'histoire {\'e}conomique. Cette th{\`e}se vise {\`a} contribuer {\`a} ce domaine {\'e}mergent {\`a} travers trois chapitres. Le premier chapitre passe en revue la litt{\'e}rature et constate que les applications de l'apprentissage automatique se r{\'e}partissent globalement en trois cat{\'e}gories : (1) l'apprentissage automatique en tant qu'outil de pr{\'e}traitement pour num{\'e}riser les sources d'archives telles que les textes et les cartes historiques, facilitant ainsi les analyses quantitatives {\`a} grande {\'e}chelle ; (2) les mod{\`e}les d'apprentissage automatique non supervis{\'e}s, y compris le regroupement et la r{\'e}duction de la dimensionnalit{\'e}, pour d{\'e}river de nouvelles variables qui r{\'e}v{\`e}lent des mod{\`e}les et des relations historiques latents ; et (3) les mod{\`e}les d'apprentissage automatique supervis{\'e}s pour g{\'e}n{\'e}rer de nouvelles donn{\'e}es ou am{\'e}liorer les ensembles de donn{\'e}es existants.Le deuxi{\`e}me chapitre pr{\'e}sente l'utilisation de l'apprentissage automatique non supervis{\'e}, c'est-{\`a}-dire des mesures de parent{\'e}, pour nous aider {\`a} comprendre pourquoi Paris est devenue la Mecque des arts et Vienne le phare de la musique classique. Plus pr{\'e}cis{\'e}ment, nous utilisons des donn{\'e}es sur plus de 22 000 individus historiques n{\'e}s entre l'an 1000 et l'an 2000 pour estimer la contribution d'immigrants, d'{\'e}migrants et de locaux c{\'e}l{\`e}bres {\`a} la sp{\'e}cialisation des connaissances des r{\'e}gions europ{\'e}ennes. Nous constatons que les migrants jouent un r{\^o}le crucial dans le fa{\cc}onnement des villes europ{\'e}ennes. La probabilit{\'e} qu'une r{\'e}gion d{\'e}veloppe ou conserve une sp{\'e}cialisation dans une activit{\'e} (sur la base de la naissance de physiciens, de peintres, etc. c{\'e}l{\`e}bres) augmente avec la pr{\'e}sence d'immigrants poss{\'e}dant des connaissances dans cette activit{\'e} et d'immigrants poss{\'e}dant des connaissances dans des activit{\'e}s connexes. Dans le troisi{\`e}me chapitre, nous introduisons une m{\'e}thode d'apprentissage automatique pour augmenter la disponibilit{\'e} des estimations historiques du PIB par habitant. En utilisant des donn{\'e}es sur les lieux de naissance, de d{\'e}c{\`e}s et les professions de centaines de milliers de personnages historiques, nous construisons un mod{\`e}le de r{\'e}gression {\`a} filet {\'e}lastique pour effectuer une s{\'e}lection des caract{\'e}ristiques et g{\'e}n{\'e}rer des estimations hors {\'e}chantillon qui expliquent 90 \% de la variance des niveaux de revenus historiques connus. Nous utilisons ce mod{\`e}le pour g{\'e}n{\'e}rer des estimations du PIB par habitant pour des dizaines de pays et des centaines de r{\'e}gions d'Europe et d'Am{\'e}rique du Nord pour les 700 derni{\`e}res ann{\'e}es. Nous validons nos estimations en les comparant {\`a} quatre indicateurs de la production {\'e}conomique et en montrant qu'elles reproduisent le renversement de fortune bien connu entre le sud-ouest et le nord-ouest de l'Europe entre 1300 et 1800. Ces r{\'e}sultats valident l'utilisation de donn{\'e}es biographiques fines comme m{\'e}thode pour produire des estimations historiques du PIB par habitant.Cette th{\`e}se explore le potentiel des m{\'e}thodes d'apprentissage automatique pour am{\'e}liorer notre compr{\'e}hension de l'histoire {\'e}conomique en fournissant une revue de l'{\'e}tat de l'art et en pr{\'e}sentant l'utilisation de mod{\`e}les d'apprentissage automatique supervis{\'e}s et non supervis{\'e}s pour {\'e}tudier des questions qui ont {\'e}t{\'e} laiss{\'e}es relativement inexplor{\'e}es.} }