Skip links

Valoriser les données fiscales et douanières de l’ouest africain grâce la datascience

Le contexte

Compte tenu des grands défis contemporains, qu’ils soient d’ordre environnementaux, économiques, sociaux, sociétaux ou encore politiques, les États sont appelés à investir massivement afin de s’engager dans les transitions. Un enjeu d’autant plus important pour les pays en voie de développement, à l’instar des économies africaines, qui cherchent à développer leurs ressources financières intérieures.

Si l’on s’intéresse au taux de pression fiscale, ratio mesurant la mobilisation des ressources fiscales, celui-ci était de 40,6% du PIB en Europe en 2021. En Afrique, en 2023, ce taux était de 16,6%, et de 13,8% dans les pays de l’UEMOA. Optimiser les recettes fiscales et mieux lutter contre les fraudes douanières apparait comme un levier opportun, permettant aux États de dégager les ressources nécessaires pour investir dans des secteurs essentiels tels que l’éducation, la santé, les infrastructures ou encore pour préparer l’adaptation au dérèglement climatique.

Le numérique est à même de contribuer à l’essor et l’émergence d’administrations plus efficaces. En ayant recours aux meilleures technologies, notamment en s’appuyant sur le potentiel des données en leur possession, les États peuvent élargir leur assiette fiscale et mieux orienter les contrôles fiscaux et douaniers. Ainsi, au travers des techniques de datascience, le numérique apparaît comme une promesse de renforcement de la souveraineté des États : ces derniers obtiennent davantage de moyens intérieurs et peuvent aisément les réinvestir.

Dans ce contexte, la Direction Générale du Trésor français a lancé en mars 2021 un Plan d’Investissement stratégique pour le développement (PISD) relatif à l’amélioration de la performance des administrations fiscales. Concrètement, ce plan permet l’accompagnement des Etats dans leurs réformes fiscales et douanières pour améliorer leur mobilisation des ressources internes. Le projet DATA dans les Administrations Fiscales et Douanières (DATAFID) s’inscrit pleinement dans la poursuite des objectifs globaux du PSID.

💡 Le Plan d’Investissement Stratégique pour le Développement (PISD) et DATAFID

Le Plan d’Investissement Stratégique pour le Développement (PISD) est adossé à la Stratégie interministérielle de coopération autour de la mobilisation des ressources intérieures dans les pays en développement (MRIP) 2020-2023.

Le projet DATAFID se concentre sur la ligne directrice 2 de cette Stratégie, à savoir « Accompagner la modernisation des administrations fiscales et assurer le recouvrement effectif des recettes ». Plus précisément, il concourt à la poursuite des objectifs 2 et 4 :

  • Objectif 2 : Promouvoir le recours aux nouvelles technologies afin d’accroître le recouvrement et lutter contre la corruption.
  • Objectif 4 : Favoriser l’accès à des données fiables, compréhensibles et comparables.

Le projet entend répondre à trois priorités identifiées dans la Stratégie MRIP 2020-2023 :

  • Priorité 6« Soutenir l’amélioration de la performance et la transparence des administrations fiscales, et lutter contre la corruption » ;
  • Priorité 7« Améliorer l’efficacité de notre soutien aux administrations fiscales via la promotion des nouvelles technologies » ;
  • Priorité 8« Favoriser l’accès à des données fiables, compréhensibles et comparables ». </aside>

Le projet DATAFID avait pour objectif général de contribuer à l’amélioration de la mobilisation des ressources intérieures publiques, favoriser le développement économique et mieux lutter contre la fraude. Les deux objectifs spécifiques du projet étaient :

  • OS 1 – Améliorer la connaissance des autorités sur l’économie numérique ;
  • OS 2 – Renforcer les capacités des administrations fiscales et douanières à travers un meilleur usage de la science des données.

D’un point de vue opérationnel, la mise en œuvre de ce projet est déclinée en deux composantes d’activités :

  • La composante 1 – “économie numérique” : Les autorités disposent d’une meilleure connaissance de l’économie numérique et de son poids dans l’économie nationale grâce à l’amélioration de la collecte et de l’analyse des données
  • La composante 2 – “science des données” : La transparence et la performance des administrations fiscales et douanières sont renforcées grâce à leur capacité à utiliser, valoriser et exploiter la science des données (exploitation des données statistiques publiques et celles issues des administrations)

Le projet DATAFID avait une vocation régionale. Plusieurs pays d’Afrique de l’Ouest et du Centre, faisant partie des géographies d’intervention du PSID, ont bénéficié de l’appui apporté par le projet DATAFID :

  • Le Niger, le Togo, la Côte d’Ivoire, le Cameroun et le Sénégal pour la composante 1 ;
  • Le Niger, le Togo, la Côte d’Ivoire et la Mauritanie pour la composante 2.


La mise en œuvre de DATAFID est assurée par Expertise France, accompagné de cinq partenaires : AFRISTAT, l’Institut National de la Statistique de la Côte d’Ivoire, l’Institut Louis Bachelier, la FERDI (via l’IHEDD) et Numéricité. Le projet DATAFID s’est articulé en deux temps : une phase de démarrage, de l’été 2021 au printemps 2022, ayant permis de confirmer les pays cibles ; et une phase de mise en œuvre, de l’été 2022 au printemps 2024. Nous sommes intervenus sur la composante 2 “Science des données” au cours des deux phases.

Plutôt que de prescrire des modèles occidentaux, notre mission repose sur une véritable coopération avec les pays partenaires, en leur apportant les outils et l’expertise qui leur permettent de développer et de concrétiser leurs propres solutions. Il ne s’agit pas seulement d’adopter de nouvelles technologies, mais d’accompagner un processus d’autonomisation politique et institutionnelle, où chaque État peut renforcer ses capacités tout en affirmant sa souveraineté sur la gestion de ses ressources. En ce sens, DATAFID participe à une vision du développement où le numérique devient un levier non seulement économique, mais aussi politique, pour garantir un avenir durable et prospère à l’Afrique de l’Ouest.

Le challenge

Encourager l’innovation dans les administrations fiscales et douanières par la réalisation de cas d’usage à même de résoudre les irritants métiers.

Le résultat

Une cartographie du cadre juridique concernant l’exploitation des données disponibles (internes et externes) à des fins fiscales et douanières pour les pays de la composante n°2

Un laboratoire de données (Datalab) dédié à l’expérimentation et à la qualification fonctionnelle des données

Des modules de formation et de travaux pratiques, réalisés en présentiel ou à distance

Des bases de données réutilisables (Datahub) afin d’améliorer les performances des systèmes d’information et permettre la mise à disposition des données, et proposant une fonctionnalité d’anonymisation des données

Des cas d’usage data complexes co-réalisés mobilisant la science des données

Notre approche

Etat des lieux de l’encadrement juridique relatif à l’utilisation et à l’exploitation des données

Au cours de la première phase, nous avons fait un état des lieux de l’encadrement juridique relatif à l’utilisation et l’exploitation des données disponibles dans les administrations fiscales des pays pilotes (Niger, Mauritanie, Togo, Sénégal et Côte d’Ivoire). Par la même occasion, nous avons réalisé un benchmark des cadres existants dans les autres pays de la région. Pour cela, nous avons conduit deux missions en présentiel en Mauritanie et au Togo et une étude documentaire des dispositifs juridiques nigérien et ivoirien.

“L’état des lieux des législations en matière de données au Togo, au Niger et en Mauritanie a permis de mettre en évidence l’existence d’un cadre général relatif à l’utilisation et à l’exploitation de données disponibles, notamment dans les administrations fiscales. La présence de ces cadres juridiques favorise ainsi un certain degré d’ouverture des données publiques et leur accès. Ces cadres juridiques forment un ensemble plutôt complet et interopérable car souvent imprégnés de normes supranationales adaptées en droit interne.” (Extrait de notre rapport d’évalutation)

Au cours de cette étude, nous avons identifié des pistes d’amélioration des cadres juridiques, inspirées des bonnes pratiques promues par la communauté internationale. Nous avons également affiné un plan d’action précis en lien avec les administrations fiscales.

Appuyer la création de cas d’usage et proposer des travaux pratiques en lien avec les domaines couverts

Pour cette seconde phase, nous étions chargés de la partie « pratique », visant à développer des cas d’usage de la science des données au sein des administrations fiscales et douanières. En parallèle, la FERDI, et en particulier l’IHEDD, à co-construit une offre de formations avec les bénéficiaires.

Nous avons organisé un séminaire à Lomé, au Togo, en juin 2022 afin de mieux identifier des cas d’usage. Ceux-ci peuvent être classés en quatre grandes thématiques :

  • Datalab : disposer d’un espace sécurisé d’exploitation de données stratégiques, d’outils de veille et de pilotage stratégique
  • Datahub : amplifier les échanges de données entre administrations fiscales et douanières
  • Sélectivité : améliorer le ciblage des contrôles en vue de lutter contre les fraudes
  • Prévisibilité des recettes : affiner la prévisibilité des recettes et/ou anticiper l’impact des réformes sur les recettes et dépenses fiscales (et douanières)

Des visites pays ont permis d’identifier les équipes à même de participer au développement de ces cas d’usage, et de tester leur maturité en matière d’utilisation des données.

Mettre à disposition un datalab dédié à l’expérimentation et à la qualification des données

S’entraîner à la datascience et entraîner des données pour améliorer les recettes fiscales et douanières n’est pas sans nécessiter des ressources et des infrastructures ! Nos experts ont redoublé de créativité pour construire le datalab, une plateforme adaptée aux besoins des pays partenaires, ouverte à de multiples usages (stockage, manipulation, circulation) et permettant la collaboration et l’apprentissage. Cette solution a été préférée à la fourniture de machines (serveurs, machines virtuelles, etc.) pour chaque pays étant donné le caractère exploratoire du projet DATAFID et le fait que les besoins n’étaient pas encore suffisamment identifiés. Une approche simple et pratique qui permet aux équipes de s’exercer à des techniques nouvelles et d’explorer le potentiel de leurs données avant de décider d’un système plus industriel.

Page d’accueil du datalab DATAFID

Afin de concevoir une infrastructure évolutive à même de s’adapter facilement aux évolutions de besoins des agents, nous avons opté pour une plateforme open-source développée depuis 2020 par une équipe d’entrepreneurs d’intérêt général de l’Institut national de la statistique et des études économiques (Insee – France) : Onyxia. Elle comprend un catalogue de services de datascience, la possibilité de stocker des données de manière flexible, l’accès à une communauté ainsi qu’une forme de salle d’entraînement, ou de “bac à sable”, qui permet d’utiliser des librairies de datascience (en R et Python) pour traiter de la donnée sans se préoccuper des enjeux liés à l’infrastructure (serveurs, puissance de calculs, etc.).

Depuis son lancement, le datalab de DATAFID est devenue la pierre angulaire du projet, dans toutes ses dimensions. 

Pour en savoir plus sur la construction du datalab, découvrez notre datastory sur le sujet (disponible sur le datalab)

Accompagner les agents dans leur montée en compétences

Selon leur degré de maturité numérique, les administrations ont bénéficié de séances de Travaux Pratiques (TP) conçues et animées par nos experts. L’objectif : donner toutes les capacités aux administrations accompagnées de pouvoir réaliser des travaux en autonomie et faire en sorte que les équipes maîtrisent, étape par étape, des opérations basiques ou plus poussées en science des données.

Certains TP étaient assurés à distance de manière hebdomadaire, sous la forme de séances d’une à deux heures. Pour la majeure partie, nous avons privilégié l’organisation de sprints en présentiel dans chacun des pays concernés, d’une durée d’une à trois semaines. Numéricité travaillait pour cela en étroite collaboration avec les administrations, afin notamment de s’assurer de la disponibilité des agents visés par les TP et de la pertinence des sujets abordés dans les différents contextes métiers. Ce mode d’action, devenu systématique, est le plus efficace : il permet d’accompagner au plus près les agents avec une phase de formation, la réalisation de tests techniques et la mise en application des compétences directement sur les données via le datalab.

Les TP ont couvert plusieurs domaines en lien avec le contenu des cas d’usage et permettaient aux apprenants d’acquérir les bases techniques nécessaires.

Retour sur quelques uns des sprints pays au Togo et en Mauritanie.

Pour en savoir plus sur les formations et TP délivrés pour guider les statisticiens des douanes et des impôts dans le passage à l’action, découvrez notre Datastory sur le sujet

Constituer des bases de données réutilisables (datahub) afin d’améliorer les performances des systèmes d’information métiers

Les administrations fiscales et douanières bénéficiaires ont exprimé, lors de l’atelier de Lomé, le besoin d’améliorer l’échange de données entre les différentes directions. L’accès à ces données constitue un élément crucial pour tirer pleinement parti de leur potentiel. Dans cette optique, la mise en place d’un Datahub vise à faciliter l’extraction et l’agrégation de données issues de diverses sources. Il permet de disposer de données variées et à jour pour la réalisation de travaux pratiques ou l’analyse de cas métier.

La grande majorité des données sur lesquelles les agents travaillent sont directement issues du Système Douanier Automatisé (SYDONIA, ou ASYCUDA en anglais), créé par la Conférence des Nations unies sur le commerce et le développement (CNUCED) dans les années 1980. La construction de nos cas d’usages a ainsi pu se faire depuis des extractions CSV des données SYDONIA, fournies par les douaniers locaux.

Pour en savoir plus sur SYDONIA et son importance dans le cadre de DATAFID, découvrez notre datastory sur le sujet

SYDONIA étant une solution propriétaire sous licence réservée aux douaniers et interconnectée à un système de gestion de bases de données relationnelles (SGBDR) également propriétaire, il nous était impossible de travailler directement sur le système. Notre première approche a consisté à créer un ISO spécifique sur la base de SYDONIA, pour reproduire un environnement de travail identique à celui déployé dans les douanes accompagnées. Nous avons également mis en place un ETL pour ne pas travailler directement sur les données de production stockées dans la base de données Oracle, ce qui nous a permis d’interfacer cette base avec le datalab. Ces données ont par la suite pu être anonymisées grâce aux outils du datalab avant toute exploitation, pour faciliter le partage et la circulation entre pays tout en préservant la souveraineté.

Pour en savoir plus sur la fonctionnalité d’anonymisation des données, découvrez notre datastory sur le sujet

Améliorer le ciblage des contrôles en vue de lutter contre les fraudes

Pour les activités de ciblage des contrôles en douances, nous avons travaillé sur deux cas d’usage : un outil d’aide à la sélectivité et une méthode pour affiner la notation des contribuables et obtenir une meilleur analyse des risques.

Mobiliser des modèles d’intelligence artificielle pour améliorer l’efficacité du contrôle douanier ? En début d’année 2023, DATAFID l’a rendu possible en menant des travaux de datascience auprès des douanes nigériennes pour concevoir, avec le métier, de nouvelles méthodes d’orientation des contrôles. Il a été proposé d’utiliser un algorithme d’apprentissage automatique (machine learning) supervisé. Le choix s’est porté sur RandomForestClassifier, qui fonctionne comme un arbre de décision. Sa mission : s’entraîner sur des données de contrôles fructueux pour apprendre ce qui les caractérise, puis orienter les marchandises vers les circuits les plus efficients. Nous l’avons testé avec les douanes nigériennes sur des données de 2022, démontrant une efficacité significativement supérieure, avec une amélioration de 30% dans l’efficacité des contrôles comparativement à la méthode habituelle. Les avantages identifiés incluent un gain de temps notable pour les agents douaniers et une surveillance accrue sur les déclarations potentiellement frauduleuses.

Pour en savoir plus sur la sélectivité et l’application de Random Forest au Niger, découvrez notre datastory sur le sujet

Par ailleurs, les douanes d’un pays partenaire du projet, qui mobilisent d’ores et déjà des méthodes statistiques pour optimiser ses actions de contrôle et de lutte contre la fraude, ont souhaité gagner en efficacité pour détecter des anomalies dans les enregistrements en douane. En combinant l’application de la loi de Benford à des méthodes de data science, la vitesse d’analyse a augmenté (2 minutes 30 contre 2 heures), la qualité des données a été améliorée (langages universels et interopérables) et les règles métier ont été traduites en code. Les travaux menés sur les données d’importation ont suscité un fort intérêt des services douaniers du pays partenaire, la détection d’anomalies sur des comportements passés permettant de mieux prévoir des contrôles futurs et d’outiller le pilotage de l’administration douanière en matière d’investigation et de contrôle.

Pour en savoir plus sur la loi de Benford en douanes, découvrez notre datastory sur le sujet

Un autre chantier a été mené avec la Direction des Enquêtes, du Renseignement et de l’Analyse-Risque (DERAR), une des directions centrales de la Direction Générale des Impôts (DGI) de Côte d’Ivoire, afin d’améliorer le Système de Notation des Contribuables de Côte d’Ivoire (SNC-CI), dispositif clé de l’analyse-risque. Celui-ci s’est également appuyé sur l’utilisation de la loi de Benford et a permis d’élaborer un prototype fonctionnel pour un meilleur contrôle des factures.

Pour en savoir plus sur la loi de Benford et la notation des contribuables, découvrez notre datastory sur le sujet 

Faire communauté au-delà des frontières du projet

DATAFID est bien plus qu’un projet : c’est une communauté émergente, un écosystème d’échange, de partage de connaissances et d’innovations qui dépasse les frontières des quatre pays bénéficiaires. Le hackathon, organisé du 14 au 16 décembre 2023 à Abidjan, en a témoigné.

Le défi DATAFID s’adressait aux 25 fonctionnaires des impôts et des douanes, issus de 13 pays, ayant suivi la formation intensive de 6 semaines dispensée par l’IHEDD – FERDI (Fondation pour les Études et Recherches sur le Développement International) en partenariat avec l’Ecole Nationale des Statistiques d’Abidjan (ENSEA) et l’Organisation Mondiale des Douanes, et la participation de nos experts. Le but : appliquer les connaissances en science des données acquises. Afin de répondre au mieux à l’un des quatre défis qui leur étaient posés, les participants ont bénéficié de l’accompagnement de nos équipes dans l’élaboration de leurs projets et d’un coaching en vue du pitch devant le jury final.

À l’issue des 3 jours de défi, l’ensemble des réalisations a été consolidé par les experts et partagés aux participants, afin qu’ils puissent réutiliser les méthodes, techniques et modèles prototypés.

Le défi Datafid a marqué les esprits à plusieurs égards. Son organisation intervient à l’issue de 2 ans d’implémentation du projet DATAFID, qui se clôture au premier trimestre 2024. Il aura ainsi permis d’élargir la communauté DATAFID auprès de nouveaux pays du continent.

Pour en savoir plus sur le défi DATAFID, découvrez notre datastory sur le sujet

Témoignages

Thomas Menant

Le projet Datafid est emblématique car il valide l'approche intégrée de Numéricité, mixant nos expertises stratégie, tech et juridique. C'est aussi une belle marque de confiance de la part d'Expertise France.

Thomas Menant

Directeur des opérations - Numéricité

Prochaines étapes

Le projet DATAFID avait une dimension exploratoire. Il nous a permis d’identifier des cas d’usages pertinents pour les administrations et surtout des modalités d’intervention efficaces afin d’accompagner au mieux les agents. L’ensemble de ces enseignements seront très utiles dans le cadre de la mise en œuvre du projet DATAGOV, financé par l’Union européenne et lancé en septembre 2024.

fr_FRFR