Valoriser les données fiscales et douanières de l’ouest africain grâce la datascience
- Client : Expertise France
- Février 2021 - Mai 2022 (15 mois)
- Mots clés : Stratégie, e-gov, Co-construction, Open data, et Développement
Le contexte
Compte tenu des grands défis contemporains, qu’ils soient d’ordre environnementaux, économiques, sociaux, sociétaux ou encore politiques, les États sont appelés à investir massivement afin de s’engager dans les transitions. Un enjeu d’autant plus important pour les pays en voie de développement, à l’instar des économies africaines, qui cherchent à développer leurs ressources financières intérieures. Si l’on s’intéresse au taux de pression fiscale, ratio mesurant la mobilisation des ressources fiscales, celui-ci était de 40,6% du PIB en Europe en 2021. En Afrique, en 2023, ce taux était de 16,6%, et de 13,8% dans les pays de l’UEMOA. Optimiser les recettes fiscales et mieux lutter contre les fraudes douanières apparait comme un levier opportun, permettant aux États de dégager les ressources nécessaires pour investir dans des secteurs essentiels tels que l’éducation, la santé, les infrastructures ou encore pour préparer l’adaptation au dérèglement climatique.
Le numérique est à même de contribuer à l’essor et l’émergence d’administrations plus efficaces. En ayant recours aux meilleures technologies, notamment en s’appuyant sur le potentiel des données en leur possession, les États peuvent élargir leur assiette fiscale et mieux orienter les contrôles fiscaux et douaniers. Ainsi, au travers des techniques de datascience, le numérique apparaît comme une promesse de renforcement de la souveraineté des États : ces derniers obtiennent davantage de moyens intérieurs et peuvent aisément les réinvestir.
Dans ce contexte, la Direction Générale du Trésor français a lancé en mars 2021 un Plan d’Investissement stratégique pour le développement (PISD) relatif à l’amélioration de la performance des administrations fiscales. Concrètement, ce plan permet l’accompagnement des Etats dans leurs réformes fiscales et douanières pour améliorer leur mobilisation des ressources internes. Le projet DATA dans les Administrations Fiscales et Douanières (DATAFID) s’inscrit pleinement dans la poursuite des objectifs globaux du PSID.
Le projet DATAFID avait pour objectif général de contribuer à l’amélioration de la mobilisation des ressources intérieures publiques, favoriser le développement économique et mieux lutter contre la fraude. Les deux objectifs spécifiques du projet étaient :
- OS 1 – Améliorer la connaissance des autorités sur l’économie numérique ;
- OS 2 – Renforcer les capacités des administrations fiscales et douanières à travers un meilleur usage de la science des données.
D’un point de vue opérationnel, la mise en œuvre de ce projet est déclinée en deux composantes d’activités :
- La composante 1 – “économie numérique” : Les autorités disposent d’une meilleure connaissance de l’économie numérique et de son poids dans l’économie nationale grâce à l’amélioration de la collecte et de l’analyse des données
- La composante 2 – “science des données” : La transparence et la performance des administrations fiscales et douanières sont renforcées grâce à leur capacité à utiliser, valoriser et exploiter la science des données (exploitation des données statistiques publiques et celles issues des administrations)
Le projet DATAFID avait une vocation régionale. Plusieurs pays d’Afrique de l’Ouest et du Centre, faisant partie des géographies d’intervention du PSID, ont bénéficié de l’appui apporté par le projet DATAFID :
- Le Niger, le Togo, la Côte d’Ivoire, le Cameroun et le Sénégal pour la composante 1 ;
- Le Niger, le Togo, la Côte d’Ivoire et la Mauritanie pour la composante 2.
La mise en œuvre de DATAFID est assurée par Expertise France, accompagné de cinq partenaires : AFRISTAT, l’Institut National de la Statistique de la Côte d’Ivoire, l’Institut Louis Bachelier, la FERDI (via l’IHEDD) et Numéricité. Le projet DATAFID s’est articulé en deux temps : une phase de démarrage, de l’été 2021 au printemps 2022, ayant permis de confirmer les pays cibles ; et une phase de mise en œuvre, de l’été 2022 au printemps 2024. Nous sommes intervenus sur la composante 2 “Science des données” au cours des deux phases.
Plutôt que de prescrire des modèles occidentaux, notre mission repose sur une véritable coopération avec les pays partenaires, en leur apportant les outils et l’expertise qui leur permettent de développer et de concrétiser leurs propres solutions. Il ne s’agit pas seulement d’adopter de nouvelles technologies, mais d’accompagner un processus d’autonomisation politique et institutionnelle, où chaque État peut renforcer ses capacités tout en affirmant sa souveraineté sur la gestion de ses ressources. En ce sens, DATAFID participe à une vision du développement où le numérique devient un levier non seulement économique, mais aussi politique, pour garantir un avenir durable et prospère à l’Afrique de l’Ouest.
Le challenge
Le résultat
Une cartographie du cadre juridique concernant l’exploitation des données disponibles (internes et externes) à des fins fiscales et douanières pour les pays de la composante n°2
Un laboratoire de données (Datalab) dédié à l’expérimentation et à la qualification fonctionnelle des données
Des modules de formation et de travaux pratiques, réalisés en présentiel ou à distance
Des bases de données réutilisables (Datahub) afin d’améliorer les performances des systèmes d’information et permettre la mise à disposition des données, et proposant une fonctionnalité d’anonymisation des données
Des cas d’usage data complexes co-réalisés mobilisant la science des données
Notre approche
Etat des lieux de l’encadrement juridique relatif à l’utilisation et à l’exploitation des données
Au cours de la première phase, nous avons fait un état des lieux de l’encadrement juridique relatif à l’utilisation et l’exploitation des données disponibles dans les administrations fiscales des pays pilotes (Niger, Mauritanie, Togo, Sénégal et Côte d’Ivoire). Par la même occasion, nous avons réalisé un benchmark des cadres existants dans les autres pays de la région. Pour cela, nous avons conduit deux missions en présentiel en Mauritanie et au Togo et une étude documentaire des dispositifs juridiques nigérien et ivoirien. “L’état des lieux des législations en matière de données au Togo, au Niger et en Mauritanie a permis de mettre en évidence l’existence d’un cadre général relatif à l’utilisation et à l’exploitation de données disponibles, notamment dans les administrations fiscales. La présence de ces cadres juridiques favorise ainsi un certain degré d’ouverture des données publiques et leur accès. Ces cadres juridiques forment un ensemble plutôt complet et interopérable car souvent imprégnés de normes supranationales adaptées en droit interne.” (Extrait de notre rapport d’évalutation) Au cours de cette étude, nous avons identifié des pistes d’amélioration des cadres juridiques, inspirées des bonnes pratiques promues par la communauté internationale. Nous avons également affiné un plan d’action précis en lien avec les administrations fiscales.Appuyer la création de cas d’usage et proposer des travaux pratiques en lien avec les domaines couverts
Pour cette seconde phase, nous étions chargés de la partie « pratique », visant à développer des cas d’usage de la science des données au sein des administrations fiscales et douanières. En parallèle, la FERDI, et en particulier l’IHEDD, à co-construit une offre de formations avec les bénéficiaires. Nous avons organisé un séminaire à Lomé, au Togo, en juin 2022 afin de mieux identifier des cas d’usage. Ceux-ci peuvent être classés en quatre grandes thématiques :- Datalab : disposer d’un espace sécurisé d’exploitation de données stratégiques, d’outils de veille et de pilotage stratégique
- Datahub : amplifier les échanges de données entre administrations fiscales et douanières
- Sélectivité : améliorer le ciblage des contrôles en vue de lutter contre les fraudes
- Prévisibilité des recettes : affiner la prévisibilité des recettes et/ou anticiper l’impact des réformes sur les recettes et dépenses fiscales (et douanières)


Constituer des bases de données réutilisables (datahub) afin d’améliorer les performances des systèmes d’information métiers
Les administrations fiscales et douanières bénéficiaires ont exprimé, lors de l’atelier de Lomé, le besoin d’améliorer l’échange de données entre les différentes directions. L’accès à ces données constitue un élément crucial pour tirer pleinement parti de leur potentiel. Dans cette optique, la mise en place d’un Datahub vise à faciliter l’extraction et l’agrégation de données issues de diverses sources. Il permet de disposer de données variées et à jour pour la réalisation de travaux pratiques ou l’analyse de cas métier.
La grande majorité des données sur lesquelles les agents travaillent sont directement issues du Système Douanier Automatisé (SYDONIA, ou ASYCUDA en anglais), créé par la Conférence des Nations unies sur le commerce et le développement (CNUCED) dans les années 1980. La construction de nos cas d’usages a ainsi pu se faire depuis des extractions CSV des données SYDONIA, fournies par les douaniers locaux.
Pour en savoir plus sur SYDONIA et son importance dans le cadre de DATAFID, découvrez notre datastory sur le sujet
SYDONIA étant une solution propriétaire sous licence réservée aux douaniers et interconnectée à un système de gestion de bases de données relationnelles (SGBDR) également propriétaire, il nous était impossible de travailler directement sur le système. Notre première approche a consisté à créer un ISO spécifique sur la base de SYDONIA, pour reproduire un environnement de travail identique à celui déployé dans les douanes accompagnées. Nous avons également mis en place un ETL pour ne pas travailler directement sur les données de production stockées dans la base de données Oracle, ce qui nous a permis d’interfacer cette base avec le datalab. Ces données ont par la suite pu être anonymisées grâce aux outils du datalab avant toute exploitation, pour faciliter le partage et la circulation entre pays tout en préservant la souveraineté.
Pour en savoir plus sur la fonctionnalité d’anonymisation des données, découvrez notre datastory sur le sujet
Améliorer le ciblage des contrôles en vue de lutter contre les fraudes
Pour les activités de ciblage des contrôles en douances, nous avons travaillé sur deux cas d’usage : un outil d’aide à la sélectivité et une méthode pour affiner la notation des contribuables et obtenir une meilleur analyse des risques.
Mobiliser des modèles d’intelligence artificielle pour améliorer l’efficacité du contrôle douanier ? En début d’année 2023, DATAFID l’a rendu possible en menant des travaux de datascience auprès des douanes nigériennes pour concevoir, avec le métier, de nouvelles méthodes d’orientation des contrôles. Il a été proposé d’utiliser un algorithme d’apprentissage automatique (machine learning) supervisé. Le choix s’est porté sur RandomForestClassifier, qui fonctionne comme un arbre de décision. Sa mission : s’entraîner sur des données de contrôles fructueux pour apprendre ce qui les caractérise, puis orienter les marchandises vers les circuits les plus efficients. Nous l’avons testé avec les douanes nigériennes sur des données de 2022, démontrant une efficacité significativement supérieure, avec une amélioration de 30% dans l’efficacité des contrôles comparativement à la méthode habituelle. Les avantages identifiés incluent un gain de temps notable pour les agents douaniers et une surveillance accrue sur les déclarations potentiellement frauduleuses.
Pour en savoir plus sur la sélectivité et l’application de Random Forest au Niger, découvrez notre datastory sur le sujet
Par ailleurs, les douanes d’un pays partenaire du projet, qui mobilisent d’ores et déjà des méthodes statistiques pour optimiser ses actions de contrôle et de lutte contre la fraude, ont souhaité gagner en efficacité pour détecter des anomalies dans les enregistrements en douane. En combinant l’application de la loi de Benford à des méthodes de data science, la vitesse d’analyse a augmenté (2 minutes 30 contre 2 heures), la qualité des données a été améliorée (langages universels et interopérables) et les règles métier ont été traduites en code. Les travaux menés sur les données d’importation ont suscité un fort intérêt des services douaniers du pays partenaire, la détection d’anomalies sur des comportements passés permettant de mieux prévoir des contrôles futurs et d’outiller le pilotage de l’administration douanière en matière d’investigation et de contrôle.
Pour en savoir plus sur la loi de Benford en douanes, découvrez notre datastory sur le sujet
Un autre chantier a été mené avec la Direction des Enquêtes, du Renseignement et de l’Analyse-Risque (DERAR), une des directions centrales de la Direction Générale des Impôts (DGI) de Côte d’Ivoire, afin d’améliorer le Système de Notation des Contribuables de Côte d’Ivoire (SNC-CI), dispositif clé de l’analyse-risque. Celui-ci s’est également appuyé sur l’utilisation de la loi de Benford et a permis d’élaborer un prototype fonctionnel pour un meilleur contrôle des factures.
Pour en savoir plus sur la loi de Benford et la notation des contribuables, découvrez notre datastory sur le sujet
Faire communauté au-delà des frontières du projet
DATAFID est bien plus qu’un projet : c’est une communauté émergente, un écosystème d’échange, de partage de connaissances et d’innovations qui dépasse les frontières des quatre pays bénéficiaires. Le hackathon, organisé du 14 au 16 décembre 2023 à Abidjan, en a témoigné.
Le défi DATAFID s’adressait aux 25 fonctionnaires des impôts et des douanes, issus de 13 pays, ayant suivi la formation intensive de 6 semaines dispensée par l’IHEDD – FERDI (Fondation pour les Études et Recherches sur le Développement International) en partenariat avec l’Ecole Nationale des Statistiques d’Abidjan (ENSEA) et l’Organisation Mondiale des Douanes, et la participation de nos experts. Le but : appliquer les connaissances en science des données acquises. Afin de répondre au mieux à l’un des quatre défis qui leur étaient posés, les participants ont bénéficié de l’accompagnement de nos équipes dans l’élaboration de leurs projets et d’un coaching en vue du pitch devant le jury final.
À l’issue des 3 jours de défi, l’ensemble des réalisations a été consolidé par les experts et partagés aux participants, afin qu’ils puissent réutiliser les méthodes, techniques et modèles prototypés.
Le défi Datafid a marqué les esprits à plusieurs égards. Son organisation intervient à l’issue de 2 ans d’implémentation du projet DATAFID, qui se clôture au premier trimestre 2024. Il aura ainsi permis d’élargir la communauté DATAFID auprès de nouveaux pays du continent.
Pour en savoir plus sur le défi DATAFID, découvrez notre datastory sur le sujet




Témoignages

Au-délà de la qualité du produit final, la collaboration avec Numéricité a particulièrement été apprécié pour la capacité de l'équipe projet à comprendre les enjeux et à mener efficacement les phases de co-construction.
Isabelle Andrieu
Déléguée générale de Crée ton avenir
Prochaines étapes
Le projet DATAFID avait une dimension exploratoire. Il nous a permis d’identifier des cas d’usages pertinents pour les administrations et surtout des modalités d’intervention efficaces afin d’accompagner au mieux les agents. L’ensemble de ces enseignements seront très utiles dans le cadre de la mise en œuvre du projet DATAGOV, financé par l’Union européenne et lancé en septembre 2024.
Ressources
- Fiche projet DATAFID (Expertise France)Web
- DATAFID sur le site de la FERDIWeb
- Présentation du projetWeb
- Plan d’investissement stratégique pour le développement 2020-2023Web
- Convention AFRISTAT – Expertise France pour le projet DATAFIDWeb
- Deux jours d’innovation dans les domaines fiscaux et douaniers !Web
- DATAFID, un laboratoire de la transformation numérique et data des administrationsWeb
- [NuméricitéFM S03E10] – La transformation numérique, une priorité pour les pays en développement ?Podcast
- [IN]SIGHTS – Le projet DATAFID et l’équipe NuméricitéVidéo