Notes
-
[1]
Les programmes d’enquêtes démographiques et de santé (Demographic and Health Surveys) financés par l’Agence des États-Unis pour le développement international (USAID) et les programmes dédiés à la mesure des niveaux de vie (Living Standards Measurement Study) mis en œuvre par la Banque mondiale ont démarré au début des années quatre-vingt.
-
[2]
Cet article aborde la qualité des données produites par les agences statistiques des pays et/ou collectées dans le cadre de programmes de recherche dont l’objectif est de comprendre le processus de développement et/ou suggérer des orientations pertinentes de la politique économique. Il ne traite pas de la qualité des données collectées par des organismes privés destinées à informer les entreprises sur l’environnement des affaires et à évaluer les opportunités d’investissement dans tel ou tel pays. Couvrir ce champ nécessiterait des investigations spécifiques et sortirait du cadre imparti à notre article.
-
[3]
Un système d’information géographique intègre, stocke et affiche des informations de type spatial. Les applications et logiciels associés aux SIG sont des outils permettant d’analyser l’information contenue dans le SIG et de la représenter sous forme de cartes.
-
[4]
Nous citerons, entre autres, le projet « what3words » pour les risques d’inondation (https://what3words.com/partner/ambiental).
-
[5]
Voir sur ce point les projets d’Open Street Map (https://www.openstreetmap.org) ou encore Map & Jerry (https://urbacot.hypotheses.org/category/travaux-de-recherche/mapjerry). Nous citerons également le réseau international des habitants des bidonvilles (SDI) (http://knowyourcity.info/who-is-sdi/about-us/).
-
[6]
Par exemple, si un répondant dit ne pas consommer un aliment, la question sur la quantité consommée de cet aliment ne sera pas affichée. A l’inverse, le module éducation ne sera activé que si l’enfant du répondant fréquente actuellement l’école. Si une question de ce module est omise (par exemple les matières enseignées) un message d’erreur s’affiche.
-
[7]
Un exemple de réponse potentiellement incohérente est lorsqu’une personne interrogée dit avoir terminé l’école secondaire mais ne sait pas lire. Une réponse est impossible lorsqu’un membre du ménage est marié à un autre membre du ménage qui est célibataire, ou lorsque les enfants ont moins de douze ans d’écart avec leurs parents.
-
[8]
Par exemple, dans un module sur les usages du temps, le nombre total d’heures par jour est bloqué à 24.
-
[9]
Par exemple, une erreur est générée si le sexe d’un membre du ménage est déclaré différent de celui de l’enquête précédente ou si l’âge déclaré ne correspond pas à l’âge plus le nombre d’années écoulées depuis l’enquête précédente.
-
[10]
Les horodatages enregistrent l’heure précise de début et de fin d’un entretien, ou d’une partie de l’entretien correspondant à certains modules ou questions. Dans la plupart des logiciels, l’horodatage ne peut pas être modifié par les enquêteurs, ce qui empêche toute manipulation. Les horodatages sont utiles pour vérifier le comportement des enquêteurs. Par exemple, la comparaison de la durée des entrevues d’un enquêteur par rapport à la durée moyenne globale décèle des entrevues précipitées, qui n’ont pas été menées jusqu’à leur terme ou qui contiennent des données fabriquées. Inversement, de longues entrevues peuvent signifier que les répondants comprennent difficilement les questions.
-
[11]
Le mode d’interrogation joue dans ce cas un rôle essentiel. Les études de Arthi et al. (2018) et Gaddis et al. (2019) montrent que le nombre de parcelles est sous-estimé de 47% lorsque les enquêtes sont menées en fin de cycle agricole comparativement aux visites ou aux appels hebdomadaires.
-
[12]
Voir le numéro spécial de la revue Food Policy, Special Issue: “Food counts. Measuring food consumption and expenditures in household consumption and expenditure surveys (HCES)”, Volume 72, 1-156 (October 2017).
-
[13]
Rappelons que ce problème touche également les intrants et les productions agricoles.
-
[14]
Par exemple, l’amoxicilline, qui est l’antibiotique le plus couramment utilisé pour traiter les infections bactériennes, peut être prescrit sous forme de comprimés dispersibles, gélules, suspensions.
-
[15]
Notamment en anonymisant les données personnelles (particulièrement les noms, adresses et coordonnées GPS des répondants), en utilisant des serveurs sécurisés, voire des serveurs permettant le chiffrement des fichiers.
1 – Introduction
1La qualité des données est une question qui préoccupe les micro-économistes du développement depuis longtemps. En effet, comprendre les multiples dimensions du processus de développement repose sur un besoin fondamental : des données de qualité. Les enquêtes statistiques auprès des ménages ont proliféré depuis les années quatre-vingt [1] et sont directement accessibles sur les sites des agences statistiques des pays, des organisations internationales et des plateformes de données en accès libre. Bien que des progrès considérables aient été accomplis, la qualité de ces informations est encore souvent contestable, en particulier celle qui concerne les économies africaines (Bédécarrats et al., 2016).
2Or, détenir des données microéconomiques fiables est indispensable pour déchiffrer les tendances de certains indicateurs stratégiques (pauvreté, emploi, objectifs de développement durable,…), fonder les tests d’hypothèses des modèles théoriques, ou encore suggérer des orientations pertinentes des politiques économiques.
3La qualité des données est un bien public [2]. Même s’il est difficile de mesurer les coûts directs et indirects de l’utilisation de statistiques de médiocre qualité, de nombreux travaux en soulèvent les implications. Arthi et al. (2018) montrent que la surestimation systématique du temps de travail agricole dans les enquêtes fondées sur la mémoire des individus conduit à une erreur d’appréciation de la productivité agricole, et que cette erreur est corrélée aux caractéristiques des individus. D’autres travaux suggèrent que la pauvreté en Afrique serait bien moindre que ce que les estimations actuelles ne l’indiquent (Beegle et al., 2016 ; Jerven, 2013 ; Jerven et Johnston, 2015). Sandefur et Glassman (2015) signalent un écart énorme entre les chiffres produits par les statistiques officielles de nombreux pays africains, qui exagèrent systématiquement les progrès économiques et sociaux accomplis, et les estimations obtenues par des enquêtes indépendantes.
4L’importance de la qualité des données dans différents champs disciplinaires a motivé la publication d’un grand nombre d’ouvrages et de guides méthodologiques traitant des techniques permettant de concevoir un plan de sondage et un questionnaire, ainsi que de résoudre les difficultés liées la collecte des données (Ardilly, 2006 ; Grosh et Glewwe, 2000 ; Kish, 1995 ; Lohr, 2009 ; United Nations Statistical Division, 2008). Toutefois, produire des informations fiables soulève des questions spécifiques au contexte des pays du Sud. La littérature a récemment avancé sur ce thème, notamment grâce aux nouvelles technologies et aux apports de l’économie expérimentale.
5L’objectif de cet article est de présenter les progrès méthodologiques récents dans la conception et la mise en œuvre des enquêtes auprès des ménages, destinés à résoudre de nombreux défis méthodologiques propres aux enquêtes dans les pays du Sud. Ce tour d’horizon n’a pas la prétention de dresser un inventaire complet des travaux réalisés mais d’illustrer, à partir d’exemples concrets et emblématiques, les implications des innovations dans les protocoles d’enquête sur la qualité de l’information obtenue.
6Les avancées méthodologiques que nous discutons se rapportent aux quatre grandes phases d’une enquête que sont le choix du plan de sondage, la sélection des répondants, la rédaction et l’administration du questionnaire. La première avancée tient à l’apport des technologies satellitaires et informatiques à la sélection de l’échantillon lorsque les bases de sondage sont inexistantes ou inutilisables. La seconde repose sur l’utilisation des supports informatiques pour la sélection des répondants et l’administration des questionnaires. La troisième réside dans l’exploration de différentes variantes d’interrogation (période de rappel, modes d’administration du questionnaire, stratégie d’interrogation, etc.) destinées à comprendre et réduire les erreurs de mesure. La quatrième correspond à l’introduction de nouvelles thématiques liées aux changements d’habitudes de consommation des ménages.
7La structure de l’article est la suivante : la section 2 présente des outils innovants tels que les systèmes d’information géographique (SIG), permettant de répondre à l’absence fréquente de bases de sondage et aux problèmes que pose l’échantillonnage de populations spécifiques, qu’elles vivent dans des pays en conflit ou qu’elles soient réfugiées. Sont examinées ensuite les méthodes permettant de sélectionner efficacement un (ou des) répondant(s) au sein des ménages, lorsque le choix de l’interlocuteur n’est pas dicté par les besoins de l’enquête. La section 3 souligne les nombreux avantages que présente le questionnaire électronique ainsi que le potentiel des enquêtes téléphoniques. La section 4 est consacrée aux nouvelles méthodes permettant de réduire les erreurs de mesure.
2 – L’erreur d’échantillonnage : les bons plans de sondage
8Un des problèmes majeurs auquel se heurte le sondeur dans les pays du Sud est l’absence fréquente de bases de sondage ou l’inexactitude des informations qu’elles contiennent. Certaines populations sont par exemple systématiquement absentes des statistiques officielles (nomades, migrants urbains, réfugiés, etc.). En outre, les données des recensements officiels, lorsqu’elles existent, deviennent rapidement inutiles en raison de la périodicité de la collecte (10 ans ou plus). Pour pallier ces insuffisances, l’on peut songer à constituer des listes au travers de collectes en porte-à-porte, ou simplifiées à l’aide d’un représentant de la communauté, mais cette activité est particulièrement coûteuse et chronophage. Ces difficultés limitent la réalisation de sondages probabilistes exigeant de disposer d’une liste exhaustive des ménages de la population que l’on souhaite sonder.
2.1 – Les systèmes d’information géographique (SIG) [3] au service de l’échantillonnage
9L’utilisation des SIG est une voie prometteuse permettant de constituer des bases de sondages dans les contextes où les données de recensement sont insuffisantes ou inexistantes ou lorsque constituer une liste s’avère coûteux (Gibson et McKenzie, 2007). Exploiter l’information contenue dans des photos aériennes ou des images satellitaires pour établir rapidement une base de sondage fiable et actualisée présente un double intérêt : le premier est de maintenir une sélection probabiliste de l’échantillon qui produit des estimations plus précises des variables d’intérêt que les autres formes d’échantillonnage, et à un coût raisonnable. Le second avantage réside dans une meilleure connaissance de populations mal référencées dans les bases de sondage habituelles.
10Pour différentes raisons, deux types de population sont rarement recensés correctement dans les bases de sondage des pays du Sud : les populations urbaines (notamment celles résidant au sein de bidonvilles) et les populations d’éleveurs. En effet, la croissance rapide des villes des pays du Sud et ses corollaires que sont l’habitat spontané, la croissance périphérique, en font un milieu en constante évolution, complexe à observer et pour lequel une cartographie précise et actualisée n’est jamais disponible. De même, les populations d’éleveurs sont habituellement très mobiles et parcourent parfois de très grandes distances à la recherche de nourriture pour le bétail et de points d’eau. La méconnaissance de l’étendue de leur zone d’activité, l’absence de résidence fixe posent de sérieux défis méthodologiques d’échantillonnage.
11Deux études récentes fournissent des exemples d’utilisation des images satellitaires au service de l’échantillonnage de populations mal connues. La première est celle de Lowther et al. (2009), qui étudient la prévalence de l’immunité au virus de la rougeole chez les enfants des townships urbains de Lusaka, en Zambie. Les townships se trouvent au sein d’un milieu urbain disparate, composé d’une mosaïque d’habitations légales et d’habitations informelles. L’utilisation d’une image satellitaire de 25 km2, obtenue pendant la saison sèche alors que la couverture nuageuse est faible, a permis d’identifier des structures d’une taille suffisante et d’une forme régulière représentant des logements qui ont servi à l’élaboration de la base de sondage. La seconde recherche, menée par Himelein et al. (2014), a étudié les populations pastorales d’Ethiopie, systématiquement sous-dénombrées dans les enquêtes habituelles fondées sur la résidence permanente des ménages. La zone d’étude (la région Afar) a d’abord été stratifiée à l’aide de données SIG décrivant la couverture végétale, l’usage du sol, les sources d’eau, le pâturage disponible lors de la saison sèche et les densités de population. Dans chaque strate, un certain nombre de points géographiques ont été définis par leur latitude et leur longitude. Un cercle d’un rayon donné a ensuite été créé autour de chaque point. Les grappes de points ont enfin été sélectionnées de manière aléatoire (random geographic cluster sampling). Tous les répondants se trouvant dans le cercle (ou la grappe) sélectionné ont été interrogés, y compris ceux qui n’ont pas de résidence fixe ou ceux qui étaient absents de leur résidence habituelle.
12De nouveaux outils cartographiques récemment élaborés, fondés sur les SIG, constituent également un support précieux pour bâtir des plans de sondage adaptés à l’évaluation des comportements face au risque ou encore à l’estimation des conséquences économiques de l’exposition à un risque. En effet, certains risques naturels peuvent varier considérablement dans l’espace, parfois à quelques mètres ou centaines de mètres près, comme par exemple la hauteur d’une crue, l’épaisseur de cendres volcaniques ou l’itinéraire d’une coulée de boue. Les informations cartographiques sont ici extrêmement précieuses pour identifier les gradients (ou strates) dans les dommages associés aux désastres naturels. Il est alors possible de construire un plan de sondage stratifié qui, tenant compte de l’hétérogénéité dans l’exposition au risque, réduit l’erreur d’échantillonnage. Sans prétendre à l’exhaustivité, nous citerons ici quelques projets récents qui visent à identifier géographiquement les zones exposées à des risques de désastre naturel tels que les inondations, les éruptions volcaniques, les ouragans et les tremblements de terre, etc. [4].
13D’autres projets sont fondés sur la co-construction de données cartographiques, alliant les compétences de cartographes professionnels et la connaissance locale du terrain qu’ont les habitants, les organisations communautaires, les ONG, etc., et constituent une avancée précieuse dans la connaissance de certains territoires mal couverts par les statistiques officielles [5], les bidonvilles notamment.
14L’utilisation des SIG offre également des perspectives intéressantes pour l’amélioration des statistiques agricoles (Gallego et al., 2015 ; GSARS, 2015). En effet, produire des statistiques agricoles de qualité se heurte à de nombreux obstacles liés à l’absence de cadastre des terres, et à la connaissance souvent incertaine qu’ont les agriculteurs du niveau de leur production, du rendement de leurs terres et parfois même des surfaces emblavées. Les sources d’information classiques que sont les recensements agricoles sont d’une faible utilité pour comprendre les situations courantes, évaluer l’impact des politiques agricoles et lancer éventuellement des alertes précoces lorsque la production chute brutalement. Dans ces conditions, un système basé sur des techniques de sondage souples et qui fournit des informations dans les meilleurs délais constitue un facteur important d’amélioration de la statistique agricole, comme le démontre l’étude de Carletto et al. (2015). Les auteurs comparent l’estimation des superficies auto-déclarées par les agriculteurs échantillonnés à partir d’une base de sondage de type liste à l’estimation produite par d’autres alternatives de mesure fondées sur un échantillonnage géographique. L’ampleur significative de l’erreur de mesure associée à l’auto-déclaration conduit les auteurs à suggérer une utilisation plus large des SIG pour mesurer les surfaces agricoles.
15Toutefois, le recours aux plans de sondage aréolaires pour les statistiques agricoles impose d’examiner au préalable la question des unités d’échantillonnage pertinentes, qui sont au nombre de trois : les ménages, les exploitations, les parcelles. Il n’existe pas toujours de correspondance entre un ménage et une exploitation agricole, et il est impossible d’identifier les exploitations agricoles à partir d’images de la couverture des sols car les exploitations cultivent souvent des terres à différents emplacements. Ces particularités impliquent que les informations satellitaires ou géographiques soient combinées avec le matériel des recensements (de population ou agricoles) afin de relier ménages, exploitations et parcelles. Dans ce cas, le recours à des bases multiples est incontournable.
16Enfin, bien qu’encore embryonnaires, certaines recherches s’orientent vers l’utilisation de drones pour constituer des bases de sondage. Ces travaux sont encore au stade expérimental et s’attachent à vérifier la validité des données obtenues à l’aide de ces appareils ainsi qu’à résoudre les questions juridiques et éthiques liées au survol des zones concernées (Eyerman, 2015 ; Gevaert et al., 2018).
2.2 – Échantillonnages de populations spécifiques : régions en conflit, populations réfugiées, populations cachées
17Constituer une base de sondage est une opération particulièrement complexe dans les zones de conflit ou lorsqu’il s’agit d’observer des populations fragiles, à l’instar des réfugiés, ou encore des populations dites cachées en raison de leur appartenance à un groupe socialement stigmatisé (personnes infectées par le VIH, travailleurs du sexe, etc.). Toute tentative de sondage de ces populations se heurte à l’absence d’information les concernant. En outre, ces populations sont rarement coopératives et ont tendance à donner des réponses peu fiables soit par méfiance, soit par crainte des répercussions négatives que pourraient avoir leurs réponses, notamment des actes de répression, ou tout simplement pour protéger leur vie privée. La littérature propose différentes méthodes d’échantillonnage mais tend à privilégier les plans de sondage non probabilistes car ils permettent d’entraîner l’adhésion à l’effort de recherche, de réduire les coûts d’enquête et de pallier les questions de sécurité qui peuvent éventuellement se poser.
18Plusieurs méthodes, dites d’échantillonnage de convenance, permettent d’estimer les caractéristiques des populations difficiles à joindre. Bien que ces méthodes soient largement utilisées, leur robustesse a longtemps été inconnue. Cependant, plusieurs études récentes éclairent la qualité de l’inférence statistique obtenue à partir de tels échantillons (Himelein et al., 2017).
19L’échantillonnage par itinéraire (ou marche) aléatoire est probablement la méthode la plus répandue en raison de sa simplicité. Elle consiste à choisir une adresse au hasard dans une zone d’étude donnée, qui sert de point de départ. L’enquêteur doit ensuite observer les règles précisant l’itinéraire qu’il (ou elle) doit suivre et sélectionne de manière systématique les unités qu’il/elle rencontre en utilisant un intervalle prédéterminé. L’appellation de ce type de sondage, qui laisse supposer qu’il s’agit d’une méthode aléatoire, est en réalité abusive. En effet, l’hypothèse de sélection des unités avec une probabilité égale est rarement respectée, même lorsque l’enquêteur suit scrupuleusement le protocole de sélection (Bauer, 2014). Les estimateurs produits sont par conséquent biaisés et les caractéristiques socio-démographiques de base sont mal estimées. De plus, dans des contextes de conflits ou de populations difficiles à identifier, le biais des estimateurs est accru par la très forte probabilité que les enquêteurs sélectionnent les individus disposés à participer à l’enquête.
20Le sondage en boule de neige (snowball sampling) est une forme très populaire de méthode d’échantillonnage dit en chaîne ou séquentiel. Dans le sondage boule de neige, un premier échantillon aléatoire est sélectionné dans une population donnée. Chaque individu de cet échantillon est invité à désigner d’autres individus de la population cible afin que l’enquêteur puisse les contacter puis les interroger s’ils acceptent de participer à l’étude. Les nouveaux répondants sont invités à leur tour à désigner d’autres individus. Cette opération est répétée autant de fois que nécessaire, jusqu’à ce que la taille de l’échantillon désirée soit atteinte. La contrepartie de cette souplesse de choix des individus interrogés est une sur-sélection des plus coopératifs qui acceptent de participer à l’enquête et/ou de ceux qui font partie du réseau des répondants ayant un réseau social étendu. Il en résulte un échantillon d’individus ayant de grandes chances de partager les mêmes caractéristiques, puisque les personnes les moins coopératives et dont les relations sociales sont plus limitées ont moins de chance d’être sélectionnées. Les estimateurs issus de ce type d’échantillon sont donc biaisés et ne permettent pas d’inférer correctement les caractéristiques de la population cible.
21L’échantillonnage déterminé selon les répondants (respondent driven sampling) suit une logique similaire à celle du sondage en boule de neige en ce sens que les réseaux servent à sélectionner les répondants. Toutefois, à la différence du sondage en boule de neige, les participants initiaux, appelés « germes », sont choisis et non tirés au hasard par les organisations/associations travaillant avec la population cible. Ces germes recrutent eux-mêmes directement un nombre convenu à l’avance d’autres participants qui vont, à leur tour, recruter un nombre limité de pairs. Le processus se répète jusqu’à ce que de nombreuses chaînes de recrutement suffisamment longues soient créées de telle sorte que la composition de l’échantillon final soit indépendante des sujets initialement choisis (Heckathorn, 1997). Cette procédure, qui recueille la taille du réseau de chaque participant, permet de calculer la probabilité de sélection des répondants au sein du réseau et fournit ainsi les moyens de contrôler le biais induit par les différences de taille des réseaux personnels. En outre, en s’appuyant d’une part sur la confiance entre les pairs et d’autre part sur un système de rémunération lié à la participation et au recrutement, l’échantillonnage déterminé selon les répondants réduit considérablement le biais de non réponse inhérent à la plupart des échantillons générés par des méthodes de référence en chaîne (Johnston et Sabin, 2010 ; McCreesh et al., 2012).
2.3 – Sélectionner son interlocuteur : quel membre du ménage interroger ?
22La plupart des enquêtes par sondage débutent par la sélection aléatoire d’un échantillon de ménages (ou de logements). Or, un échantillon probabiliste de ménages ne se transforme pas automatiquement en un échantillon probabiliste de personnes. La question de la sélection des répondants au sein des ménages est donc cruciale et soulève de nombreux enjeux. Ce point a été amplement discuté dans la littérature, qui ne propose pas moins de quinze méthodes différentes de sélection des répondants, qu’elles soient probabilistes, quasi probabilistes, non probabilistes, ou de convenance (voir Gaziano, 2005 ; Yan et al., 2015).
23La littérature s’est récemment intéressée à un aspect particulier de la sélection du répondant : l’information provenant des enquêtes microéconomiques est-elle sensible au statut du répondant ? La recherche a justement mis en évidence la dépendance des réponses aux caractéristiques du répondant (Alwang et al., 2017 ; Anderson et al., 2017 ; Fisher et al., 2010). Cette littérature est basée sur les développements théoriques et empiriques des approches économiques du ménage qui mettent en exergue l’inégale aptitude des conjoints à se souvenir des informations concernant le revenu ou les dépenses du ménage, les problèmes d’asymétrie d’information au sein du ménage, les rôles distincts des conjoints dans les activités du ménage et les conflits entre les membres du ménage concernant la répartition des ressources (Anderson et Baland, 2002 ; Glennerster et al., 2018 ; Haddad et al., 1997). Ainsi, l’étude de l’économie des ménages a remis en cause les modèles unitaires et a conduit les protocoles d’enquête à programmer des entretiens avec plusieurs membres du ménage.
24Anderson et al. (2017) ont étudié les différences d’opinion des conjoints du ménage sur le partage de l’autorité à partir d’une enquête menée en Tanzanie dans laquelle le mari et l’épouse ont été interrogés séparément. Les auteurs montrent que les conjoints fournissent souvent des réponses différentes sur qui détient l’autorité pour prendre les principales décisions concernant l’exploitation agricole ainsi que celles relatives aux moyens de subsistance. Alwang et al. (2017) présentent les résultats d’une expérience menée en Équateur, auprès de trois groupes de ménages. Dans le premier groupe, seul le mari était interrogé ; dans le deuxième, seule l’épouse ; et dans le troisième, les deux conjoints, mais séparément. Les auteurs constatent des différences marquées dans les réponses concernant les responsabilités, les hommes revendiquant plus fréquemment la responsabilité unilatérale des décisions prises. Enfin, Fisher et al. (2010) ont mené une enquête en milieu rural malawien afin de tester la précision de l’information obtenue sur le revenu du ménage lorsque le chef du ménage est le seul à être interrogé. Les résultats indiquent que, dans 66 % des ménages, le mari sous-estime le revenu de sa femme de 47 % en moyenne ; à l’inverse, dans 28 % des ménages, le mari surestime le revenu de son épouse et également le revenu total du ménage de 17 % en moyenne. D’une manière générale, les erreurs d’appréciation du chef de ménage sont plus accentuées lorsqu’il travaille en dehors de l’exploitation agricole, en milieu urbain, lorsque plusieurs membres du ménage exercent un emploi rémunéré ou lorsque les femmes du ménage sont éduquées. Les auteurs concluent qu’interroger le seul chef du ménage produit une information fiable seulement s’il est l’unique membre du ménage à percevoir un revenu et/ou s’il peut facilement observer le revenu de son épouse et/ou celui des autres membres du ménage.
25De ces exemples, nous retiendrons que limiter les enquêtes à un seul adulte du ménage peut mener à des erreurs de mesure sur des variables clés permettant d’éclairer la genèse de la pauvreté et d’en comprendre les implications sur le processus de développement, même si limiter le nombre d’interlocuteurs comprend d’évidents avantages de gain de temps et de réduction du coût d’administration de l’enquête. La littérature suggère que les chercheurs s’interrogent en premier lieu sur l’information détenue par les membres des ménages et les besoins de l’étude : quelle est la probabilité qu’un seul membre du ménage dispose d’une information précise sur les variables clés de l’enquête ? Quelles sont les dynamiques intra-ménages ? Quels sont les rôles des différents membres du ménage ? Ce travail préliminaire, qui peut être qualitatif ou quantitatif, est nécessaire pour la mise en place de protocoles d’enquêtes rigoureux et permet de décider si le coût de l’interrogation de plusieurs membres du ménage induit un gain substantiel de qualité de l’information obtenue.
3 – Comment interroger les répondants ?
26Choisir le mode d’administration du questionnaire est une étape importante dans le déroulement d’une enquête, et cette tâche doit être accomplie avec soin. Deux grands arbitrages se présentent : le premier est celui du mode d’interrogation des individus qui peut se faire soit en face-à-face, soit au téléphone, soit par internet. Le second tient au choix du support du questionnaire, qui peut être le papier « classique » ou un support informatique tel qu’un mini-ordinateur, une tablette ou un téléphone. Dans ce dernier cas, le script du questionnaire se lit directement sur le support, et il en va de même pour la saisie des réponses. Le choix final dépend de plusieurs paramètres importants tels que la qualité et le nombre de personnes interrogées, le type d’information requis par l’étude, les possibilités techniques (réseau téléphonique, connexion internet) mais aussi les moyens matériels, humains, financiers et le temps dont on dispose.
27Dans les pays à revenu élevé, les enquêtes par téléphone (CATI – Computer-Assisted Telephone Interviewing) et en ligne (CAWI – Computer-Assisted Web Interviewing) se sont largement développées en raison de leurs nombreux avantages, notamment leur faible coût. En revanche, les enquêtes socio-économiques dans les pays du Sud s’effectuent encore principalement en face-à-face et, plus rarement, par téléphone. Plusieurs raisons expliquent la lente diffusion des enquêtes CATI et CAWI : de modestes taux de pénétration du téléphone et d’internet et les faibles taux d’alphabétisation des populations dans certains pays.
28Le principal progrès que l’on peut noter dans les pays du Sud est le passage progressif des questionnaires papier (PAPI – Paper-and-Pencil Interviewing) aux questionnaires électroniques (CAPI – Computer-Assisted Personal Interviewing).
3.1 – Du questionnaire papier au questionnaire électronique
29L’utilisation de questionnaires électroniques a débuté dans les pays à revenu élevé dans les années 1980. La baisse sensible du coût des ordinateurs et des tablettes ainsi que l’amélioration des logiciels d’enquête ont contribué à étendre l’utilisation des CAPI aux enquêtes socio-économiques dans les pays du Sud.
30De nombreuses études récentes ont montré que les informations obtenues avec un questionnaire électronique étaient de bien meilleure qualité que celles obtenues avec un questionnaire papier (voir Caeyers et al., 2012 ; King et al., 2013 ; Leeuw, 2008 ; Leisher, 2014 ; MacDonald et al., 2016). Plusieurs raisons expliquent la meilleure performance des enquêtes CAPI. Une première source d’efficacité réside dans la gestion automatique des filtres (routage) lors de la lecture du questionnaire. Les questions qui ne s’appliquent pas à un répondant (selon les réponses fournies à des questions précédentes) sont automatiquement désactivées [6].
31Une seconde source de fiabilité des enquêtes CAPI réside dans l’instauration de contrôles de cohérence. Ces contrôles signalent, pendant l’entretien, des données manquantes, des valeurs improbables, des réponses potentiellement contradictoires ou impossibles [7]. Les contrôles de cohérence incorporent parfois des calculs lorsque le montant total issu de plusieurs réponses ne doit pas dépasser un certain montant [8]. Ils s’appliquent également aux études longitudinales pour signaler des réponses (trop) différentes de celles données dans la vague d’enquête précédente [9]. Ces contrôles sont beaucoup plus difficiles, voire impossibles à mettre en place avec un questionnaire papier, mais sont aisés à programmer avec les logiciels CAPI. Les informations erronées ou incohérentes sont facilement corrigées alors que l’enquêteur se trouve toujours avec le répondant. Il en résulte un énorme gain de temps et d’exactitude des informations recueillies.
32Afin de tester rigoureusement l’efficacité d’un questionnaire électronique versus un questionnaire papier, Caeyers et al. (2012) ont mené une expérience randomisée en Tanzanie auprès de trois groupes de ménages : un premier groupe auquel a été administré un module de consommation sur questionnaire papier ; un second groupe qui a été enquêté avec un logiciel CAPI comprenant un routage automatisé, mais sans vérification de cohérence ; un dernier groupe à qui l’on a administré le module de consommation à l’aide du logiciel CAPI, un routage automatisé et 366 vérifications de cohérence intégrées. Les auteurs constatent que la part des questionnaires ayant plus d’une valeur manquante ou impossible était de 2 % pour les questionnaires CAPI avec contrôles de cohérence, 40 % pour les questionnaires CAPI sans contrôles de cohérence et 83 % pour les questionnaires PAPI. La comparaison de la consommation de calories par tête selon le type de questionnaire utilisé souligne à quel point les erreurs de non-réponse et/ou de mesure conduisent à des conclusions erronées : 21 % des ménages du groupe interrogé à l’aide d’un questionnaire papier n’absorbent pas suffisamment de calories par jour, alors que ce chiffre n’est que de 8 % des ménages interrogés avec un questionnaire électronique.
33À la qualité des informations obtenues par questionnaire électronique s’ajoutent d’autres atouts. Le premier est sa capacité à produire un ensemble de données presque instantanément, prêt à être examiné et analysé. L’élimination de l’étape de saisie des données réduit non seulement les sources d’erreur mais aussi le délai de production des statistiques après les entrevues. Un second atout est de collecter, outre les réponses directes à l’enquête, un ensemble d’informations quantitatives sur la façon dont les données ont été recueillies (paradata), telles que des horodatages [10] et les coordonnées GPS des répondants. Ces paradonnées permettent la préparation et le suivi en temps réel du travail sur le terrain ainsi que l’évaluation de la qualité des données (par exemple Finn et Ranchhod, 2013 ; Choumert-Nkolo et al., 2019). Enfin, l’utilisation de logiciels CAPI permet de collecter des pièces jointes, comme des images, des photographies ou des enregistrements audios, qui seront instantanément associées à l’identifiant du répondant.
34Il importe de s’interroger sur les résistances que les répondants pourraient manifester face à cette nouvelle pratique d’interrogation. La littérature a souligné que l’adhésion des répondants au processus d’enquête, quel que soit le support d’interrogation, est largement tributaire de la qualité de la communication entre les enquêteurs et la population cible et/ou ses représentants à propos des objectifs de l’enquête, de la confidentialité des informations recueillies, de la protection de la vie privée, etc. L’étude de Mercader et al. (2017) a testé le consentement des femmes à une interview personnelle assistée par ordinateur pour recueillir des informations traitant de la couverture de la santé maternelle, néonatale et infantile dans les zones rurales de l’Ouganda. À la suite de la collecte des informations, qui s’est déroulée pour la moitié des femmes avec un support papier et pour l’autre moitié avec un support informatique, des groupes de discussion semi-structurés ont été organisés pour discuter des préférences du mode d’interrogation. Les résultats révèlent une acceptation globale du CAPI. De même, le travail de Paudel et al. (2013) a évalué l’acceptation des supports informatiques lors de la collecte des informations de l’enquête démographique et sanitaire népalaise. Les enquêteurs ont indiqué que les répondants émettaient plutôt des signes de curiosité que de crainte vis-à-vis du support informatique et que, en général, le consentement à l’interrogation à l’aide d’un support informatique était fort. Les inquiétudes des répondants portaient plutôt sur le fait que l’entretien puisse être enregistré par audio ou vidéo.
35Enfin, même dans les communautés les plus isolées, nous notons une pénétration croissante du téléphone portable qui contribue à familiariser les populations avec les nouvelles technologies de l’information et rend l’usage de tablettes moins insolite. Néanmoins, le choix du mode d’administration doit se faire en accord avec les communautés enquêtées. Il appartient aux chercheurs d’évaluer rigoureusement les préoccupations de la population cible avant de collecter des données au moyen de supports informatiques.
3.2 – L’émergence des enquêtes téléphoniques
36En enquête, l’interrogation en face-à-face est la norme de référence en raison de l’étendue et de la qualité des données pouvant être recueillies. Mais le face-à-face nécessite beaucoup de temps sur le terrain et alourdit, de ce fait, le budget consacré à la rémunération et aux frais de déplacement des enquêteurs. La progression des enquêtes téléphoniques répond à un besoin croissant d’obtenir des données rapidement et à moindre coût (cf. Croke et al., 2012 ; Demombynes et al., 2013 ; Dabalen et al., 2016 ; Dillon, 2012 ; Leo et al., 2015, pour des recommandations de mise en œuvre des enquêtes téléphoniques). En outre, la fréquence à laquelle les enquêtes téléphoniques peuvent être réalisées permet d’adapter les questions posées à des événements récents ou en cours.
37Cependant, de nombreuses imperfections compromettent la qualité de ce mode d’interrogation et devraient inciter à en limiter l’usage. Le principal problème des enquêtes téléphoniques réside dans les disparités territoriales de couverture du réseau et une grande inégalité dans la possession d’un téléphone fixe et/ou mobile selon les revenus des ménages. Ainsi, il est rare qu’une enquête par téléphone permette de générer un échantillon représentatif à l’échelle nationale ou à l’échelle pertinente pour l’étude car les zones isolées où vivent les populations les plus pauvres sont systématiquement sous-sélectionnées. D’autres paramètres compliquent l’interrogation téléphonique : les répondants sont moins attentifs que lorsqu’on les interroge en face-à-face, le taux de non-réponse est souvent plus élevé et, pour les enquêtes à passages répétés, l’attrition est généralement plus forte que celle des enquêtes en face-à-face classiques.
38Il est néanmoins possible, par différentes stratégies, d’améliorer sensiblement ce mode d’interrogation. La distribution de téléphones portables (éventuellement munis de chargeurs solaires) aux personnes interrogées après un premier passage en face-à-face est l’un des moyens d’encourager la participation continue à une enquête, de s’assurer que l’accès à l’électricité ne soit pas une cause de non-réponse et que les répondants restent joignables. D’autres astuces telles que l’envoi régulier de SMS rappelant aux répondants les appels à venir, ou l’octroi de crédit téléphonique, maintiennent l’intérêt des répondants pour l’enquête et les incitent à répondre aux sollicitations des enquêteurs. Enfin, pour réduire l’attrition dans une enquête longitudinale, l’enquêteur peut demander aux répondants sélectionnés de fournir des numéros de téléphone supplémentaires, par exemple ceux des autres membres du ménage ou ceux des voisins, etc. Cependant, toutes ces interventions introduisent de nouveaux biais (biais de participation, biais d’appartenance à un réseau) et doivent être utilisées avec grande précaution.
4 – L’erreur de mesure : fréquence des enquêtes, rôle clé du questionnaire
39Un certain nombre de données sont notoirement mal consignées dans les enquêtes, soit parce que la non-réponse est fréquente, soit parce que les valeurs reportées sont entachées d’erreurs. La littérature fourmille d’exemples de grandeurs mal quantifiées. Nous avons choisi de présenter quelques cas emblématiques des problèmes de mesure dans les pays du Sud, ainsi que les solutions permettant de réduire ces erreurs.
4.1 – Les erreurs de mesure dans les enquêtes agricoles
40Parmi les nombres mal connus, les surfaces, la production et le temps de travail agricoles occupent une place de premier rang (Arthi et al., 2018 ; Desiere et Jolliffe, 2018). En l’absence de cadastre dans la plupart des pays, les superficies cultivées sont auto-déclarées par les agriculteurs. Or, c’est une information qu’ils ne connaissent pas forcément avec précision car les parcelles ont rarement une forme standard, ou qu’ils hésitent à transmettre sincèrement. Le travail agricole, notamment celui des petites exploitations, est particulièrement difficile à mesurer et les recommandations habituelles de l’Organisation internationale du travail (OIT) sont inopérantes dans des contextes marqués par la diversité des formes d’emploi et des statuts du travail (Phélinas, 2010). Enfin, les quantités d’intrants et les quantités récoltées sont aussi auto-déclarées par les agriculteurs bien qu’ils n’aient qu’une connaissance souvent approximative des montants en question.
41Pourtant, les statistiques agricoles sont cruciales pour comprendre les grands enjeux du développement tels que la croissance, l’emploi, le revenu des ménages, la réduction de la pauvreté, les migrations et plus généralement les transformations structurelles des économies. En effet, à la suite des travaux d’Arthur Lewis (1954), l’idée qui a longtemps dominé non seulement la littérature mais aussi les politiques économiques est que, dans les pays du Sud, les transferts de main-d’œuvre de l’agriculture vers l’industrie ou les services sont la clé d’une allocation plus efficace du travail dans l’économie et, par conséquent, de la croissance de la production et des revenus. Or, la littérature récente a montré que la faible productivité de l’agriculture trouverait son origine dans des estimations inexactes des deux principaux facteurs de production que sont la terre et le travail. En conséquence, la force de conviction des théories fondées sur un excédent de main-d’œuvre en milieu rural s’atténue singulièrement et invite à repenser le modèle de Lewis, à l’instar de plusieurs études récentes (Diao et McMillan, 2018 ; Gollin et al., 2013 ; McCullough, 2017).
42La mesure du temps de travail en milieu rural a fait l’objet de nombreuses études académiques qui en soulignent les difficultés (Reardon et Glewwe, 2000), ainsi que de recommandations de l’OIT et de la Banque mondiale (ILO, 1990 ; Grosh et Glewwe, 2000). Dans la pratique, il existe deux façons de solliciter les répondants sur leur temps de travail. La première, propre aux enquêtes emploi, consiste à demander aux individus le temps passé à travailler au cours d’une période de référence, habituellement la semaine précédant l’enquête. L’ancrage des réponses à une période de référence courte minimise les erreurs imputables à un défaut de mémoire. Mais cette référence hebdomadaire est inadaptée à la saisie du temps de travail des individus dont l’occupation est soumise à de fortes variations saisonnières.
43La seconde façon de saisir le temps de travail agricole est de récapituler le temps passé aux opérations culturales à la fin du cycle agricole. En effet, la complexité de l’activité agricole, le nombre et la variété des opérations culturales menées, la diversité des cultures et le fractionnement fréquent de la propriété foncière imposent d’étudier le temps passé par chaque membre du foyer en âge de travailler sur chaque parcelle et pour chaque opération culturale au cours d’un cycle agricole. Les enquêtes auprès des ménages devraient donc inclure un module détaillé portant sur ces questions. Mais l’inconvénient de cette interrogation approfondie est qu’elle astreint les agriculteurs à des efforts de mémoire auxquels ils ont souvent du mal à se soumettre.
44Deux études se sont récemment intéressées au biais de rappel, c’est-à-dire aux difficultés qu’éprouve le répondant à se remémorer les emplois saisonniers ou occasionnels qu’il a occupés ou encore le temps qu’il a consacré à différentes tâches au cours d’un cycle agricole (Arthi et al., 2018 ; Gaddis et al., 2019). Les auteurs de ces deux études ont comparé le temps de travail agricole déclaré lors d’expériences aléatoires conduites en milieu rural tanzanien et ghanéen. Quatre méthodes différentes faisant varier le mode d’interrogation (face-à-face et téléphone) et la fréquence de l’enquête (donc la période de rappel) ont été testées. Les informations obtenues par chaque mode d’interrogation ont été comparées à celles obtenues par ce que les auteurs considèrent comme leur enquête étalon-or, à savoir le temps de travail recueilli lors de visites hebdomadaires. Les résultats démontrent indiscutablement que les questions portant sur un laps de temps court et répétées fréquemment conduisent à de meilleures mesures. Dans les enquêtes rétrospectives, le temps de travail consacré à chaque parcelle est près de quatre fois supérieur au temps de travail recueilli lors de l’enquête hebdomadaire. Les auteurs expliquent ces écarts par l’existence d’un biais de mémoire imputable non seulement à des oublis purs et simples mais aussi à la charge mentale que représente le fait de se souvenir d’une multiplicité de tâches ainsi que d’horaires de travail particulièrement irréguliers. En revanche, l’entretien par téléphone donne des résultats statistiquement peu différents des réponses obtenues lors de visites hebdomadaires. Ce résultat illustre l’intérêt de l’enquête téléphonique pour collecter des données à fréquence rapprochée : préserver la qualité des informations sans trop alourdir le coût de l’enquête.
45Le calcul de la taille des exploitations agricoles est une autre difficulté récurrente dans les enquêtes. Les déclarations des répondants comportent souvent de grandes inexactitudes pour plusieurs raisons : la méconnaissance de la taille réelle de parcelles transmises par héritage et sans documents précis de propriété indiquant le tracé des limites ; l’oubli pur et simple de certaines parcelles considérées comme « marginales » [11] ; la prévalence d’unités de mesure locales très hétérogènes, malaisées à convertir en unités standard ; la réticence à révéler l’étendue et la valeur des actifs fonciers par crainte de l’usage (fiscal notamment) qui pourrait être fait de cette information. En outre, la qualité des réponses semble sensible aux caractéristiques des producteurs (âge, niveau d’éducation, propriétaire absent, activité agricole secondaire, etc.) et aux caractéristiques de la parcelle (pente, taille, type de cultures) (Carletto et al., 2016).
46En réponse à ces difficultés, plusieurs travaux ont analysé l’intérêt des systèmes de positionnement global (GPS) pour améliorer la précision de la mesure des surfaces agricoles (Carletto et al., 2015 ; Carletto et al., 2016 ; Kilic et al., 2017). L’usage de ces appareils réduit incontestablement l’erreur de mesure des surfaces, en particulier lorsque l’alternative est une auto-déclaration des producteurs. Malheureusement, l’usage de coordonnées GPS introduit d’autres erreurs de mesure liées à la position du satellite, à une mauvaise réception du signal (couverture nuageuse, couvert forestier dense), et aux caractéristiques des parcelles (taille, pente, forme). Il produit également un taux de non-réponse élevé car l’enquêteur ne peut parfois pas visiter certaines parcelles, notamment les plus distantes. Or, les parcelles non mesurées ne sont pas distribuées aléatoirement parmi l’ensemble des parcelles cultivées. Les données manquantes apparaissent ainsi corrélées avec les caractéristiques des parcelles et du répondant. Enfin, mesurer les surfaces à l’aide d’un GPS est une activité chronophage et, par conséquent, coûteuse. Pour toutes ces raisons, il est utile de combiner les mesures issues des coordonnées GPS avec les déclarations des agriculteurs qui serviront de référence pour l’imputation des données manquantes, notamment celles correspondant aux parcelles distantes (Kilic et al., 2017).
47L’estimation de la production est également entachée d’erreurs car c’est souvent une grandeur déclarée par les répondants. Comparée à la méthode des coupe-échantillons, qui consiste à sélectionner des parcelles au hasard et à en récolter et mesurer la production, les déclarations des producteurs, qui se fondent bien souvent sur une estimation au jugé ou à vue, tendent à sous-évaluer systématiquement leur production en particulier s’il s’agit de petites parcelles (Desiere et Jolliffe, 2018 ; Deininger et al., 2012). L’origine de ce biais systématique est encore mal connue mais plusieurs hypothèses sont envisagées : un long délai entre la récolte et l’enquête qui est source d’erreur de mémoire ; une mauvaise perception de la taille de la parcelle ; l’utilisation de mesures non standard ; le fait que la parcelle soit cultivée par d’autres personnes que le répondant ; des erreurs d’arrondi plus fréquentes si la parcelle est petite.
48La tenue d’un journal de récolte, rempli par un membre de l’exploitation agricole à chaque récolte, semble être une solution prometteuse, en particulier pour les cultures récoltées en petites quantités au cours d’une longue période (maïs, cultures maraîchères et fruitières) et pour les produits de l’élevage. L’étude conduite par Deininger et al. (2012) indique que l’usage d’un journal de récolte ne semble pas poser de difficulté aux agriculteurs les plus pauvres ou les moins éduqués car le taux d’attrition et de non-réponse reste faible même pour ces groupes. Considérant que leurs déclarations dans les enquêtes traditionnelles sont plus souvent entachées d’erreurs que celles des autres groupes, le recueil régulier d’information auprès des plus démunis améliore considérablement la connaissance que l’on a de leur niveau de vie.
4.2 – Les erreurs de mesure dans les enquêtes sur des sujets sensibles
49La collecte de données sur des sujets dits sensibles comme, par exemple, les comportements sexuels, la violence domestique, l’origine ethnique, la religion, l’orientation sexuelle, la consommation de drogues, la corruption, le militantisme politique, etc. présente un véritable défi. En effet, la qualité des informations obtenues lorsque les questions sont posées directement est compromise par les refus de répondre, la sur- ou sous-déclaration de certains évènements ou comportements, ou encore par des réponses socialement normées. Les questions sensibles sont habituellement classées en trois grandes catégories : les questions intrusives qui sont inappropriées dans la conversation de tous les jours ; les questions suscitant une crainte quant aux conséquences de la divulgation de la réponse à un tiers ; les questions socialement inacceptables, incitant le répondant à admettre qu’il a transgressé une norme sociale (Tourangeau et Yan, 2007).
50Pour obtenir des réponses sincères à des questions portant sur les comportements, les attitudes ou les opinions des répondants, la recherche offre des outils relativement performants et la littérature fournit de nombreuses lignes directrices pragmatiques. Le principe commun à toutes les méthodes qui explorent les sujets sensibles est celui de l’interrogation indirecte (cf. Rosenfeld et al., 2016, pour une comparaison des méthodes). La plus ancienne des méthodes d’interrogation indirecte est celle des réponses aléatoires (randomized responses techniques). Le répondant utilise un support de tirage aléatoire (une pièce de monnaie, un dé, etc.), dont le résultat n’est pas observé par l’enquêteur, et qui va déterminer soit la question à laquelle il répond, soit la formulation de la question (Blair et al., 2015 ; Kraay et Murrell, 2015). L’enquêteur qui enregistre la réponse ignore ainsi à quelle question (ou formulation) répond la personne interrogée. Dans la méthode du comptage de réponses (list experiments ou item count technique) les répondants sont sélectionnés aléatoirement et assignés à un groupe « traité » ou à un groupe de contrôle. Le groupe de contrôle reçoit une liste d’énoncés non sensibles. Le groupe traité reçoit cette même liste à laquelle est ajoutée une proposition sensible. Chaque individu de chaque groupe est alors invité à donner à l’enquêteur le nombre global d’énoncés qui sont vrais. La différence entre les moyennes du groupe traité et du groupe de contrôle indique ainsi la prévalence du comportement (ou opinion) que le chercheur souhaite mesurer (Blair et Imai, 2012 ; McKenzie et Siegel, 2013). Les méthodes d’approbation (endorsement experiments) reposent sur un principe similaire qui consiste à comparer le niveau d’approbation d’une mesure de politique publique entre deux groupes de répondants sélectionnés au hasard : un groupe à qui l’on ne parle que de la mesure de politique publique et un autre groupe à qui l’on indique qu’une organisation militante appuie cette politique. L’approbation de la mesure soutenue par l’organisation militante est considérée comme une preuve indirecte du soutien des répondants à cette organisation (Bullock et al., 2011 ; Lyall et al., 2013).
51Toutes ces façons indirectes de sonder les opinions et/ou les comportements consistent en fait à améliorer la protection de la vie privée des répondants en masquant, d’une manière ou d’une autre, la réponse qu’ils fournissent à l’enquêteur. Les informations ainsi obtenues seraient totalement dépouillées de biais sociaux normatifs. Il serait toutefois erroné d’affirmer que cette hypothèse n’est jamais violée car la simple présence d’un « intrus » (ici l’enquêteur) dans un milieu provoque inévitablement des réactions de défense ou d’autocensure qui altèrent la sincérité des réponses (Arborio et al., 2005). Par ailleurs, certains protocoles d’interrogation sont complexes, nécessitent parfois de nombreuses explications et/ou l’introduction de scénarios longs à lire, qui semblent peu adaptés aux populations faiblement éduquées.
52L’auto-administration du questionnaire apparaît comme une bonne solution de compromis car elle conserve la précision de l’interrogation directe et préserve l’anonymat des réponses. En effet, dans ce cas, l’absence d’interaction avec l’enquêteur, qui ne peut prendre connaissance de la réponse donnée par tel ou tel répondant, procure des conditions d’interrogation plus confortables. Cependant, remplir un questionnaire papier peut s’avérer compliqué pour les personnes faiblement éduquées. L’auto-entretien informatisé (CASI – Computer-Assisted Self-Interviewing) présente un attrait considérable, en particulier sa variante audio (ACASI – Audio Computer-Assisted Self-Interviewing), où le répondant écoute les questions à l’aide d’un casque audio et enregistre ses réponses sur le clavier ou l’écran. Testé dans des conditions difficiles qui sont celles de l’enquête auprès de populations rurales peu éduquées et peu familières de l’outil informatique, l’auto-entretien informatisé produit un nombre plus important de réponses positives aux comportements socialement stigmatisés qu’une version papier, sans poser d’insurmontables problèmes de mise en pratique (Phillips et al., 2010). Une expérience comparant les deux stratégies d’interrogation (PAPI et CASI/ACASI) aboutit à la même conclusion (Hewett et al., 2004).
4.3 – Les erreurs de mesure dans les enquêtes sur la consommation des ménages
53Obtenir des informations sur les revenus dans les pays du Sud se heurte à de nombreux obstacles. De ce fait, les dépenses de consommation des ménages dont devenues le concept phare de la mesure du niveau de vie et de la pauvreté des populations d’un pays. Cependant, les erreurs de mesure dans les enquêtes sur la consommation et les dépenses des ménages sont encore loin d’être totalement éliminées. Plusieurs sources d’erreur ont été analysées dans de nombreux travaux traitant du mode d’administration du questionnaire (questionnaire papier versus questionnaire électronique), des périodes de rappel, du degré de détail des produits enregistrés (Beegle et al., 2012 ; Caeyers et al., 2012 ; De Weerdt et al., 2016 ; Oseni et al., 2017) [12]. Nous avons déjà abordé les questions concernant la période de rappel et le mode d’administration du questionnaire à propos du temps de travail agricole. La discussion sera ici centrée sur un sujet crucial, celui des unités de mesure des produits alimentaires consommés [13].
54Les volumes consommés s’avèrent particulièrement difficiles à saisir car les denrées alimentaires sont presque toujours exprimées en unités non standard, dont la liste est quasiment infinie (régime de bananes, cagette de tomates, grappes de raisin, sac de sucre, bidon d’huile, etc.). Ces unités sont non seulement ambiguës et imprécises mais aussi sujettes à interprétation individuelle. Par conséquent, de tels termes conduisent inévitablement à une sous- ou surestimation de la consommation d’aliments et à un classement erroné des ménages selon leur niveau nutritionnel et leur pauvreté.
55L’utilisation d’images et/ou de photographies lors de l’entretien apporte un gain significatif de précision des informations collectées. En effet, les images intégrées dans le questionnaire vont servir de norme de référence de façon à ce que les quantités ambiguës soient mises en correspondance avec des unités métriques normalisées. Par exemple, il est possible de relever le poids de trois régimes de bananes différents et de placer une photographie du « régime moyen de bananes » à côté d’un objet de taille constante comme un vélo ou une chaise à des fins de calibrage (cf. figure 1). De même, dans les modules sur la santé, des images de médicaments peuvent être utilisées pour normaliser la quantité absorbée [14].
Exemple d’image présentée aux répondants lors d’une enquête
Exemple d’image présentée aux répondants lors d’une enquête
56Un autre aspect de la consommation des ménages dans les pays du Sud que des études récentes ont mis en lumière est le changement des habitudes alimentaires au cours des dernières décennies sous l’effet de l’urbanisation, de l’entrée des femmes dans la vie active, de la progression des revenus et de l’évolution des systèmes alimentaires. Les repas pris à l’extérieur sont de plus en plus fréquents alors qu’ils sont encore peu pris en compte dans les questionnaires. Or, les rares enquêtes qui les recensent montrent que ces repas représentent plus du quart des dépenses alimentaires des ménages. Par conséquent, omettre les repas pris en dehors du foyer conduit à des biais importants de mesure du bien-être, de la pauvreté et des inégalités (Farfán et al., 2017 ; Fiedler et al., 2017). L’étude de Farfán et al. (2017), fondée sur des données péruviennes, montre qu’intégrer ces repas dans les calculs conduit à reclasser 20 % des ménages sur l’échelle de la pauvreté, réduit les inégalités de consommation mesurées dans l’ensemble de la population, mais augmente le nombre de ménages en situation d’extrême pauvreté.
57La quasi-absence de renseignements sur cette forme de dépense alimentaire s’explique par le coût élevé de la collecte de ces informations et la complexité de l’interrogation (Smith et al., 2014). D’abord, tous les membres du ménage doivent être interrogés car ils ne détiennent pas l’information sur la consommation de chacun des autres hors du domicile. Ensuite, la précision du volume final consommé dépend de la collecte d’une quantité de détails (composition du repas, en-cas, boissons, etc.). Enfin, les répondants ignorent la plupart du temps le contenu précis des aliments qu’ils ont consommé. Néanmoins, l’enjeu est de taille et justifie que des ressources soient affectées à la recension de cette composante de la consommation des ménages.
5 – Conclusion
58Comprendre les enjeux du développement ne peut se faire à l’aide de la seule théorie économique. Beaucoup de modèles et de questions sont liés à un besoin commun : examiner des données statistiques à l’aide de méthodes empiriques appropriées afin de tester les implications des modèles théoriques. La microéconomie appliquée, en particulier, doit reposer sur l’analyse de données primaires et secondaires d’une haute précision. Des statistiques de qualité sont également indispensables aux décideurs afin qu’ils puissent prendre des décisions informées, mettre en œuvre des politiques économiques plus efficaces et plus équitables, et cibler éventuellement les interventions qui améliorent le bien-être des ménages les plus démunis. Enfin, la prolifération de bases de données en accès libre, dynamique, parfois nommée « révolution des données » impose, encore plus qu’auparavant, de collecter, produire et diffuser des informations de qualité.
59Collecter des données de qualité indiscutable reste un défi majeur. Nous avons présenté les nombreux travaux récents qui s’attachent à améliorer la fiabilité de l’information collectée auprès des ménages, et ce aux différents stades d’une enquête : l’échantillonnage, la sélection des répondants, la rédaction du questionnaire, le déroulement de l’entretien etc.
60Les choix méthodologiques ultimes sont guidés par de nombreux paramètres et résultent souvent d’un compromis entre le matériel disponible pour l’échantillonnage, le coût de l’enquête, la précision attendue des estimateurs et l’ampleur tolérable des biais. À côté de ces décisions techniques d’autres considérations pratiques sont inévitablement prises en compte telles que les contraintes de temps, les questions de sécurité et de compétence des enquêteurs.
61Notre travail suggère qu’il est possible, par un dispositif ciblé, en concentrant les moyens et les efforts sur quelques points clés, d’améliorer grandement la qualité des données d’enquête. D’abord, l’utilisation de questionnaires électroniques présente d’incontestables atouts si l’on compare la qualité des données ainsi obtenues avec celle des données acquises de manière classique à l’aide d’un questionnaire papier. Ensuite, l’auto-administration du questionnaire, à condition que le questionnement ne soit pas trop complexe, assure une plus grande confidentialité de l’interrogation et, par conséquent, améliore non seulement le taux de participation à l’enquête mais aussi la sincérité des réponses. Enfin, un nombre significatif de données exigent un recueil régulier afin que les biais mémoriels n’altèrent pas la qualité des informations fournies. Coupler une première interrogation en face-à-face avec une interrogation téléphonique ultérieure régulière assure l’obtention d’informations fiables sans trop alourdir le coût de l’enquête.
62Le principal bénéfice d’une enquête par sondage est d’obtenir des résultats rapides et à moindre coût par rapport à une enquête exhaustive (recensement). Mais il faut souligner qu’un recueil soigneux et rigoureux des informations est toujours relativement onéreux car certaines dépenses sont incompressibles. La formation et la rémunération des enquêteurs relèvent de cette catégorie car la crédibilité des données recueillies dépend fortement de l’implication et de l’expérience de la personne qui conduit l’interrogation. Il est aussi indispensable de consacrer suffisamment de temps à la conception du questionnaire car la qualité des réponses est extrêmement sensible à la formulation et au flux des questions.
63Obtenir des données de qualité ne doit pas non plus s’effectuer au détriment de la protection des personnes et de leur vie privée. À l’ère de la digitalisation et de la dématérialisation, garantir la sécurité des informations personnelles est primordial. Avant toute chose, la participation à une enquête doit reposer sur le consentement libre et éclairé de chaque répondant. Ensuite, les chercheurs doivent préserver la confidentialité des réponses données durant l’entretien et/ou des images prises, et assurer un partage et un stockage sécurisés des données [15]. L’utilisation des nouvelles technologies (telles que les caméras intégrées aux téléphones/tablettes ou les drones) dans les protocoles d’enquête ne doit pas altérer ces principes éthiques fondamentaux de la recherche de terrain.
Bibliographie
Références
- ALWANG, J., LAROCHELLE, C. and V. ARRERA (2017). “Farm Decision Making and Gender: Results from a Randomized Experiment in Ecuador”, World Development, 92, 117-129.
- ANDERSON, S., BALAND, J.-M. (2002). “The Economics of Roscas and Intrahousehold Resource Allocation”, The Quarterly Journal of Economics, 117, 963-995. https://doi.org/10.1162/003355302760193931.
- ANDERSON, C. L., REYNOLDS, T. W. and M. K. GUGERTY (2017). “Husband and Wife Perspectives on Farm Household Decision-Making Authority and Evidence on Intra-Household Accord in Rural Tanzania”, World Development, 90, 169-183. https://doi.org/10.1016/j.worlddev.2016.09.005.
- ARBORIO, A. M., FOURNIER, P. et F. de SINGLY (2005). L’observation directe, 2e éd., Paris : Armand Colin.
- ARDILLY, P. (2006). Les techniques de sondage, Paris : Éditions Technip.
- ARTHI, V., BEEGLE, K., DE WEERDT, J. and A. PALACIOS-LÓPEZ (2018). “Not your Average Job: Measuring Farm Labor in Tanzania”, Journal of Development Economics, 130, 160-172.
- BAUER, J. J. (2014). “Selection Errors of Random Route Samples”, Sociological Methods & Research, 43 (3), 519-544. https://doi.org/10.1177/0049124114521150.
- BÉDÉCARRATS, F., CLING, J.-P., ROUBAUD, F. (2016). « Révolution des données et enjeux de la statistique en Afrique », Afrique contemporaine, n° 258 (2016/2), 9-23. https://doi.org/10.3917/afco.258.0009.
- BEEGLE, K., DE WEERDT, J., FRIEDMAN, J., GIBSON, J. (2012). “Methods of Household Consumption Measurement through Surveys: Experimental Results from Tanzania”, Journal of Development Economics, 98, 3-18. https://doi.org/10.1016/j.jdeveco.2011.11.001.
- BEEGLE, K., CHRISTIAENSEN, L., DABALEN, A., GADDIS, I. (2016). Poverty in a Rising Africa, Washington, DC: World Bank. https://openknowledge.worldbank.org/handle/10986/22575.
- BLAIR, G. and K. IMAI (2012). “Statistical Analysis of List Experiments”, Political Analysis, 20, 47-77.
- BLAIR, G., IMAI, K., ZHOU, Y.-Y. (2015). “Design and Analysis of the Randomized Response Technique”, Journal of the American Statistical Association, 110, 1304-1319.
- BULLOCK, W., IMAI, K., SHAPIRO, J. N. (2011). “Statistical Analysis of Endorsement Experiments: Measuring support for Militant Groups in Pakistan”, Political Analysis, 19, 363-384.
- CAEYERS, B., CHALMERS, N., DE WEERDT, J. (2012). “Improving Consumption Measurement and other Survey Data through CAPI: Evidence from a Randomized Experiment”, Journal of Development Economics, 98 (1), 19-33. doi:10.1016/j.jdeveco.2011.12.001.
- CARLETTO, C., GOURLAY, S., WINTERS, P. (2015). “From Guesstimates to GPStimates: Land Area Measurement and Implications for Agricultural Analysis”, Journal of African Economies, 24 (5), 593-628. https://doi.org/10.1093/jae/ejv011.
- CARLETTO, C., GOURLAY, S., MURRAY, S., ZEZZA, A. (2016). “Cheaper, Faster, and More than Good Enough: Is Gps the New Gold Standard in Land Area Measurement?”, SSRN Scholarly Paper No. ID 2813013, Rochester, NY: Social Science Research Network.
- CHOUMERT-NKOLO, J., CUST, H., TAYLOR, C. (2019). “Using Paradata to Collect better Survey Data: Evidence from a Household Survey in Tanzania”, Review of Development Economics, [Early view] https://doi.org/10.1111/rode.12583.
- CROKE, K., DABALEN, A., DEMOMBYBES, G., GIUGALE, M., HOOGEVEEN, J. (2012). “Collecting High Frequency Panel Data in Africa Using Mobile Phone Interviews”, World Bank Policy Research Working Papers WPS 6097, Washington, DC: The World Bank.
- DABALEN, A., ETANG, A., HOOGEVEEN, J., MUSHI, E., SCHIPPER, Y., VON ENGELHARDT, J. (2016). Mobile Phone Panel Surveys in Developing Countries: A Practical Guide for Microdata Collection, Washington, DC: The World Bank Group.
- DE WEERDT, J., BEEGLE, K., FRIEDMAN, J., GIBSON, J. (2016). “The Challenge of Measuring Hunger through Survey”, Economic Development and Cultural Change, 64, 727-758. doi:10.1086/686669.
- DEININGER, K., CARLETTO, C., SAVASTANO, S., MUWONGE, J. (2012). “Can Diaries Help Improve Agricultural Production Statistics? Evidence from Uganda”, Journal of Development Economics, 98, 42-50.
- DEMOMBYNES, G., GUBBINS, P., ROMEO, A. (2013). “Challenges and Opportunities of Mobile Phone-Based Data Collection: Evidence from South Sudan”, World Bank Policy Research Working Paper WPS 6321, Washington, DC: The World Bank.
- DESIERE, S., JOLLIFFE, D. (2018). “Land Productivity and Plot Size: Is Measurement Error Driving the Inverse Relationship?”, Journal of Development Economics, 130, 84-98. https://doi.org/10.1016/j.jdeveco.2017.10.002.
- DIAO, X., McMILLAN, M. (2018). “Toward an Understanding of Economic Growth in Africa: A Reinterpretation of the Lewis Model”, World Development, 109, 511-522.
- DILLON, B. (2012). “Using Mobile Phones to Collect Panel Data in Developing Countries”, Journal of International Development, 24, 518-527.
- EYERMAN, J. (2015). Drone-Assisted Sample Design for Developing Countries, RTI International. https://www.census.gov/fedcasic/fc2015/ppt/15_eyerman.pdf.
- FARFÁN, G., GENONI, M. E., VAKIS, R. (2017). “You Are what (and where) You Eat: Capturing Food Away from Home in Welfare Measures”, Food Policy, 72, 146-156. https://doi.org/10.1016/j.foodpol.2017.08.020.
- FIEDLER, J. L., YADAV, S. (2017). “How Can We better Capture Food Away from Home? Lessons from India’s Linking Person-Level Meal and Household-Level Food Data”, Food Policy, 72, 81-93. https://doi.org/10.1016/j.foodpol.2017.08.015.
- FINN, A., RANCHHOD, V. (2013). “Genuine Fakes: The Prevalence and Implications of Fieldworker Fraud in a Large South African Survey”, Southern Africa Labour and Development Research Unit, Open SALDRU Publications Repository. http://opensaldru.uct.ac.za/handle/11090/673.
- FISHER, M., REIMER, J. J., CARR, E. R. (2010). “Who Should Be Interviewed in Surveys of Household Income?”, World Development, 38, 966-973. https://doi.org/10.1016/j.worlddev.2009.11.024.
- GADDIS, I., OSENI, G., PALACIOS-LÓPEZ, A., PIETERS, J. (2019). “Measuring Farm Labor: Survey Experimental Evidence from Ghana”, World Bank Policy Research Working Paper WPS 8717, Washington, DC: The World Bank Group.
- GALLEGO, F. J., KERDILES, H., LEO, O. (2015). Using GIS and Remote Sensing to Build Master Sampling Frames for Agricultural Statistics, Report EUR 27597 EN. doi:10.27/438056.
- GAZIANO, C. (2005). “Comparative Analysis of Within-Household Respondent Selection Techniques”, Public Opinion Quarterly, 69, 124-157.
- GEVAERT, C. M., SLIUZAS, R., PERSELLO, C., VOSSELMAN, G. (2018). “Evaluating the Societal Impact of Using Drones to Support Urban Upgrading Projects”, ISPRS International Journal of Geo-Information, 7 (3), 91.
- GIBSON, J., McKENZIE, D. (2007). “Using Global Positioning Systems in Household Surveys for Better Economics and Better Policy”, The World Bank Research Observer, 22, 217-241.
- GLENNERSTER, R., WALSH, C., DIAZ-MARTIN, L. (2018). A Practical Guide to Measuring Women’s and Girls’ Empowerment in Impact Evaluations. https://www.povertyactionlab.org/sites/default/files/resources/practical-guide-to-measuring-women-and-girls-empowerment-in-impact-evaluations.pdf.
- GOLLIN, D., LAGAKOS, D., WAUGH, M. E. (2013). “The Agricultural Productivity Gap”, The Quarterly Journal of Economics, 129 (2), 939-993.
- GROSH, M., GLEWWE, P. (Eds.) (2000). Designing Household Survey Questionnaires for Developing Countries : Lessons from 15 Years of the Living Standards Measurement Study, Washington, DC: The World Bank.
- GSARS [GLOBAL STRATEGY TO IMPROVE AGRICULTURAL AND RURAL STATISTICS] (2015). Manuel sur les bases de sondage principales pour les statistiques agricoles : développement de la base de sondage, conception du plan d’échantillonnage et estimation. http://gsars.org/wp-content/uploads/2016/06/Handbook-on-MSF-FR-WEBFILE-280616.pdf.
- HADDAD, L. J, HODDINOTT, J., ALDERMAN, H. (1997). Intrahousehold Resource Allocation in Developing Countries: Models, Methods and Policies, Washington, DC: International Food Policy Research Institute; Baltimore: Johns Hopkins University Press, 384 p.
- HECKATHORN, D. D. (1997). “Respondent-Driven Sampling: A New Approach to the Study of Hidden Populations”, Social Problems, 44, 174-199.
- HEWETT, P. C., ERULKAR, A. S., MENSCH, B. S. (2004). “The Feasibility of Computer-Assisted Survey Interviewing in Africa: Experience from Two Rural Districts in Kenya”, Social Science Computer Review, 22, 319-334. https://doi.org/10.1177/0894439304263114.
- HIMELEIN, K., ECKMAN, S., MURRAY, S. (2014). “Sampling Nomads: A New Technique for Remote, Hard-to-Reach, and Mobile Populations”, Journal of Official Statistics, 30, 191-213. https://doi.org/10.2478/jos-2014-0013.
- HIMELEIN, K., ECKMAN, S., MURRAY, S., BAUER, J. (2017). “Alternatives to Full Listing for Second Stage Sampling: Methods and Implications”, Statistical Journal of the IAOS, 33, 701-718. https://doi.org/10.3233/SJI-160341.
- ILO [INTERNATIONAL LABOUR OFFICE] (1990). Statistical Sources and Methods. Vol. 3, Economically Active Population, Employment, Hours of Work (Household Surveys), Geneva: ILO. http://laborsta.ilo.org/applv8/data/SSM3/E/SSM3.html.
- JERVEN, M. (2013). Poor Numbers: How We Are Misled by African Development Statistics and What to Do about It, Ithaca, NY: Cornell University Press, 176 p.
- JERVEN, M., JOHNSTON, D. (2015). “Statistical Tragedy in Africa? Evaluating the Data Base for African Economic Development”, The Journal of Development Studies, 51, 111-115. https://doi.org/10.1080/00220388.2014.968141.
- JOHNSTON, L. G., SABIN, K. (2010). « Échantillonnage déterminé selon les répondants pour les populations difficiles à joindre », Methodological Innovations Online, 5, 38-48. https://doi.org/10.4256/mio.2010.0017a.
- KILIC, T., ZEZZA, A., CARLETTO, C., SAVASTANO, S. (2017). “Missing(ness) in Action: Selectivity Bias in GPS-Based Land Area Measurements”, World Development, 92, 143-157. https://doi.org/10.1016/j.worlddev.2016.11.018.
- KING, J. D., BUOLAMWINI, J., CROMWELL, E. A., PANFEL, A., TEFERI, T., ZERIHUN, M., MELAK, B., WATSON, J., TADESSE, Z., VIENNEAU, D., NGONDI, J., UTZINGER, J., ODERMATT, P. and P. M. EMERSON (2013). “A Novel Electronic Data Collection System for Large-Scale Surveys of Neglected Tropical Diseases”, PLoS ONE, 8 (9), e74570. https://doi.org/10.1371/journal.pone.0074570.
- KISH, L. (1995). Survey Sampling, New York: Wiley.
- KRAAY, A., MURRELL, P. (2015). “Misunderestimating Corruption”, The Review of Economics and Statistics, 98, 455-466. https://doi.org/10.1162/REST_a_00536.
- LEEUW, E. D. de (2008). “The Effect of Computer-Assisted Interviewing on Data Quality: A Review of the Evidence” [WWW Document]. http://dspace.library.uu.nl/handle/1874/44502.
- LEISHER, C. (2014). “A Comparison of Tablet-Based and Paper-Based Survey Data Collection in Conservation Projects”, Social Sciences, 3 (2), 264-271. doi:10.3390/socsci3020264.
- LEO, B., MORELLO, R., MELLON, J., PEIXOTO, T., DAVENPORT, S. (2015). “Do Mobile Phone Surveys Work in Poor Countries?”, CGD Working Paper 398, Washington, DC: Center for Global Development.
- LEWIS, W. A. (1954). “Economic Development with Unlimited Supplies of Labour”, The Manchester School, 22 (2), 139-191.
- LOHR, S. (2009). Sampling: Design and Analysis, Boston, MA: Cengage Learning, 608 p.
- LOWTHER, S. A., CURRIERO, F. C., SHIELDS, T., AHMED, S., MONZE, M. and W. J. MOSS (2009). “Feasibility of Satellite Image-Based Sampling for a Health Survey among Urban Townships of Lusaka, Zambia”, Tropical Medicine & International Health, 14, 70-78. https://doi.org/10.1111/j.1365-3156.2008.02185.x.
- LYALL, J., BLAIR, G., IMAI, K. (2013). “Explaining Support for Combatants during Wartime: A Survey Experiment in Afghanistan”, American Political Science Review, 107, 679-705. https://doi.org/10.1017/S0003055413000403.
- MaCDONALD, M. C., ELLIOTT, M., CHAN, T., KEARTON, A., SHIELDS, K. F., BARTRAM, J. and W. L. HADWEN (2016). “Investigating Multiple Household Water Sources and Uses with a Computer-Assisted Personal Interviewing (CAPI) Survey”, Water, 8, 574. https://doi.org/10.3390/w8120574.
- McCREESH, N., FROST, S. D. W., SEELEY, J., KATONGOLE, J., TARSH, M. N., NDUNGUSE, R., JICHI, F., LUNEL, N. L., MAHER, D., JOHNSTON, L. G., SONNENBERG, P., COPAS, A. J., HAYES, R. J. and R. G. WHITE (2012). “Evaluation of Respondent-Driven Sampling”, Epidemiology, 23, 138-147. https://doi.org/10.1097/EDE.0b013e31823ac17c.
- McCULLOUGH, E. B. (2017). “Labor Productivity and Employment Gaps in Sub-Saharan Africa”, Food Policy, 67, 133-152.
- McKENZIE, D., SIEGEL, M. (2013). “Eliciting Illegal Migration Rates through List Randomization”, Migration Studies, 1 (3), 276-291. https://doi.org/10.1093/migration/mnt018.
- MERCADER, H. F. G., KABAKYENGA, J., KATURUBA, D. T., HOBBS, A. J. and J. L. BRENNER (2017). “Female Respondent Acceptance of Computer-Assisted Personal Interviewing (CAPI) for Maternal, Newborn and Child Health Coverage Surveys in Rural Uganda”, International Journal of Medical Informatics, 98, 41-46.
- OSENI, G., DURAZO, J., McGEE, K. (2017). The Use of Non-Standard Measurement Units for the Collection of Food Quantity: A Guidebook for Improving the Measurement of Food Consumption and Agricultural Production in Living Standards Surveys [Living Standards Measurement Study (LSMS)], Washington, DC: The World Bank (LSMS Guidebook).
- PAUDEL, D., AHMED, M., PRADHAN, A., DANGOL, R. L. (2013). “Successful Use of Tablet Personal Computers and Wireless Technologies for the 2011 Nepal Demographic and Health Survey”, Global Health: Science and Practice, 1 (2), 277-284.
- PHÉLINAS, P. (2010). « Mesurer l’emploi, le chômage et le sous-emploi rural dans une économie en voie de développement », Revue française de socio-économie, (1), 103-121.
- PHILLIPS, A. E., GOMEZ, G. B., BOILY, M.-C., GARNETT, G. P. (2010). “A Systematic Review and Meta-Analysis of Quantitative Interviewing Tools to Investigate Self-Reported HIV and STI Associated Behaviours in Low- and Middle-Income Countries”, International Journal of Epidemiology, 39, 1541-1555. https://doi.org/10.1093/ije/dyq114.
- REARDON, T. and P. GLEWWE (2000). “Agriculture”, in M. Grosh and P. Glewwe (Eds.), Designing Household Survey Questionnaires for Developing Countries: Lessons from 15 Years of the Living Standards Measurement Study, Washington, DC: The World Bank, 2, Chap. 19, 139-181.
- ROSENFELD, B., IMAI, K., SHAPIRO, J. N. (2016). “An Empirical Validation Study of Popular Survey Methodologies for Sensitive Questions: Validation of Survey Methodologies for Sensitive Questions”, American Journal of Political Science, 60, 783-802. https://doi.org/10.1111/ajps.12205.
- SANDEFUR, J., GLASSMAN, A. (2015). “The Political Economy of Bad Data: Evidence from African Survey and Administrative Statistics”, The Journal of Development Studies, 51, 116-132. doi:10.1080/00220388.2014.968138.
- SMITH, L. C., DUPRIEZ, O., TROUBAT, N. (2014). “Assessment of the Reliability and Relevance of the Food Data Collected in National Household Consumption and Expenditure Surveys”, IHSN Working Paper No. 008, International Household Survey Network, FAO. http://www.ihsn.org/sites/default/files/resources/IHSN_WP008_EN.pdf.
- TOURANGEAU, R., YAN, T. (2007). “Sensitive Questions in Surveys”, Psychological Bulletin, 133 (5), 859-883.
- UNITED NATIONS STATISTICAL DIVISION (2008). Designing Household Survey Samples: Practical Guidelines (Vol. 98), New York: United Nations.
- YAN, T., TOURANGEAU, R., McALOON, R. (2015). A Meta-Analysis of Within-Household Respondent Selection Methods on Demographic Representativeness. 2015 Federal Committee on Statistical Methodology. https://nces.ed.gov/fcsm/pdf/H3_Yan_2015FCSM.pdf.
Mots-clés éditeurs : erreurs de mesure, biais d’enquête, questionnaire, échantillonnage
Date de mise en ligne : 05/07/2019.
https://doi.org/10.3917/edd.323.0121Notes
-
[1]
Les programmes d’enquêtes démographiques et de santé (Demographic and Health Surveys) financés par l’Agence des États-Unis pour le développement international (USAID) et les programmes dédiés à la mesure des niveaux de vie (Living Standards Measurement Study) mis en œuvre par la Banque mondiale ont démarré au début des années quatre-vingt.
-
[2]
Cet article aborde la qualité des données produites par les agences statistiques des pays et/ou collectées dans le cadre de programmes de recherche dont l’objectif est de comprendre le processus de développement et/ou suggérer des orientations pertinentes de la politique économique. Il ne traite pas de la qualité des données collectées par des organismes privés destinées à informer les entreprises sur l’environnement des affaires et à évaluer les opportunités d’investissement dans tel ou tel pays. Couvrir ce champ nécessiterait des investigations spécifiques et sortirait du cadre imparti à notre article.
-
[3]
Un système d’information géographique intègre, stocke et affiche des informations de type spatial. Les applications et logiciels associés aux SIG sont des outils permettant d’analyser l’information contenue dans le SIG et de la représenter sous forme de cartes.
-
[4]
Nous citerons, entre autres, le projet « what3words » pour les risques d’inondation (https://what3words.com/partner/ambiental).
-
[5]
Voir sur ce point les projets d’Open Street Map (https://www.openstreetmap.org) ou encore Map & Jerry (https://urbacot.hypotheses.org/category/travaux-de-recherche/mapjerry). Nous citerons également le réseau international des habitants des bidonvilles (SDI) (http://knowyourcity.info/who-is-sdi/about-us/).
-
[6]
Par exemple, si un répondant dit ne pas consommer un aliment, la question sur la quantité consommée de cet aliment ne sera pas affichée. A l’inverse, le module éducation ne sera activé que si l’enfant du répondant fréquente actuellement l’école. Si une question de ce module est omise (par exemple les matières enseignées) un message d’erreur s’affiche.
-
[7]
Un exemple de réponse potentiellement incohérente est lorsqu’une personne interrogée dit avoir terminé l’école secondaire mais ne sait pas lire. Une réponse est impossible lorsqu’un membre du ménage est marié à un autre membre du ménage qui est célibataire, ou lorsque les enfants ont moins de douze ans d’écart avec leurs parents.
-
[8]
Par exemple, dans un module sur les usages du temps, le nombre total d’heures par jour est bloqué à 24.
-
[9]
Par exemple, une erreur est générée si le sexe d’un membre du ménage est déclaré différent de celui de l’enquête précédente ou si l’âge déclaré ne correspond pas à l’âge plus le nombre d’années écoulées depuis l’enquête précédente.
-
[10]
Les horodatages enregistrent l’heure précise de début et de fin d’un entretien, ou d’une partie de l’entretien correspondant à certains modules ou questions. Dans la plupart des logiciels, l’horodatage ne peut pas être modifié par les enquêteurs, ce qui empêche toute manipulation. Les horodatages sont utiles pour vérifier le comportement des enquêteurs. Par exemple, la comparaison de la durée des entrevues d’un enquêteur par rapport à la durée moyenne globale décèle des entrevues précipitées, qui n’ont pas été menées jusqu’à leur terme ou qui contiennent des données fabriquées. Inversement, de longues entrevues peuvent signifier que les répondants comprennent difficilement les questions.
-
[11]
Le mode d’interrogation joue dans ce cas un rôle essentiel. Les études de Arthi et al. (2018) et Gaddis et al. (2019) montrent que le nombre de parcelles est sous-estimé de 47% lorsque les enquêtes sont menées en fin de cycle agricole comparativement aux visites ou aux appels hebdomadaires.
-
[12]
Voir le numéro spécial de la revue Food Policy, Special Issue: “Food counts. Measuring food consumption and expenditures in household consumption and expenditure surveys (HCES)”, Volume 72, 1-156 (October 2017).
-
[13]
Rappelons que ce problème touche également les intrants et les productions agricoles.
-
[14]
Par exemple, l’amoxicilline, qui est l’antibiotique le plus couramment utilisé pour traiter les infections bactériennes, peut être prescrit sous forme de comprimés dispersibles, gélules, suspensions.
-
[15]
Notamment en anonymisant les données personnelles (particulièrement les noms, adresses et coordonnées GPS des répondants), en utilisant des serveurs sécurisés, voire des serveurs permettant le chiffrement des fichiers.