Page précédente Table des matières Page suivante


CHAPITRE DEUX
Principes généraux

IRD/M.C. Dop

Ce chapitre met l'accent sur les possibilités d'utilisation et les limites des indicateurs, sur le processus de collecte et d'analyse des données correspondantes, sur la façon de les sélectionner, et notamment sur les compromis nécessaires entre l'intérêt de bénéficier d'une information et son coût ou sa difficulté de recueil.

Le défi de la complexité: opérer des choix

Une fréquence élevée de faibles taux d'hémoglobine, associée à une quantité insuffisante de fer utilisable dans les régimes alimentaires, peuvent constituer les indicateurs de base d'un problème d'anémie par carence en fer dans une population, pour autant qu'il y ait un consensus sur leur signification et sur les valeurs seuils utilisées. Si une option d'enrichissement en fer d'un aliment vecteur est adoptée, du fait de l'importance et de l'homogénéité du phénomène dans la population, quel que soit l'âge ou le sexe, la mesure répétée des mêmes indicateurs et leur comparaison soit aux valeurs antérieures, soit à des valeurs de référence internationales, permettront de juger de l'efficacité de la mesure.

Il est probable, néanmoins, qu'il faudra inclure en outre toute une série d'indicateurs sur l'état de santé, la fréquentation des systèmes de soins, les modes de consommation et les disponibilités alimentaires, ou encore les circuits de fabrication et de distribution, pour pouvoir cerner l'ensemble du problème, ses causes, ses solutions éventuelles et évaluer les actions entreprises.

Nature des indicateurs

Les indicateurs de la situation nutritionnelle

Des indicateurs d'état:

Les priorités d'action en nutrition doivent être définies sur la base d'informations pertinentes concernant en premier lieu l'état nutritionnel de la population.

Ces informations vont être fournies par des indicateurs d'état permettant de caractériser chaque type de malnutrition, qu'on reliera ensuite aux caractéristiques de personnes, de temps et de lieux, afin d'avoir une indication du niveau de risque des différents groupes de la population et de dégager ainsi une vision globale de la situation.

La situation nutritionnelle: définir des priorités d'action

  • Qui souffre de malnutrition? (en termes d'âge, sexe, catégorie socio-professionnelle, etc.),

  • De quelle nature est cette malnutrition? (déficit global en énergie, carences en nutriments particuliers, gravité de la situation, etc.),

  • Quand? (de façon temporaire, saisonnière ou annuelle; récurrente ou non; de façon chronique),

  • Où sont ces personnes malnourries? (zones agro-écologiques ou administratives les plus à risque: quartiers, régions, etc.).

Il est difficile de définir de manière précise l'état nutritionnel d'une personne, a fortiori d'une population. Il s'agit d'un concept global que l'on ne peut appréhender qu'au travers d'une série de caractéristiques cliniques, physiques ou fonctionnelles qui peuvent constituer autant d'indicateurs potentiels si on leur attribue une valeur seuil permettant de séparer les individus malnourris des bien-nourris. Ce travail a été réalisé - et fait l'objet d'un consensus - principalement dans les domaines de la malnutrition des enfants et des adultes, et de trois micronutriments dont les carences sont largement répandues et dont les conséquences sont graves sur le plan de la santé des individus (vitamine A, iode et fer).

On procède d'abord à la mesure des paramètres ou indices correspondants au niveau individuel (par exemple poids, tour de bras, taux d'hémoglobine, etc.). Puis on exprime l'information, à l'échelle du groupe de population concerné, sous la forme de taux de prévalence, c'est-à-dire de pourcentages d'individus bien- ou malnourris pour la forme de malnutrition considérée, en fonction des seuils choisis. Par exemple: % d'enfants d'âge préscolaire ayant un indice 'poids-âge' <-3 Z-scores ou <-2 Z-scores; ou % d'adultes ayant un indice de masse corporelle <18,5, ou <16,0 kg/m2, etc.

L'utilisation et l'interprétation de ces indicateurs d'état sont actuellement bien établies. Pour autant, il est prudent de s'adresser à un spécialiste pour leur choix comme pour leur interprétation, ces indicateurs reflétant par exemple selon les cas un risque probable (simple déviation par rapport à une norme) ou un risque avéré (déficit fonctionnel reconnu) de carence en un nutriment, ou encore une histoire récente ou ancienne, aiguë ou chronique, de malnutrition (maigreur, retard de croissance en taille, chez le jeune enfant). Certains sont peu utiles au niveau individuel, mais très utiles au niveau de la population. Enfin certains indicateurs seront plus utiles que d'autres pour prévoir le bénéfice d'une intervention éventuelle.

Des indicateurs des causes:

Une fois que l'on connaît l'état nutritionnel de la population et sa répartition géographique ou socio-économique, et que l'on s'est fixé des objectifs d'amélioration, il est nécessaire d'avoir des informations sur les déterminants de cette situation; c'est-à-dire sur les facteurs, événements ou caractéristiques susceptibles de conditionner à un niveau quelconque l'état nutritionnel des individus au sein de cette population. Il sera alors possible de définir une stratégie d'action visant à modifier un certain nombre de ces facteurs pour améliorer la situation dans le sens des objectifs fixés.

La plupart des Grandes Réunions Internationales depuis les années 1990 se réfèrent au même cadre général d'analyse des différents types de causes, et à une classification en fonction du niveau d'intervention (ACC/SCN, 2000). Si les causes immédiates sont en général une insuffisance quantitative ou qualitative de la ration alimentaire ou une maladie, habituellement d'origine infectieuse, ces événements sont bien évidemment reliés à une cause eux aussi; de proche en proche, ce sont de véritables 'chaînes de causalité' que l'on met en évidence.

On peut simplifier la classification de ces enchaînements de causes en trois grandes catégories:

a) l'insécurité alimentaire

Dans cette première catégorie, on inclut les problèmes de production ou d'approvisionnement alimentaires au niveau du pays, des régions et des ménages et les problèmes d'accès des familles et communautés à des produits alimentaires de bonne valeur nutritionnelle, notamment en termes de pouvoir d'achat. Ce secteur comprend un éventail très large d'indicateurs potentiels dans les domaines de la production agricole, de la commercialisation et de la consommation alimentaires. Un certain nombre font l'objet d'un recueil régulier dans le cadre des systèmes d'information des ministères de l'agriculture et du commerce.

b) l'hygiène du milieu, l'accès aux services de santé

Les aspects d'hygiène du milieu font appel à la fois à l'approvisionnement en eau et en produits alimentaires sains, à l'assainissement du milieu sous toutes ses formes, et aux modes de vie des populations elles-mêmes; les aspects 'santé' incluent le secteur des maladies infectieuses et parasitaires d'une part, celui des systèmes de santé et de leur fréquentation d'autre part. En général, les différents services du ministère de la santé procèdent au recueil des indicateurs correspondants; un certain nombre ont constitué la base des systèmes d'information sanitaire mis en route dans le cadre de l'application de la politique des soins de santé primaire depuis les années 1980, et remis à jour en 1996 (WHO, 1981; 1996 b).

c) soins et prise en charge

La notion de soins ('caring') et la capacité de prise en charge concernent aussi bien la prise en charge au niveau familial, que les aspects plus larges de la solidarité et de la protection sociales au niveau des communautés ou au niveau national. Cela recouvre ainsi l'ensemble des soins maternels et infantiles, mères et enfants constituant les principaux groupes à risque; mais également les attitudes et pratiques des membres du ménage ou de la communauté vis à vis des plus vulnérables sur le plan social (temps disponible, répartition alimentaire, soutien affectif et matériel) et le niveau d'éducation des pourvoyeurs de soins en général. Les indicateurs de ce type ne sont pas souvent recueillis de manière régulière ni facilement accessibles, quand ils existent, à un niveau central bien identifié. De fait, il faut, la plupart du temps, compléter l'information disponible par des enquêtes spécifiques auprès des communautés, en privilégiant une approche qualitative.

Les causes les plus fondamentales de malnutrition résident cependant bien souvent hors du champ de la nutrition et des éléments de causalité que l'on vient de passer brièvement en revue: elles sont liées naturellement aux niveaux de ressources potentielles des pays (ressources énergétiques, climat), mais aussi à tous les facteurs qui en conditionnent l'utilisation, comme par exemple la gestion de la densité de population par rapport aux ressources disponibles, la pauvreté, les inégalités sociales, les effets secondaires des politiques macro-économiques de croissance ou d'ajustement structurel, les migrations vers les villes, etc. Il est donc nécessaire d'inclure également, dans toute analyse causale d'une situation nutritionnelle à un niveau national, des indicateurs agro-écologiques et socio-économiques fondamentaux. Ils sont en général disponibles auprès des services des grands ministères, du Plan notamment.

Pour le suivi des politiques et programmes de nutrition

A partir d'une évaluation actualisée de la situation nutritionnelle du pays, et au vu des différentes causes de malnutrition identifiées à tous niveaux, les politiques de nutrition ont pour fonction de fixer des priorités, de les traduire en objectifs généraux, puis en stratégies et programmes ayant chacun des objectifs spécifiques.

La figure ci-dessus, initialement élaborée au sein du Fonds des Nations Unies pour l'Enfance (UNICEF, 1990), puis endossée par de nombreux experts et reprise depuis par l'ensemble des organisations internationales, illustre de façon schématique l'articulation générale des ensembles de causes qui sous-tend généralement l'analyse conceptuelle de la «sécurité nutritionnelle» (c'est-à-dire la sécurisation d'un bon niveau nutritionnel par la maîtrise des différentes causes de malnutrition, notamment les causes sous-jacentes); cette analyse doit cependant être réalisée de façon plus spécifique pour chaque situation locale, ainsi que le choix des indicateurs appropriés correspondant à chaque niveau de causes et à chaque secteur.

L'établissement d'un programme consiste à définir quelles ressources matérielles et humaines il va falloir mobiliser, de quelle façon, pour faire quoi, et comment en définitive cela va modifier la situation de départ. Le suivi de ces Politiques et programmes va donc faire appel à trois types distincts d'évaluations selon qu'il s'agira de suivre l'application des programmes, d'en évaluer l'impact ou de suivre les tendances de l'évolution générale de la situation nutritionnelle.

a) suivre l'application d'un programme

Il est question ici d'une évaluation des procédures; c'est-à-dire qu'on évalue le degré de réalisation des objectifs opérationnels[4]. Pour être sûr en effet qu'un programme ait contribué à changer une situation, il faut d'abord être certain que le programme ait fonctionné selon le protocole prévu. Cette évaluation repose sur des indicateurs d'application de l'intervention élaborés dès la conception du programme, et dont on vérifie à chaque étape qu'ils sont atteints, partiellement ou en totalité.

Tout programme d'intervention se compose d'une série d'opérations ayant un but spécifique. A chacune de ces opérations va correspondre un ensemble d'indicateurs permettant d'évaluer la quantité ou la qualité de l'opération effectuée.

Indicateurs d'application d'un programme d'éducation

Dans le cadre d'un programme destiné à promouvoir des modes de vie et d'alimentation sains, un pays a décidé la mise en place d'un certain nombre d'activités de production de matériel de formation et de campagnes d'éducation. Les indicateurs d'application définis ont porté sur: le nombre et la qualité de matériels éducatifs produits dans ce domaine, le nombre d'ateliers de formation effectués et de formateurs ainsi recrutés, le nombre de campagnes de promotion réalisées, d'associations mises en place, de rapports de situation produits par les responsables tout au long de l'exécution du programme, etc.

Ces indicateurs peuvent concerner le taux de couverture de la population cible par le programme, le nombre de séances de formation mises en place, le pourcentage de ménages ayant bénéficié de l'accès à tel ou tel service créé pour eux, etc.

En général ces indicateurs sont concrets, et faciles à identifier dès lors que les tâches à accomplir dont ils rendent compte ont été correctement définies; ils sont totalement dépendants des aspects opérationnels spécifiques de chaque programme et ne peuvent donc être définis indépendamment, à l'avance, et selon un canevas très général. Il est fait un large usage d'indicateurs qualitatifs dans la mesure où ce n'est pas seulement le niveau des activités mais leur qualité qui est aussi mesurée. Il ne sera pas directement question ici de ce type d'évaluation ni des indicateurs d'application correspondants.

b) évaluer l'impact d'un programme

On utilise là des indicateurs de résultats; ils vont mesurer la capacité du programme à modifier la situation, ainsi que ses éventuels effets indésirables, prévus ou non. Il peut s'agir des résultats intermédiaires correspondant à chaque étape, comme du résultat final du programme.

L'évaluation d'un programme repose sur une comparaison chronologique des indicateurs, avant et après la mise en oeuvre du programme. Cependant, à moins de programmes très spécifiques et très ciblés, l'interprétation peut être difficile, car d'autres facteurs que ceux apportés ou modifiés par le programme ont pu varier dans le même temps et contribuer à l'effet apparent du programme.

Si les conditions fluctuent au cours du temps (changement des conditions climatiques, production alimentaire variant d'une année sur l'autre), si les mesures sont effectuées à des intervalles de temps très longs, ou si l'intervention projetée est de nature générale, il devient d'autant plus difficile d'attribuer les effets observés au seul programme.

Des indicateurs de résultats

Dans le cadre d'un programme visant à diminuer la fréquence de la malnutrition, l'analyse du contexte a révélé que les maladies diarrhéiques représentaient l'un des principaux facteurs associés. Un sous-programme a donc été mis en place pour diminuer l'incidence des maladies diarrhéiques chez les jeunes enfants. L'une des composantes en était l'utilisation de solutions de réhydratation par voie orale à domicile (SRO); l'autre comportait une campagne d'information sur les aménagements à réaliser en matière d'hygiène du milieu.

Un des effets indésirables que devait évaluer le programme était le risque d'utilisation de solutions de réhydratation préparées de façon non conforme ou dans de mauvaises conditions. Les indicateurs choisis étaient le taux d'utilisation des SRO et le taux de SRO non conformes. Concernant la modification de l'hygiène du milieu et ses conséquences, le programme a décidé d'enregistrer des indicateurs portant sur: l'amélioration des connaissances sur la relation entre hygiène du milieu et maladies diarrhéiques, les possibilités d'aménagement du milieu et les modifications de comportement correspondantes (cours cimentées, récipients avec robinets, utilisation de savon, nombre de latrines construites, etc.). Comme indicateurs de résultat final on a retenu les modifications obtenues en terme d'état de santé (modifications du taux d'incidence des diarrhées par enfant et par an, amélioration des indicateurs de l'état nutritionnel des jeunes enfants).

Si le programme consiste en la généralisation d'une intervention dont l'efficacité a été prouvée par ailleurs, sur le plan expérimental, l'interprétation causale en est simplifiée. S'il repose sur des hypothèses fortes mais non encore vérifiées, il est plus difficile de lui attribuer automatiquement les effets observés[5]. Dans la mesure, toutefois, où des indicateurs des différents facteurs susceptibles d'intervenir ont été enregistrés avant et après la réalisation du programme, on peut utiliser au cours de l'analyse des méthodes statistiques d'ajustement pour améliorer l'interprétation; d'où l'importance de recueillir ces indicateurs complémentaires.

On peut, ensuite, procéder à une comparaison entre deux zones, l'une avec application du programme, l'autre non (groupe témoin externe). Cela pose alors le problème de la comparabilité initiale des deux zones: là encore, il sera utile de recueillir un certain nombre d'indicateurs du niveau de risque pour vérifier de manière suffisamment approfondie cette comparabilité. Alternativement, on peut comparer deux zones avec un niveau d'application inégal du programme (groupe témoin interne), ou plus simplement encore, comparer des groupes d'individus ou de ménages qui n'ont pas bénéficié au même niveau du programme, le niveau d'atteinte des individus-cibles par les programmes étant en général variable.

Dans l'idéal, on procède selon un schéma de type expérimental, avec tirage au sort des individus ou des zones qui seront ou non soumis à l'intervention. C'est en effet la façon la plus rigoureuse de procéder pour conclure à l'effet propre d'un programme d'intervention. Mais il est généralement impossible d'utiliser un tel protocole expérimental soit par suite de l'hétérogénéité de la population cible et de sa taille, soit à cause de la complexité du projet, soit encore pour des raisons d'éthique, de contraintes de temps ou d'argent, ou plus simplement du fait de risques élevés de 'contamination' par des éléments du programme entre zones très proches.

De fait, dans la plupart des cas on se contentera d'une évaluation de l'effet brut, qui permette de juger de l'adéquation du programme aux objectifs, ce qui peut être considéré comme suffisant par les responsables. On pourra rechercher les éléments qui permettent de formuler une hypothèse vraisemblable de causalité de cet effet, mais sans en rechercher la preuve absolue, là encore un jugement de plausibilité de l'efficacité du programme pouvant apparaître suffisant aux responsables. De ce point de vue, une évaluation reposant sur des mesures répétées aura plus de poids qu'une évaluation avant/après reposant sur deux seules mesures assez éloignées.

Interventions spécifiques vs Programmes généraux

Le Vietnam a mis en oeuvre en 1992 une stratégie nationale de supplémentation en capsules de vitamine A au niveau des dispensaires pour lutter contre la xérophtalmie. Une évaluation, réalisée trois ans plus tard, a constaté que le taux de couverture des populations à risque par le programme était très élevé, et elle n'a pas mis en évidence par ailleurs de cas cliniques de xérophtalmie sur un échantillon d'enfants préscolaires représentatif au niveau national. Dans ce cas, il fait peu de doute que le résultat soit directement lié au programme, même si l'évaluation ne peut le prouver de façon formelle: on voit mal les facteurs autres qui auraient pu conduire à un tel résultat dans un laps de temps aussi court, dans un domaine aussi spécifique et si peu sujet à évolution favorable spontanément. La plausibilité est ici très forte.

En revanche, à la même époque, dans un autre pays, un programme d'amélioration de la sécurité alimentaire des ménages a été mis en place, comprenant un certain nombre de mesures comme le soutien des prix payés aux producteurs pour les principaux produits vivriers et une réorganisation des marchés locaux, en fonction de faiblesses identifiées préalablement. L'évaluation de ce programme après plusieurs années de fonctionnement a permis d'observer une légère amélioration de la situation; mais dans le même temps, par suite d'une amélioration des conditions économiques générales du pays, de nombreux autres indicateurs ont également progressé: en l'absence d'un protocole rigoureux d'évaluation, il est difficile de se prononcer sur la part qui peut être attribuée au programme et sur celle qui peut être attribuée aux autres facteurs.

Ces éléments seront utiles chaque fois qu'il faudra décider si le programme doit être poursuivi ou arrêté: on établira un faisceau d'éléments convergents, basé sur les indicateurs disponibles, pour conclure ou non à la plausibilité de son efficacité.

Souvent, pour des raisons budgétaires, un programme ne peut être appliqué d'emblée dans la totalité des zones ciblées; celles-ci seront incorporées progressivement dans le programme. Le relevé des indicateurs nécessaires pourra cependant être réalisé avantageusement dans toute ces zones dès le départ; on bénéficiera ainsi d'éléments de comparaison à la fois entre zones sous- et hors programme et avant- et après programme, qui permettront de renforcer toute recherche de plausibilité de l'efficacité de cette intervention. La mesure de la durabilité en sera par ailleurs facilitée (mesure simultanée de l'effet dans des zones ayant bénéficié du programme pour des durées de plus en plus longues).

L'intérêt de l'évaluation n'est pas seulement de vérifier l'impact, mais aussi de permettre d'adapter le programme à des conditions qui changent.

Réorienter les programmes

Un programme d'alerte précoce sera évalué avant tout sur sa capacité à prévenir l'aggravation des conséquences des crises alimentaires chez les groupes de population les plus à risque; il comportera de ce fait un certain nombre d'indicateurs sur les stratégies mises en oeuvre selon le degré de précarité, sur les niveaux de consommation alimentaire et sur l'état nutritionnel de ces groupes par exemple. Mais il comportera également des indicateurs permettant de juger si la situation n'évolue pas vers un état plus stable (amélioration des conditions climatiques ou de la production alimentaire par exemple) afin d'être à même de réorienter l'objectif premier du programme s'il devient caduc.

c) suivre l'évolution générale de la situation nutritionnelle

En matière d'évaluation d'interventions, on distingue en pratique les résultats qui sont directement liés à l'effet d'un programme et l'impact plus large du programme, qui comprend les effets indirects également induits sur la population ciblée, voire la population tout entière, en termes d'état de santé et de conséquences économiques et sociales.

Si, au niveau d'un programme isolé, on peut s'attacher plus spécifiquement à son effet propre, dans le cadre du suivi global d'une politique ou d'un ensemble de programmes, c'est l'impact de l'ensemble qui fera l'objet d'une évaluation régulière. Et celle-ci ne visera pas tant à faire la preuve de l'efficacité de tel ou tel programme qu'à vérifier si la situation évolue globalement dans le sens voulu, compte tenu des circonstances externes et des programmes en activité.

Outre la mesure du chemin parcouru, à intervalles réguliers, ce sera également l'occasion de vérifier que l'analyse conceptuelle qui a présidé au choix des différentes stratégies est toujours actuelle, ou de constater qu'il faut réorienter les activités.

Le but étant d'examiner l'évolution de la situation par rapport aux objectifs généraux assignés à la politique adoptée, il s'agira en pratique du recueil régulier d'un certain nombre d'indicateurs de niveaux de risque et de causes, et de grands indicateurs fondamentaux, à l'usage des planificateurs du pays et des agences ou des bailleurs de fonds internationaux, et de l'établissement de tendances. Cela correspond à l'une des neuf stratégies proposées dès 1992 dans le cadre du Plan d'action de la CIN, repris par nombre de plans nationaux d'action en nutrition dans les pays depuis: «évaluer, analyser et surveiller la situation nutritionnelle». Il s'agit en fait de la mise en place d'un véritable système de surveillance nutritionnelle[6] appliquée à la planification.

Ces plans nationaux ont des objectifs généraux explicites, avec un ordre de grandeur des réductions attendues des taux de malnutritions ou des améliorations de la situation prévues dans tel ou tel secteur.

Les plans nationaux d'action: des objectifs quantifiés

  • A l'issue de son plan, l'Equateur, comme d'autres pays, envisage d'atteindre les objectifs suivants dans le domaine de l'amélioration de l'état nutritionnel de sa population:

  • réduire l'incidence actuelle des faibles poids de naissance (<2500g) de 50% dans les zones urbaines, et de 30% dans les zones rurales;

  • éliminer presque complètement la prévalence de l'insuffisance pondérale sévère (poids-âge <-3 Z-scores), réduire de 50% la prévalence actuelle des formes modérées (poids-âge entre - 1 et -3 Z-scores), et réduire de 80% toute forme marginale à modérée d'insuffisance pondérale chez les enfants de moins de 5 ans qui suivent les programmes de prise en charge ambulatoire de centres de renutrition;

  • réduire de 80% la prévalence actuelle des anémies nutritionnelles chez les femmes enceintes et les enfants de moins de deux ans qui fréquentent les services publics de santé; maintenir en dessous de 10% la prévalence des troubles dus à la carence en iode; éliminer virtuellement la carence en vitamine A chez les enfants de moins de 5 ans;

  • promouvoir et garantir une consommation suffisante de calcium pour toutes les femmes enceintes qui fréquentent les consultations prénatales, et améliorer l'attention portée à l'alimentation et à la nutrition des personnes hospitalisées.

Les objectifs seront d'autant plus explicites et réalistes que l'on disposera d'une «ligne de base» récente et d'une idée de la rapidité de l'évolution des phénomènes, antérieurement, ou dans des pays voisins ou ayant des contraintes similaires.

On ne peut toutefois attendre de disposer d'une ligne de base très complète pour planifier des actions; on peut commencer en se basant sur les seules données existantes dans les différents services, ou sur des enquêtes réalisées rapidement et de manière ponctuelle quand il n'existe aucune donnée pour un problème précis jugé important.

Cependant la mise en place d'une politique doit être l'occasion de mettre également en place un système de suivi - au minimum des principaux indicateurs d'état et de causes des malnutritions, que l'on mettra en perspective avec les grands indicateurs agro-écologiques et socio-économiques - afin de disposer d'un 'tableau de bord' permanent de la situation et de son évolution dans le temps.

Un tableau de bord nutritionnel

Après analyse, un pays considère que la prévalence de faibles poids de naissance est trop élevée et que l'objectif de réduction de l'incidence des faibles poids de naissance implique: (i) un renforcement du fonctionnement des services de consultations prénatales, (ii) la promotion d'une meilleure alimentation des futures mères, soit par une meilleure utilisation de l'alimentation locale, soit par des distributions spécifiques d'aliments de complément, (iii) et une incitation par diverses mesures à une diminution de la charge de travail des femmes enceintes.

Les mesures précises à prendre et leur quantification éventuelle en termes d'objectifs intermédiaires dépendent naturellement des spécificités du pays. Le suivi de ces mesures en termes d'indicateurs d'application reposera sur une appréciation quantitative et qualitative du niveau de fonctionnement des services concernés (nombre de rations distribuées ou nombre de personnes qui ont fréquenté ces services, % de services qui ont prodigué des conseils et des soins de qualité adéquate aux femmes enceintes, qualité des rations distribuées, niveau de suivi des conseils et soins par les bénéficiaires, etc.). Les indicateurs de résultat du programme pourront reposer sur l'évolution des mesures de fréquence de consommation de certains aliments par les femmes qui fréquentent les services, ou sur l'évolution du poids moyen de naissance et de l'incidence du faible poids de naissance (<2500g) dans la population ciblée.

La surveillance générale de l'évolution démographique, sanitaire, alimentaire et nutritionnelle de la population permettra d'apprécier l'impact global du programme et la nécessité de le poursuivre, de le redimensionner ou de le modifier complètement, pour espérer atteindre les objectifs généraux de réduction de 50% de l'incidence des faibles poids de naissance, sur une durée de cinq années par exemple, dans le contexte global de l'évolution du pays.

Qualités des indicateurs

Les indicateurs n'ont pas tous la même valeur. Celle-ci dépend en théorie de leur capacité à refléter au mieux la réalité, plus ou moins complexe, que l'on cherche à cerner; un compromis devra ensuite être trouvé en fonction de la facilité à les établir.

On caractérise donc classiquement les indicateurs par un certain nombre de propriétés qui permettent d'apprécier cette valeur, au moins dans un contexte donné. Il est évident qu'ils ne réunissent pas tous, toutes les qualités d'un bon indicateur; à l'heure du choix, on devra alors décider de celle(s) qu'on privilégie.

Qualités intrinsèques

Pour rendre compte de «l'état nutritionnel», on ne dispose pas d'indicateur global; il va donc falloir préciser quel aspect de l'état nutritionnel on veut caractériser: statut énergétique, protéique, en fer, en vitamine A, etc. Mais même dans le cas du statut énergétique, par exemple, il n'y a pas d'indicateur synthétique disponible; on va donc rechercher l'indicateur le plus pertinent pour l'aspect que l'on veut privilégier: statut physique, biochimique, fonctionnel, etc. Dans le cadre de la mesure de la situation nutritionnelle globale d'une population, on a retenu par convention un ensemble de mesures physiques individuelles, qui rapportées à des valeurs de référence permettent de dire dans quel état nutritionnel sont les individus (ou la population dans son ensemble), et constituent le corpus d'indicateurs pertinents à utiliser de préférence à tout autre. Il faut cependant être conscient, lors de l'utilisation de ces indicateurs de leur limite de validité: ils apportent une information synthétique sur le statut nutritionnel, mais ils n'en représentent pas tous les aspects.

Dans le domaine de la «sécurité alimentaire», qui est, là encore, un concept très large, difficile à traduire simplement, il existe un nombre considérable d'indicateurs reflétant chacun un aspect particulier; ils seront pertinents pour cet aspect, pas forcément pour les autres. Ainsi pour décrire le niveau d'insécurité alimentaire d'un ménage, un indicateur reposant sur un critère quantitatif de consommation alimentaire ou un critère qualitatif de perception par le ménage de sa propre situation d'insécurité alimentaire seront plus pertinents qu'un indicateur de prix des denrées sur le marché local.


RISQUE OU CARACTÉRISTIQUE:

CALCUL:


PRÉSENT(E)

ABSENT(E)


indicateur +

a

b

sensibilité = a/(a+ c)

indicateur -

c

d

spécificité = d/(b+ d)

indicateur + ou -: la valeur de l'indicateur est au-dessus ou en dessous de la valeur seuil fixée pour apprécier le risque.

La sensibilité d'un indicateur anthropométrique comme l'IMC (indice de masse corporelle, ou poids/taille2) pour dépister les individus effectivement maigres va varier en fonction du seuil retenu: plus ce seuil sera élevé, meilleure sera la sensibilité (mais la spécificité, par contre, diminuera). De même, la sensibilité se mesure pour un objectif donné; ainsi la sensibilité d'un indicateur comme le poids-taille à un seuil donné, ne sera pas la même selon qu'il s'agit de définir les enfants maigres ou ceux qui sont à risque de décéder dans les mois qui viennent.

En outre le rendement, c'est-à-dire la capacité à repérer un pourcentage important d'individus malnourris, pour une même sensibilité de l'indicateur choisi, va dépendre de la prévalence de la malnutrition dans la population.

Il n'est pas toujours possible de disposer des éléments permettant de calculer rapidement ces paramètres (sensibilité, spécificité); aussi, en pratique, on se rapporte aux données existantes dans la littérature en essayant de trouver celles qui se rapprochent le plus des seuils choisis, et des prévalences attendues.

Un aspect particulier de la sensibilité est l'aptitude d'un indicateur à marquer le changement, non plus pour décrire ou cibler une catégorie particulière d'individus comme précédemment, mais pour rendre compte du moindre changement qui s'opère dans le phénomène décrit, de manière significative. Si la sensibilité, en général, est importante lors du choix d'indicateurs pour établir une ligne de base, et définir les groupes cibles sur lesquels vont porter les activités, cette aptitude à marquer le changement est capitale pour toute évaluation ou suivi de tendances. Il est indispensable d'évaluer la capacité de tout indicateur à mesurer l'évolution de la situation qui se produit au cours de l'application du programme.

Sensibilité aux changements

On fait parfois usage de l'indicateur 'circonférence du bras' chez les jeunes enfants à la place de l'indicateur 'poids-taille' pour décrire l'état nutritionnel de la population, car il est plus rapide à mesurer, facile à interpréter, et, bien que moins précis, possède une sensibilité proche dans ce cadre descriptif. Il est donc utile dans les situations d'urgence, pour un dépistage rapide. Mais cet indicateur est relativement inerte dès lors qu'il faut apprécier des changements réguliers, mais modestes, de l'état nutritionnel au cours du temps. On lui préférera donc l'indicateur poids-taille, plus réactif dans ce domaine. De même, l'iodurie sera plus vite modifiée par l'introduction de sel iodé dans une région, que la prévalence du goitre, qui mettra un certain temps à diminuer.

Mais, à côté de ces qualités inhérentes aux indicateurs on peut aussi rechercher leur valeur opérationnelle, qui constituera au moment du choix un aspect essentiel, surtout si l'on est confronté à un problème de rapidité et de coût du recueil de ces indicateurs.

Qualités opérationnelles

On a constaté, parfois, que le nombre d'enfants malnourris estimé par des enquêtes nutritionnelles effectuées par diverses organisations, sur des populations identiques et aux mêmes périodes, différait de façon importante; il était exclu dans ce cas d'utiliser les résultats à des fins de ciblage ou de suivi de l'amélioration de la situation. La raison était le plus souvent le manque de précision des mesures anthropométriques ou de la définition de l'âge, parfois un problème d'échantillonnage.

Les données de consommation alimentaire obtenues par pesée des aliments sont plus précises que les données obtenues par une technique de 'rappel' auprès des consommateurs; inversement, du fait des contraintes techniques, elles s'appliquent souvent à un échantillon restreint, d'où un intervalle de confiance large des résultats. En revanche, les techniques de rappel peuvent facilement être appliquées à un échantillon important avec un intervalle de confiance évidemment plus restreint. Il faudra donc examiner attentivement les différentes données disponibles avant de les utiliser pour un suivi, et opérer parfois un choix entre des données recueillies avec une meilleure exactitude mais avec une puissance faible au niveau de la population considérée, ou l'inverse.

Le coût de la 'non-collecte': un aspect négligé

Le coût de non-collecte peut être mesuré, dans le cas d'un programme de subventions de produits alimentaires par exemple, par la différence entre le prix de revient du programme s'il est effectué sans ciblage particulier, faute d'indicateur permettant de cibler, et le prix de revient du programme pour la population cible, plus le prix du ciblage, si on souhaite a priori le concentrer sur une fraction à risque au sein de la population.

Il est cependant assez rare de disposer des coûts de revient de la collecte des données correspondant à un indicateur pour chaque situation. C'est au demeurant difficile à mesurer; on se base généralement sur le coût des différents types d'enquêtes dans le pays, une enquête permettant souvent de recueillir des données sur plusieurs indicateurs à la fois.

Sources d'information

On peut classer schématiquement les indicateurs selon le niveau auquel ils sont établis ou disponibles, de la manière suivante:

Les indicateurs disponibles au niveau central

Les indicateurs disponibles aux niveaux intermédiaires

Ils sont pour l'essentiel construits à partir de données collectées en routine (services administratifs locaux, autorités des communautés locales): ils sont généralement transmis (indicateurs ou données brutes) au niveau central et renvoyés aux niveaux décentralisés après analyse, avec plus ou moins de régularité; ils sont souvent désagrégés par district ou commune, mais pas toujours représentatifs, car se rapportant souvent aux seuls usagers des services considérés. Ils sont en général regroupés au niveau de l'administration centrale des régions ou des chefs-lieux.

Ce sont avant tout des indicateurs qui ont trait à des activités qui se prêtent à un relevé régulier, soit parce qu'ils rendent compte d'une activité (indicateurs de fonctionnement, de rendement d'un service), soit parce qu'ils sont nécessaires à une prise de décision (prévisions de récoltes, taux de chômage), soit à des fins de contrôle (prix des denrées de base sur les marchés, nombre de cas de maladies, etc.). Ils ne comportent pas forcément d'indicateurs de cause des phénomènes enregistrés; il ne s'agit pas en principe d'indicateurs qualitatifs.

Les indicateurs collectés aux niveaux décentralisés devraient répondre à la fois aux besoins d'utilisateurs situés à ces niveaux et à ceux d'utilisateurs situés au niveau central, pour la mise en oeuvre et le suivi de programmes. Si ces indicateurs compilés de façon régulière n'ont pas d'utilisation réelle au niveau local et ne sont destinés qu'au seul niveau central national, leur qualité risque de se dégrader au cours du temps faute de motivation suffisante des acteurs chargés de la collecte et de la transmission. De fait, les séries de données disponibles présentent souvent des lacunes; elles sont irremplaçables cependant pour avoir une vue claire de la situation au niveau des régions ou districts, avec des tendances à moyen terme. Leur limite est, en règle générale, le faible niveau d'intégration de données de différents secteurs.

Les indicateurs disponibles seulement à un niveau périphérique

Un certain nombre d'indicateurs, notamment ceux concernant la vie des communautés ou des ménages, et ne relevant pas de l'activité des différents services de l'état, ne sont pas établis en routine par les services, en tout cas ne sont pas déférés aux services régionaux ou centraux. Ils sont parfois issus de données collectées à intervalles irréguliers par des services municipaux, ou plus souvent par des organisations non gouvernementales, à des fins spécifiques correspondant à leur domaine d'activité: santé, hygiène, prise en charge sociale, encadrement agricole, etc.

Les capacités analytiques font souvent défaut à ce niveau; il est possible que des données brutes disponibles n'aient pas donné lieu à la production des indicateurs intéressants; il faudra alors prévoir le renforcement des capacités analytiques ou procéder périodiquement à des enquêtes par sondage sur ces données pour élaborer ces indicateurs. Une bonne connaissance des registres locaux et de leur qualité est nécessaire pour éviter une perte de temps.

Souvent, il faudra soit introduire des procédures nouvelles de collecte par des services périphériques, en veillant à ne pas les surcharger ou les détourner de leur activité, soit procéder à une collecte spécifique des données correspondantes par enquête auprès des communautés villageoises ciblées pour l'analyse ou l'intervention. Ces enquêtes sont indispensables pour connaître les situations et comportements des individus et des ménages et évaluer leur relation avec les politiques mises en place. Elles offrent en général une vision intégrée des problèmes.

Elles peuvent avoir pour but de fournir des éléments de situation et d'analyse locaux, destinés à conforter le consensus de la population et des responsables sur la situation et les actions à mettre en oeuvre, et à permettre une évaluation de leur effet. On mettra l'accent sur le côté participatif plutôt que sur la précision ou la sophistication des données. Un ouvrage de la FAO sur les projets participatifs illustre le problème de l'évaluation, et notamment le choix d'indicateurs dans le cadre de tels projets (FAO, 1994).

Si on utilise des données déjà recueillies ou si on réalise une nouvelle enquête à des fins d'utilisation à un niveau supérieur, il faut vérifier la taille et la représentativité de l'échantillon, s'assurer que ces données puissent être reliées à un ensemble plus général à partir d'indicateurs communs, recueillis dans les mêmes conditions (méthodologie, période de temps, etc.), et s'assurer qu'elles permettront éventuellement un suivi régulier (faisabilité de la collecte, transmission régulière des données). La vérification de la qualité des données revêt un aspect essentiel ici.

L'analyse des systèmes d'information existants

Prenons l'exemple d'une filière d'information sur la production vivrière utilisée pendant de nombreuses années au Brésil (Von Braun et Puetz, 1993). Ce pays avait mis en place un système d'information national mensuel sur les estimations de production concernant 35 produits végétaux, et comprenant des informations sur les intentions de culture, les surfaces effectivement plantées, les rendements et les quantités récoltées dans chaque Etat.

Les informations étaient obtenues au cours de réunions mensuelles d'experts de différents niveaux: local, régional et national. Les participants au niveau local pouvaient être des agents d'encadrement agricole, des représentants des banques, des responsables de coopératives et d'associations de paysans, et des vendeurs d'intrants ou des acheteurs de produits agricoles. On pouvait faire état aussi bien de données précises comme les surfaces mises en culture financées par le système de crédit agricole ou les chiffres de ventes de semences, mais dans un certain nombre de cas, c'est l'expérience des participants ou leurs observations de terrain qui étaient prises en compte.

Ces informations étaient ensuite agrégées au niveau de l'Etat, puis au niveau fédéral, revues par un comité national d'experts, et envoyées au bureau central de la statistique. On a affaire dans ce cas, aux différents niveaux à une information très riche, provenant de sources diverses au niveau local, sans doute assez fiables car validées par un grand nombre d'intervenants et d'experts, mais dont la précision, compte tenu de la diversité de l'information est impossible à définir.

De telles données sont d'une utilité variable selon le besoin d'information. Les données concentrées au niveau central sont probablement surtout utiles pour des analyses de tendances. En revanche, il existe au niveau local, au-delà des chiffres, une information plus globale sur le système de production, qui peut se révéler utile pour dégager des indicateurs pertinents sur les causes, ou pour effectuer un suivi de situation simplifié.

Il est profitable de dresser une liste des indicateurs (et/ou des données brutes correspondantes) utilisables par services à tous niveaux, avant d'entreprendre une collecte spécifique; il n'est pas rare de constater que des enquêtes auraient pu être évitées par une meilleure connaissance des données disponibles dans diverses sources. Pour repérer ces sources utiles d'information et juger de la qualité des données disponibles et de leur niveau de désagrégation, il est souvent indiqué de comprendre la genèse et le fonctionnement complet du système d'information sous-jacent.

Comment faire un choix d'indicateurs?

On a vu que les indicateurs sont multiples et de qualités très diverses; la disponibilité des données correspondantes n'est pas toujours assurée, et toute collecte active va entraîner des contraintes. Il faut donc faire un choix limité aux besoins réels des utilisateurs, responsables de programmes ou planificateurs. Cela nécessite de disposer d'une méthode.

Les éléments qui vont guider le choix sont notamment (i) l'utilisation d'un modèle conceptuel permanent qui relie la situation, les interventions, et les résultats attendus (ii) la disponibilité d'une 'ligne de base' (iii) les caractéristiques des indicateurs: qualités et sources à disposition.

L'intérêt d'un modèle conceptuel

Toute mise en oeuvre d'interventions repose en principe sur une analyse de la situation, une compréhension des facteurs qui la déterminent, la formulation d'hypothèses sur les programmes susceptibles d'améliorer la situation. Un cadre général a été présenté précédemment (voir Figure); il représente peu ou prou une vision causale holistique endossée par la plupart des organisations internationales et des planificateurs en nutrition. La classification commode qui en découle, par exemple en niveaux de causes immédiates, sous-jacentes ou fondamentales peut donner lieu à des développements plus élaborés, à des fins opérationnelles.

L'intérêt de la construction d'un tel modèle, au-delà de la mise à plat de l'enchaînement des phénomènes qui déterminent la situation nutritionnelle, c'est de permettre l'expression en paramètres mesurables de concepts généraux qui ne sont pas toujours très bien définis compte tenu de leur complexité. Ainsi vouloir caractériser la «sécurité alimentaire» ne suffit pas. Il faut préciser à quelle définition on se réfère parmi celles qui existent, quels sont les aspects auxquels on s'intéresse, et les paramètres correspondants.

Le concept de sécurité alimentaire est généralement perçu comme celui d'une disponibilité suffisante en nourriture pour chacun. Mais en fait plusieurs dizaines de définitions différentes ont été proposées au cours de ces quinze dernières années! Ce concept peut par exemple revêtir des aspects différents selon le niveau auquel on se rapporte: satisfaction globale des besoins au niveau d'un pays, ou satisfaction effective des besoins au niveau de tous les individus de la communauté; de même au niveau des individus, on peut se référer à la notion de 'disponibilités' adéquates ou à celle de 'l'accessibilité' de chacun aux ressources alimentaires. Dans le premier cas, l'analyse conduira à favoriser la production agricole, dans l'autre à s'attaquer de préférence à la précarité des moyens d'existence de ceux qui ne peuvent accéder à une alimentation correcte.

Cette réflexion préalable va permettre de mieux définir l'enchaînement perçu des causes (défaut de production, prix sur les marchés trop élevés, infrastructures commerciales déficientes, salaire minimum trop bas, niveau d'éducation insuffisant, etc.) et les programmes nécessaires pour remédier à la situation. Il sera alors plus aisé de considérer les indicateurs potentiels de la situation et de ses causes, ou les indicateurs potentiels de résultat des programmes.

L'utilisation de modèles conceptuels dans le contexte de la mise en oeuvre de programmes ou de la planification alimentaire et nutritionnelle n'est pas nouvelle. De nombreux exemples ont été développés concernant différents aspects. Le plus classique en est la mise en ordinogramme de la chaîne d'approvisionnement alimentaire avec la mise en relief des informations nécessaires et des indicateurs correspondants à chaque étape (FAO, FISE & OMS, 1976); on peut trouver de nombreux exemples ou utilisations de ce type (FAO, 1996; Von Braun & Puetz, 1993; Maxwell & Frankenberger, 1992; FAO, 1984 a, 1984 b, 1985).

Il est évident que ce n'est pas tant le diagramme final qui a de l'importance, que le processus au cours duquel il a été élaboré. Dans la mesure où les relations entre tous les maillons de la chaîne d'évènements (ou éléments des flux selon le type de représentation) ont été discutées pas à pas, argumentées avec des faits à l'appui, la réflexion sera adaptée à la situation locale et deviendra opérationnelle.

Des méthodologies ont été élaborées pour rendre efficace ce processus dans le contexte de la planification. C'est le cas de la méthode de «planification par objectifs» (ZOPP[7]/PPO), qui comprend une phase d'analyse des problèmes à partir d'études antérieures, afin d'identifier clairement le contexte de départ des programmes, une phase d'identification des options d'intervention possibles, une autre de définition des objectifs plus spécifiques des programmes et enfin une phase d'élaboration finale d'un cadre logique d'ensemble qui servira de 'modèle' de référence pour l'ensemble des participants. Au cours du processus, on identifiera successivement toutes les activités, les partenaires correspondants, les moyens nécessaires et les indicateurs d'application et d'évaluation des résultats. La méthode sert de fil conducteur à un travail en équipe qui favorise une analyse intersectorielle, et propose une visualisation simplifiée servant à fixer les résultats des discussions.

Prenons à nouveau l'exemple d'un problème de sécurité alimentaire; on peut le décomposer en trois secteurs déterminants: celui de la production alimentaire, celui de la transformation et de la vente des produits, et celui de la consommation alimentaire. On peut définir pour chaque secteur une série d'éléments structurels le conditionnant: pour la production, on peut considérer par exemple le capital en ressources naturelles, la structure foncière, le mode de fonctionnement des agriculteurs productifs, la qualification du personnel agricole, etc. Ces éléments influencent à la fois le niveau de production et le fonctionnement des marchés. Un certain nombre de politiques macroéconomiques ou spécifiques vont influencer un ou tous les éléments de ce bloc. On peut considérer chaque bloc de la même manière, et obtenir un début de modèle théorique de la marche du système (voir C. Mueller, in Von Braun & Puetz, 1993).

Il reste alors, pour le rendre opérationnel, à définir les indicateurs qui vont caractériser, dans le contexte considéré du pays, les éléments clefs du système, et, après avoir choisi les politiques ou programmes à mettre en place ou à renforcer, à repérer parmi ces indicateurs ceux qui sont susceptibles d'évoluer en fonction de l'impact de ces politiques ou programmes. On aura ainsi posé les bases d'un système d'information qui correspondra à la vision globale que l'on se fait du fonctionnement de l'ensemble.

Une autre méthode a encore été proposée par des chercheurs de l'Institut de Médecine Tropicale d'Anvers, à partir de leur expérience de terrain en collaboration avec différents partenaires (Lefèvre et al., 2001). Elle met essentiellement l'accent sur l'aspect participatif, le but étant d'obtenir un véritable consensus sur la situation locale, la rationalité des objectifs des interventions compte tenu de cette situation, et le choix des indicateurs nécessaires.

Elle comprend d'abord une phase d'élaboration d'un modèle causal dont le but est de fournir une compréhension des mécanismes conduisant aux situations de malnutrition dans le contexte considéré. Le modèle se construit sous la forme d'un diagramme schématique, hiérarchisé, des hypothèses causales formulées après discussions entre tous les partenaires concernés. Son mode de construction tend à privilégier une visualisation claire, 'verticale', de séries de chaînes causales, en éliminant les liaisons latérales ou les boucles qui sont souvent sources de confusion dans nombre de représentations.

Dans une deuxième phase, des tableaux mettent en regard les ressources humaines ou matérielles de départ, les procédures envisagées, les résultats d'application correspondants, et les résultats intermédiaires ou finaux attendus pour chaque programme ou activité. Cet outil est très utile pour définir tous les indicateurs nécessaires.

Enfin, la cohérence de l'ensemble des procédures définies est portée sur un 'modèle dynamique' destiné à visualiser l'organisation des hypothèses sur lesquelles reposent les programmes et à mettre en évidence les éléments convergents qui permettent d'espérer qu'ils aient un impact positif en final. C'est la formalisation d'un véritable schéma conceptuel.

Des modèles spécifiques pour chaque situation, et en évolution

Si de nombreuses représentations de modèles conceptuels comportent des éléments comparables, il est essentiel de considérer qu'un modèle n'est jamais transposable directement, puisqu'il doit absolument s'appliquer au contexte local. Une transposition directe serait alors totalement contre-productive. S'il est évident que l'analyse conceptuelle doit être réalisée avant la mise en place des programmes, dans l'idéal, elle peut cependant être réalisée ou actualisée à tous moments, introduisant une meilleure cohérence et un consensus autour des activités en cours et à venir; ce d'autant plus qu'on se place dans une perspective de durée.

En termes opérationnels, l'établissement d'un modèle conceptuel permet de définir de façon cohérente les différents types d'indicateurs utilisables à chaque niveau. Après la définition des activités à entreprendre, on définit les indicateurs de situation (groupe cible), ou des causes qui seront ou non modifiées par ces activités; on fixe ensuite les indicateurs qui reflètent le niveau ou la qualité des activités réalisées. Enfin sont retenus les indicateurs qui reflètent les changements obtenus, qu'ils soient ou non dus au programme. L'identification d'objectifs précis permet de suivre l'évolution des indicateurs de résultat non seulement par rapport à la situation de départ mais aussi en termes d'atteinte des objectifs fixés.

Au cours de cette phase initiale, on procède à un bilan des indicateurs existants et de ceux dont il faudra aller chercher les données correspondantes dans des registres ou par des enquêtes spécifiques. On définit également pour qui cette information est nécessaire et qui doit élaborer les indicateurs ou collecter les données, à chaque niveau. En effet, il est important que ce choix soit piloté par la demande, pour être sûr que les informations sélectionnées soient ensuite réellement utilisées. On peut avoir affaire à plusieurs groupes d'utilisateurs, qui n'ont pas exactement les mêmes besoins: responsables politiques et leurs conseillers, fonctionnaires aux différents niveaux de décision, y compris provinces et districts, autorités administratives locales, donateurs, universitaires, etc. On peut ainsi jeter les bases du système d'information indispensable à l'évaluation et au suivi.

Eléments de choix selon les caractéristiques des indicateurs

Utilité d'une «ligne de base»

Les données recueillies en vue de l'élaboration d'indicateurs doivent souvent être confrontées à une valeur de référence ou à une valeur seuil. Il peut s'agir d'un seuil reposant sur un consensus international, au sein de la communauté scientifique ou du monde politique, ce qui évite les polémiques quant à l'interprétation et permet des extrapolations régionales ou des comparaisons entre pays. Mais l'information n'est pas toujours suffisante cependant; d'autre part, pour plusieurs catégories d'indicateurs, de tels seuils internationaux n'existent pas. Dans ce cas on se réfère plutôt à une valeur de cette même variable à une date antérieure. C'est d'ailleurs une démarche nécessaire en cas d'évaluation. L'interprétation de l'évolution d'un indicateur ne peut se faire qu'en fonction de la connaissance que l'on a de la situation de départ; la connaissance d'une ligne de base fait donc partie de la valeur informative d'un certain nombre d'indicateurs.

Une prévalence de maigreur (poids-taille <-2Z-scores) chez les jeunes enfants dans un contexte donné ne renseigne qu'imparfaitement sur la situation: était-elle meilleure ou pire avant? La seule information qu'elle véhicule en tant que telle, c'est son écart par rapport à une situation de référence dans un pays où il n'y a pas de problème majeur de malnutrition (2,27% par définition). Sans précision sur la situation antérieure, on ne pourra pas juger de l'impact du programme.

L'existence de séries chronologiques est par exemple un élément en faveur du choix d'un type d'indicateur. Elles permettent d'interpréter rapidement les résultats en termes de tendance.

Lorsque les données antérieures sont anciennes, on recherche la possibilité d'évaluer leur niveau actuel par projection, comme c'est habituellement le cas pour les grands indicateurs démographiques ou économiques.

Dans un certain nombre de cas, la réalisation d'une enquête préalable pour établir le niveau actuel de plusieurs indicateurs, apparaît nécessaire. Nombre de pays se sont livrés, en préliminaire à l'établissement d'une politique ou d'un programme national, à des enquêtes nationales d'appréciation de la situation nutritionnelle, pour décider du type ou de l'importance du programme à mettre en place et pouvoir en évaluer l'impact ensuite. Le coût de ces enquêtes n'est pas négligeable, mais il est à comparer à celui du programme mis en place, et au coût potentiellement lié au manque d'évaluation d'un programme qui ne donne pas les résultats attendus.

Collecte et analyse

Méthodes de collecte

Lorsque la collecte «passive» de données dans les sources existantes ne permet pas d'établir les indicateurs nécessaires sous une forme appropriée, il faut envisager une collecte 'active' par enquêtes auprès de la population, à un niveau de désagrégation approprié. Ce peut être le cas aussi quand la couverture administrative de la population, particulièrement des groupes à risque, est insuffisante ou déficiente.

Types d'enquêtes

Il est d'abord important de considérer que le niveau d'échelle privilégié d'expression des indicateurs n'est pas forcément le même selon les disciplines (les individus pour l'expression de risques épidémiologiques, les ménages pour le niveau de sécurité alimentaire, des subdivisions administratives pour un économiste, etc.). Les unités statistiques de mesure des données correspondantes ne seront donc pas forcément les mêmes.

Inversement, un mode d'expression relevant de la même échelle peut être élaboré à partir de données dont l'unité statistique de mesure diffère: une donnée de consommation alimentaire exprimée en kcal/pers/jour peut être construite aussi bien à partir d'une donnée nationale divisée par le nombre d'habitants du pays, que de données moyennes mesurées par ménages et divisées par le nombre d'individus dans le ménage, que de mesures effectuées directement auprès de chaque personne. Il s'agit de trois expressions de la même situation, mais qui ne peuvent être traitées de la même manière du point de vue statistique. Dès lors qu'on analyse des données recueillies à différentes échelles, il faut en tenir compte.

Selon le type d'indicateurs requis, on utilisera des techniques d'enquêtes quantitatives ou qualitatives, chacune procédant de méthodologies particulières.

Pour le recueil de données sur l'état nutritionnel en population par exemple, l'OMS et la FAO ont édité des guides fournissant toute la marche à suivre pour l'échantillonnage, la collecte et l'interprétation des mesures anthropométriques lors d'enquêtes transversales (OMS, 1983; FAO, 1992). Comment apprécier la qualité des données ainsi recueillies a été exposé par le projet LSMS (Kostermans, 1994). Il existe de même un guide pour les principaux types d'enquêtes sur la consommation alimentaire (Cameron et van Staveren, 1988) et des ouvrages sur les indicateurs de la sécurité alimentaire des ménages et leur mesure (Maxwell et Frankenberger, 1992; Delaine et al., 1992). Des méthodes appropriées ont encore été mises au point dans les domaines de la démographie et de la santé (WHO, 1981), ou de l'économie, pour établir grossièrement des indicateurs lorsque la plupart des sources habituelles font défaut.

Quantité versus variété?

Deux tendances classiques s'affrontent inévitablement lors de la mise en place d'un protocole d'enquête: les enquêtes qui privilégient la représentativité et la taille de l'échantillon, et donc la précision et la puissance des conclusions (au sens statistique), au détriment de la diversité ou d'une plus grande validité de l'information, et les enquêtes qui sacrifient au contraire les grands échantillons au profit d'un contrôle plus étroit de la qualité ou de la variété des données. Faut-il faire une enquête de fréquence de consommation alimentaire sur un grand nombre d'individus ou effectuer une enquête par pesée des aliments, plus précise, mais plus lourde, sur moins d'individus. Ces choix, fonction des objectifs décidés au départ doivent être discutés dès la conception de l'enquête et non pas décidés seulement en fonction des moyens disponibles ou du savoir-faire des enquêteurs locaux.

Il faut souvent combiner des enquêtes lourdes avec des enquêtes plus légères pour établir des points particuliers, et travailler à différents niveaux de représentativité; définir une stratégie d'enquêtes devient alors essentiel pour articuler dans le temps et dans l'espace des méthodes d'investigation focalisées sur des unités statistiques différentes (enquêtes nationales avec échantillon représentatif d'individus de différents groupes d'âge; enquêtes légères dans des communautés particulières, au niveau des ménages, basées sur un choix raisonné, etc.). Dans le cadre d'une évaluation ou d'un suivi à grande échelle, cela peut devenir difficile à gérer si on ne s'organise pas, et les résultats vont arriver en ordre dispersé, à contretemps ou sans le niveau de désagrégation ou de représentativité requis. Il est donc nécessaire de structurer la collecte, en fonction de l'information requise et des niveaux d'analyse correspondants, dès la phase conceptuelle initiale.

L'évaluation et le suivi

Dans le cadre de l'évaluation ou du suivi de programmes ou de situations, où l'on procède à des comparaisons entre régions et dans le temps, le premier problème est celui de l'échantillon: représentatif (aléatoire), raisonné (avec risques de biais) ou reposant sur des sites sentinelles; ce dernier choix présente un avantage pratique certain, mais il faut avoir des éléments d'appréciation périodique sur la modification éventuelle, en fonction de l'application du programme ou des circonstances, de ce que représentent ces sites sentinelles par rapport à la population dans son ensemble. Ce choix reste valable, en général, si l'on s'intéresse davantage à des tendances qu'à une valeur strictement représentative.

Se pose ensuite le problème d'une collecte en longitudinal ou par enquêtes transversales répétées; «longitudinal» implique une collecte de données sur les mêmes individus ou les mêmes ménages à chaque fois (quelle que soit la fréquence des mesures), 'transversal' implique au contraire un ré-échantillonnage à chaque passage. Un argument d'ordre statistique milite pour la conservation du même échantillon d'une fois sur l'autre: c'est en effet une façon de diminuer la variance liée à l'échantillon, et de mettre mieux en évidence la variance liée à l'intervention ou aux phénomènes extérieurs. Mais cet argument devient secondaire dès lors qu'il n'est pas possible de retrouver les mêmes individus d'une enquête à l'autre.

Longitudinal vs transversal séquentiel

Les enquêtes nutritionnelles répétées par sondage exigent, pour les jeunes enfants, un nouvel échantillon à chaque fois: les enfants des échantillons précédents ayant grandi depuis, la répartition des âges ne serait plus comparable; or ce facteur doit rester constant, une enquête longitudinale est donc ici inadaptée. En revanche, le problème ne se pose pas pour les adultes, leur état nutritionnel variant peu avec l'âge, même sur des périodes assez longues; en reprenant le même échantillon à chaque fois, on peut conclure plus facilement à un changement lié aux circonstances ou à une intervention.

Le longitudinal est intéressant, et parfois nécessaire, pour l'évaluation de programmes d'intervention spécifiques; il l'est moins pour le suivi global d'une situation ou pour des programmes de développement socio-économique de portée générale: dans ce cas, c'est en effet davantage l'évolution de la population dans son ensemble que l'on suit, plus que l'impact d'une intervention donnée sur les individus (ou d'autres unités).

Un des inconvénients du longitudinal est inévitablement le biais entraîné par la perte d'une partie de l'échantillon d'une enquête à l'autre (migrations, décès, refus de participation des personnes; pertes de documents, oublis de recueil, etc.). Il est d'autant plus fort que les mesures sont faites à des intervalles de temps plus espacés ou que le programme est de longue durée.

La fréquence de collecte est plus difficile à déterminer; elle dépend en fait de la combinaison de plusieurs paramètres:

Lorsque le paramètre étudié peut normalement fluctuer autour de valeurs moyennes d'une fois sur l'autre, on procèdera à des mesures plus fréquentes pour mieux déceler les tendances significatives. Attention, toutefois, au côté illusoire de mesures trop fréquentes en cas de variations cycliques importantes (saisonnières, par exemple).

Il faut, enfin, maintenir une relative homogénéité des principaux indicateurs entre les différents points de collecte et dans le temps, afin que les comparaisons gardent un sens.

Principes d'analyse

Avant toute analyse se pose le problème de la mise en regard des données issues de toutes les sources. Une analyse locale des données est toujours possible et souhaitable; c'est souvent la garantie d'obtenir les indicateurs nécessaires à temps pour la prise de décision. Mais il est nécessaire, à un moment donné, de concevoir le rassemblement des données jugées indispensables à l'évaluation des activités ou au contrôle de la situation de manière plus centralisée et cohérente. Disposer d'un informaticien système peut être utile, si les données sont sur des supports physiques différents, ou sous des formats différents, pour procéder à une organisation logique de cette étape et en assurer la pérennité.

Les services de statistique dans la plupart des pays sont préparés à ce type de travail. Une action constante de concertation tout le long de la chaîne de collecte et d'analyse facilitera grandement le fonctionnement de l'ensemble.

Plutôt que de procéder à de nombreuses analyses fastidieuses, comportant en outre le risque de trouver des associations par hasard, on favorisera une stratégie d'analyse basée sur le modèle conceptuel initial et les questions qui en découlent. Bien que les analyses ne soient pas nécessairement très complexes, on aura avantage à disposer des services d'un statisticien compétent qui aidera à formuler correctement les questions en termes d'analyse et à choisir les méthodes les plus appropriées; on préparera ainsi un véritable plan d'analyse, qui comprend en général plusieurs phases.

Mesures, indices, indicateurs

Dans le cas des mesures anthropométriques, on procède souvent à un ajustement pour l'âge, le sexe et le type de mesure. Les mesures brutes (tour de bras) ou les indices calculés (poids-âge, poids-taille, ou taille-âge), exprimés par rapport à une référence et un seuil, peuvent être résumés sous forme de moyennes, écarts-types et intervalles de confiance (par exemple: moyenne de taille-âge exprimée en Z-score de la population de référence); sous forme de pourcentages d'individus au-dessous d'un seuil critique (% d'enfants < -2 Z-scores de taille-âge); ou sous forme de distributions continues (courbes) ou par classes d'état nutritionnel. Toutes ces formes d'expression fournissent autant d'indicateurs de l'état nutritionnel pour les paramètres étudiés (maigreur, retard de taille).

Des logiciels (ex. Epi-Info/Epinut[10]) assurent automatiquement l'ensemble de ces transformations pour toutes les données de ce type recueillies de manière standardisée. Il en est de même pour d'autres types de transformations (données d'enquêtes sur la consommation alimentaire) ou de calculs d'indices économiques ou démographiques, par exemple.

Une première phase va consister à vérifier les données brutes, à calculer éventuellement des taux ou des indices variés, et à les structurer en faisant appel à la statistique descriptive pour établir un résumé numérique (moyennes, médianes, écarts-types), des tableaux ou graphiques pertinents, un lissage éventuel (moyennes mobiles).

On procèdera ensuite à l'étude des relations entre variables selon les hypothèses de causalité retenues, à l'aide des techniques de la statistique inférentielle. Il est impératif de tenir compte de la variabilité liée à l'échantillonnage. Les techniques employées seront conditionnées par la nature des variables étudiées, le type d'échantillonnage, la période et le niveau de collecte, les objectifs de l'étude. En bref,

Dans le cas d'analyse de données longitudinales, compte tenu du fait que ce sont les mêmes individus qui ont été enquêtés à chaque fois, on utilisera des techniques du type 'analyse de variance à mesures répétées', basée sur une généralisation du test de Student (t-apparié).

De même, dans le cas de séries importantes d'observations, on pourra utiliser tout l'arsenal des techniques d'analyse de séries chronologiques (désaisonnalisation, tendances, modélisation, etc.).

On trouvera l'ensemble de ces points largement exposés dans les ouvrages courants de statistique et dans les références: Schlach, 1992; Mascie-Taylor, 1994; Watier, 1995; ils ne seront pas développés ici. De même on pourra consulter avec profit: Analysis of health surveys, de Korn et Granbard (1999), ou encore pour l'ensemble des problèmes liés à la collecte, la saisie, la gestion et l'analyse des données, le petit ouvrage de Juul (2001), accessible sous internet.

Dans le cadre de l'évaluation de programmes, il est essentiel de vérifier d'une part le degré de comparabilité initial entre groupes, s'il y a lieu, et d'autre part le degré d'application des programmes à la population cible; dans ce dernier cas, il faut en tenir compte à l'analyse en distinguant les unités qui ont effectivement bénéficié du programme. L'intervalle de confiance donnera une idée de l'importance des effets observés (y compris lorsque la différence n'est pas significative).


[4] Il s’agit ici d’évaluation ‘sommative’, c’est-à-dire d’un bilan d’application des procédures, afin de porter un jugement sur l’intervention, et non pas d’évaluation ‘formative’ destinée à modifier les procédures en cours d’application du programme pour optimiser son fonctionnement.
[5] En théorie, il faut procéder en trois étapes: (a) démontrer l’efficacité théorique d’une intervention par des études expérimentales appropriées (essais contrôlés randomisés), (b) procéder à une application à plus large échelle dans le contexte considéré, mais de façon contrôlée (groupes témoin vs expérimental), (c) généraliser l’intervention tout en mesurant l’efficacité globale d’application. Mais on ne dispose malheureusement pas toujours de telles études pour tout type d’intervention (Habicht et al., 1999).
[6] «La surveillance nutritionnelle est un processus continu qui a pour but de fournir des renseignements courants sur les conditions nutritionnelles de la population et les facteurs qui influent sur elles, afin d’éclairer les décisions des auteurs des choix politiques, des planificateurs, et des responsables de la gestion des programmes d’amélioration des schémas de consommation alimentaire et de l’état nutritionnel.» Comité d’experts FAO, FISE et OMS (FAO, FISE et OMS, 1976). Voir aussi pour plus d’informations: Mason et al., 1987; Maire et al., 1999; Bloem et al., 2003.
[7] ZOPP: Ziel Orientierte Projekts Plannungs (voir en bibliographie)
[8] Le projet EUROHIS a ainsi développé une palette d'instruments communs pour la mesure de huit indicateurs de santé. Cette méthodologie peut être utile à titre d'exemple pour exploiter de façon homogène des données issues d'enquêtes auprès de communautés différentes qui ne portent pas toujours sur une définition identique des indicateurs recherchés (Nosikov & Gudex, 2003).
[9] Pour ce qui concerne les problèmes d'échantillonnage, on peut consulter avec profit: Sampling of population, Levy and Lemeshow, 1999.
[10] Disponible auprès des CDC d'Atlanta (USA): http://www.cdc.gov/epiinfo/

Page précédente Début de page Page suivante