Une typologie de flottilles représente un travail d'une certaine envergure qui implique plusieurs personnes de différentes compétences: enquêteurs, informaticiens, analystes statisticiens, spécialistes des domaines concernés (socio-économiste, biologiste, technologiste, halieute). Il est donc important, dans une phase préparatoire, d'évaluer la tâche globale en respectant les étapes suivantes:
clarification de la nature du problème et des questions posées: cette étape doit être réalisée avec les spécialistes en charge de la typologie et les commanditaires de l'étude; elle oriente de nombreux choix méthodologiques et précise le contexte de la typologie (pêcheries concernées, besoins de connaissance);
réponse à la question “quelles données pour quelles informations?”: il s'agit de préciser les informations nécessaires pour répondre aux questions posées, d'où découlent la nature et le nombre des variables à collecter. Chacun des thèmes abordés pour établir la typologie des flottilles (caractéristiques des bateaux, socio-économie, activité de pêche) comporte un nombre élevé de variables. ATTENTION: “trop d'informations nuit à l'information” ! Un défaut classique consiste à vouloir en effet prendre trop de données, ce qui nuit à l'efficacité de l'enquête et à son analyse, en termes de rendements, durée, coûts, ou rapport qualité/prix. D'une manière générale, le choix des questions sera guidé par la pertinence des variables à analyser en regard de l'objectif attendu pour la typologie et du coût associé à la durée prévue pour l'exécution de l'enquête. C'est pourquoi, il est nécessaire de planifier simultanément l'acquisition et le traitement des données ;
planification de l'enquête: choix des enquêteurs, élaboration du questionnaire, sélection des unités à enquêter (définition de la population cible, stratégie d'échantillonnage), rédaction d'un document explicatif pour les enquêteurs, validation du questionnaire : cette phase de test permet souvent de réviser la formulation de certaines questions, de contrôler le temps nécessaire à l'administration de l'enquête et de compléter la formation des enquêteurs ;
planification du traitement: prise en compte des aspects informatiques pour la saisie, le codage, la validation et le traitement des données : choix du matériel (ordinateurs, logiciels) et du personnel nécessaire pour effectuer la tâche; analyse statistique des données : quelles méthodes pour quelles questions et quelles données ? la planification du schéma d'analyse permet souvent de réviser la pertinence de l'information et de réfléchir aux caractéristiques des variables mesurées qui orienteront le traitement statistique (nature des variables) ;
besoins en formation : l'identification des tâches à effectuer, et leur calendrier, permet de préciser les compétences pour mener à bien le travail et d'identifier les besoins en formation et en prestations extérieures ; les premiers concernent surtout la formation des enquêteurs et du personnel de saisie et ne doivent en aucun cas être négligés, car la qualité des données dépendra de la qualité de leur travail ;
besoins en communication / sensibilisation: la typologie des flottilles nécessite l'acquisition de données relativement précises sur les unités de pêche : l'enquête auprès des pêcheurs et/ou propriétaires des unités doit au préalable être annoncée en précisant les objectifs, la participation escomptée des professionnels et les retombées d'une telle opération pour les personnes concernées ; il est également pertinent de prévoir une campagne de restitution, présentation des résultats de l'enquête auprès de ces mêmes personnes, qui sont en général directement concernées par les questions ayant motivé l'étude de typologie des flottilles.
estimation des coûts : la planification de l'ensemble de ces tâches permet d'estimer les coûts reliés à la typologie des flottilles, depuis sa conception jusqu'à la valorisation des résultats obtenus.
Les informations nécessaires pour établir la typologie des flottilles peuvent donc être de différentes natures: captures et efforts de pêche, caractéristiques des unités de pêche, comportements de pêche (tactiques, stratégies). Ces données sont généralement obtenues par différentes techniques d'enquête, basées sur une participation effective de la personne soumise à l'enquête et sur l'utilisation d'un questionnaire par le personnel technique du Service des Pêches ou l'appel à une agence spécialisée dans la conduite d'enquêtes. Quelque soit la technique utilisée, elle nécessite le respect de plusieurs points:
Les aspects de collecte d'informations sur les captures et les efforts ne sont pas développés dans ce document puisque ces données, classiques, font partie de la panoplie normale des services en charge du suivi et de la gestion des pêches.
Pour les pêcheries industrielles, ces informations sont généralement acquises par le biais de cahiers de pêche (“log-book”) donnés aux pêcheurs qui sont dans l'obligation de les remplir. Les données sur les captures et les efforts de ces pêcheries permettent d'établir un bilan, en général exhaustif, sur l'activité de pêche. La compilation des tonnages débarqués par espèce ou catégorie commerciale et des temps de pêche pour les différents bateaux donne le total des captures et des efforts de la pêcherie. Ces données servent à établir les modèles halieutiques utilisés dans les groupes de travail régionaux (CIEM, ICCAT, etc.), en charge des recommandations pour la gestion de ces pêcheries industrielles. Ces données, par ailleurs, peuvent faire l'objet d'analyses fines sur les stratégies de pêche puisqu'il est possible, souvent, de reconstituer les captures et les efforts par coup de pêche et les saisons pour chacun des bateaux (cf. 2.2.3).
Pour les petites pêcheries côtières ou les pêcheries artisanales, ces informations sont souvent issues d'enquêtes au débarquement qui permettent d'avoir une estimation des captures et des efforts de pêche à partir d'un échantillonnage des sorties de pêche. Les données sont récoltées sur un échantillon de la pêcherie, qui est souvent difficile à étudier en raison du nombre d'unités de pêche et de la dispersion spatiale et temporelle des points de débarquement. Ces enquêtes de routine sont conduites généralement par des techniciens des Services des Pêches: elles nécessitent un suivi rigoureux; le travail des enquêteurs doit être valorisé et payé en conséquence pour assurer la pérennité du système.
Les flottes de pêche font généralement l'objet d'un recensement régulier qui fournit un inventaire exhaustif des unités de pêche. La délivrance des licences de pêche est l'occasion d'un inventaire annuel des unités actives pour obtenir des informations sur des caractéristiques générales des bateaux et les cataloguer en fonction des activités qui font l'objet d'une réglementation. Ce recensement permet de constituer une base de sondage, qui sera utilisée pour les besoins ultérieurs d'un échantillonnage de la pêcherie. On appelle “base de sondage”, un ensemble d'éléments accessibles et dénombrables duquel il est possible de prélever un fragment (échantillon) pour juger de cet ensemble (population), par exemple: liste des adresses postales pour le recensement démographique; liste des numéros de téléphone pour le recensement de la population accessible par téléphone; liste des numéros d'immatriculation des bateaux. Un échantillonnage de la population globale est, par exemple, requis pour une enquête menée pour établir une typologie de flottilles. Mené de façon occasionnelle et non en routine, ce type d'enquête nécessite des informations précises sur les unités de pêche, difficiles à obtenir pour l'ensemble des bateaux. L'enquête sur les caractéristiques des unités de pêche peut en effet comporter de nombreuses questions portant sur différents thèmes: caractéristiques techniques des bateaux, matériel de pêche, opérations de pêche, comptes d'exploitation, équipage. La base de sondage permet alors de choisir au hasard des éléments de l'ensemble de la population, soit des unités de pêche représentatives de la flotte sur laquelle portera l'enquête.
En 1996, la Direction de la Marine Marchande Marocaine évaluait à 2169 le nombre de bateaux immatriculés de la pêcherie côtière. Chaque unité était décrite par 19 variables portant sur les caractéristiques générales des bateaux. Sans les barques de pêche artisanale et à partir des informations de la Direction des Pêches Maritimes et de l'Aquaculture sur les licences de pêche en 1996, la pêcherie en activité en 1996 était estimée à 1777 bateaux. Dans le cadre du Programme de Modernisation de la Pêcherie Côtière, une enquête a été réalisée pour la typologie des flottilles : 497 unités de pêche ont été choisies parmi ces 1777 bateaux, dont la liste et la description constitue une base de sondage.
Les bases de données sur les pêcheries ayant l'obligation de remplir des cahiers de pêche permettent de reconstruire les calendriers de pêche des différentes unités. Il est alors possible d'établir une typologie de flottilles sur la base des activités de pêche au cours du temps et de cerner des questions reliées à la dynamique des exploitations halieutiques. Dans le cas de pêcheries faisant l'objet d'échantillonnage au débarquement, ces calendriers ne peuvent être établis que sur la mise en place d'un suivi nominal et systématique d'un échantillon d'unités de pêche. Ce type d'enquête est relativement lourd à mettre en œuvre car il implique une présence assidue sur le terrain pour rencontrer les unités régulièrement au cours de leur activité de pêche. Les informations requises pour une typologie des comportements nécessitent généralement un entretien direct avec le capitaine de pêche. Ces derniers seront interrogés à leur retour à terre et la fréquence des entretiens dépendra donc de la durée des sorties, chaque enquête pouvant concerner une ou plusieurs sorties précédentes (maximum deux jours précédant le jour de l'enquête, afin d'assurer la qualité des données faisant appel à la mémoire de la personne questionnée).
Une enquête de suivi d'unités de pêche a été menée au Centre de Recherche Océanographique de Dakar-Tiaroye (Sénégal) en 1992. Elle impliquait d'une centaine d'unités de pêche afin de décrire les tactiques et les stratégies des pêcheurs artisans. Ce suivi a été mis en place pour répondre aux besoins de la recherche pour l'élaboration d'un modèle de simulation sur la dynamique de la pêcherie qui nécessitait de mieux connaître les comportements à court et moyen termes des unités de pêche. L'enquête comportait trois parties: 1- les caractéristiques de l'unité de pêche, 2- la description de sorties de pêche par échantillonnage régulier des retours de pêche et interview des pêcheurs, 3- la fréquence et la nature des activités de pêche au cours de l'année (raison de l'arrêt, lieu de campagne de pêche ou engin de la sortie).
L'élaboration du questionnaire doit au préalable faire l'objet d'un consensus entre les différents bénéficiaires de l'enquête. Plusieurs réunions sont généralement nécessaires pour :
Le questionnaire comprend souvent plusieurs parties organisant les questions par thème (ex : caractéristiques techniques, activités de pêche, devenir des captures, données socio-économiques). L'annexe I donne l'exemple du questionnaire administré au Maroc pour la typologie des flottilles côtières, qui comportait plusieurs parties ; l'ensemble comprenait 12 pages. Ce questionnaire, assez lourd à administrer, avait pour objectif d'être le plus complet possible afin de fournir le maximum d'informations sur la pêcherie faisant l'objet d'un programme important pour la modernisation de la flotte et la reconversion des unités de pêche. Toutes les informations du questionnaire n'ont pas été prises en compte pour les besoins de la typologie de flottilles. Si l'ensemble des données du questionnaire administré au Maroc peut, en principe, être valorisé par de multiples utilisateurs travaillant sur des problématiques de développement ou d'aménagement de la pêcherie, il faut bien observer qu'un tel questionnaire est peut-être un peu trop long (ce qui rend alors souvent la planification des aspects informatiques et d'analyse difficile).
Liste des thème abordés dans l'enquête de typologie de flottilles de la pêcherie côtière marocaine (cf. annexeI): Description technique et exploitation des unités (questionnaire soumis à toutes les unités échantillonnées)
Questionnaire équipage (questionnaire soumis à une partie des unités échantillonnées)
|
Un questionnaire est généralement constitué de questions de différents types:
On distingue les questions fermées, qui impliquent une réponse dans une série de choix donnés (ex : type de bateau = chalutier, sardinier, palangrier, mixte ou autre ; la rubrique “autre” permet a posteriori de créer une nouvelle catégorie si elle s'avère pertinente et importante en nombre), des questions ouvertes pour exprimer des commentaires sous la forme d'un texte (ex: description détaillée du revêtement de la cale?). Les réponses à ce dernier type de question feront l'objet d'une codification ultérieure pour le traitement ou resteront au niveau de commentaire disponible sur les feuilles d'enquête.
Les réponses aux questions sont donc quantitatives (puissance du moteur ?) ou qualitative (marque du moteur?). Dans le premier cas, il sera important de veiller à indiquer sur le questionnaire l'unité de la mesure, afin d'éviter des erreurs dues à un problème d'échelle. D'une manière générale, le questionnaire devra comporter toutes les informations susceptibles de guider l'enquêteur au cours des entretiens (ex : puissance du moteur: à exprimer en CV; régime: à exprimer en tour/mn, position de l'équipement de pont: à marquer sur un croquis prévu à cet effet, nombre d'opérations par marée: à exprimer, pour un chalutier, en nombre de “traits de chalut”, pour un sardinier, en nombre de “coups de senne”, pour palangrier, en nombre de “poses”). Un petit document accompagnant le questionnaire est nécessaire pour rappeler aux enquêteurs les règles à respecter pour mener à bien leur enquête. Dans le cas d'une réponse qualitative (question nominale), on pourra donc indiquer sur le questionnaire la liste des modalités possibles de réponse (ex : chalutier, palangrier, fileyeur, senneur ou autre) afin d'éviter des erreurs de compréhension de la question ou de transcription de l'information.
Parallèlement à la mise en forme du questionnaire, il est nécessaire de prévoir la saisie et le traitement de l'information, ces aspects pouvant influencer l'expression des questions. Plusieurs logiciels informatiques offrent la possibilité de construire et d'éditer un questionnaire, tout en assurant un support pour la saisie des réponses et offrant des fonctionnalités de traitement statistique pour présenter les résultats de l'enquête (ex: logiciels Sphynx ou Question). De tels logiciels permettent d'anticiper les étapes liées au traitement au moment de la formulation des questions (ordre chronologique des questions, agencement des questions les unes par rapport aux autres, groupement logique des questions par type, nombre maximal de modalités pour une question nominale) et de minimiser les problèmes d'exécution et de gestion de l'enquête en aval, notamment lors de la saisie informatique, la validation et le codage de l'information ou la compilation des données.
Le questionnaire peut également être élaboré en vue d'une utilisation simultanée pour l'administration sur le terrain et l'informatisation des données. Ceci nécessite de le concevoir pour répondre au travail de terrain et à la mise en forme informatique des réponses. Il comporte alors une partie pour l'inscription des réponses au moment de l'entretien et une partie pour le codage de l'information et sa mise en forme en fichier informatique. Ce type de formulaire présente l'avantage de minimiser les erreurs de transcription lors du codage de l'information, qui peut être réalisé par l'enquêteur entre deux enquêtes (et non par une tierce personne), et d'économiser des feuilles de papier.
On donne en annexe II l'exemple du formulaire utilisé pour le suivi d'unités de pêche de la pêcherie artisanale sénégalaise: cet exemple illustre la conception simultanée d'un questionnaire pour l'acquisition de l'information sur le terrain et sa codification en vue de la saisie informatique. Il donne, en outre, le type de questions à poser pour établir une typologie des flottilles sur la base des comportements de pêche.
Une enquête qui implique un grand nombre de questions est rarement menée sur l'ensemble de la population. C'est pourquoi, il est nécessaire de réaliser un échantillonnage afin d'avoir un sous-ensemble d'unités les plus représentatives possibles de la population globale (ex: la flotte de pêche). Du point de vue de la théorie statistique des sondages, un échantillonnage ne sera représentatif que dans la mesure où l'échantillon aura été choisi au hasard, sans interférence dans le choix des unités de la part des personnes en charge de l'enquête. Cette technique rigoureuse nécessite d'avoir accès à une base de sondage afin de réaliser un échantillonnage aléatoire, basé sur un tirage au hasard des unités participant à l'enquête. Cette technique permet de minimiser les biais dus à une non adéquation entre l'échantillon et la population sur laquelle on cherche à extrapoler les résultats de l'enquête. Cependant, elle pose souvent des problèmes du point de vue logistique et coût: il faut en effet pouvoir rencontrer les unités de pêche choisies au hasard, et ce, quelque soit leur localisation et/ou leur disponibilité. Un échantillonnage à choix raisonné, où l'on choisit sur des critères préétablis les unités de l'échantillon, est dans les faits souvent pratiqué pour palier à ces contraintes. Dans ce cas, on cherche à avoir un sous-ensemble aussi représentatif que possible de l'hétérogénéité observée au sein de la pêcherie. Un échantillonnage stratifié permet en outre d'acquérir le maximum de précision pour un minimum d'effort d'acquisition de l'information. La stratification tient compte de l'hétérogénéité de la pêcherie, notamment dans ces dimensions spatiales (répartition géographique) et de techniques de pêche.
L'échantillon de 497 unités de pêche de la flotte côtière marocaine a été sélectionné sur une base raisonnée, en fonction de la disponibilité des patrons de pêche, afin de viser une représentation de 25 à 30% des unités par port et par type de bateaux: chalutier, sardinier et palangrier. La base de sondage sur les licences de pêche, construite à partir des informations fournies par la Direction de la Marine Marchande et la Direction des Pêches Maritimes et de l'Aquaculture, donnait le nombre d'unités recensés pour chacun des ports et types de bateaux. Le choix des unités sur le terrain a été fait en assurant la meilleure couverture possible de la diversité de la flotte, notamment au point de vue puissance, âge et longueur du bateau. Cette technique d'échantillonnage s'apparente à la “méthode des quotas”. La population statistique, les bateaux de la flotte côtière, est stratifiée sur deux critères: géographique (port) et type de licence de pêche (chalutier, sardinier et palangrier); le total des bateaux par strate (combinaison port*type de licence) arrive à représenter l'ensemble de la flotte côtière active, à un moment donné, conformément aux données fournies par les services administratifs en 1996. La sélection, totalement au hasard, de 25 à 30% des effectifs estimés dans chaque strate fournit un échantillonnage représentatif de l'hétérogénéité spatiale et de tous les types de licence de la pêcherie côtière.
Si l'échantillon ne permet pas d'extrapoler les résultats à l'ensemble de la population statistique (soit l'ensemble des éléments - ici toutes les unités de pêche de la flotte - à partir desquels l'échantillon a été sélectionné selon des règles données par la théorie des sondages), la typologie conserve cependant un intérêt du point de vue descriptif et qualitatif. En effet, outre la classification des unités de pêche en tant que tel, un des objectifs majeurs d'une typologie est de parvenir à distinguer des types différents au sein d'un ensemble hétérogène, par la mise en évidence de variables discriminant les différentes classes. Même si les proportions relatives au sein de la population globale ne sont pas respectées, la mise en évidence des types trouvés au sein l'échantillon permettra toujours de dégager leurs caractéristiques, leurs spécificités et leurs différences. Un deuxième sondage, plus léger, peut par la suite être mis en œuvre sur l'ensemble de la population afin d'évaluer l'importance de ces types mis en évidence au cours de la première étape. Il est bien sûr préférable, à partir d'un échantillonnage adéquat, de cibler directement les deux objectifs, soit à la fois l'identification et la quantification des types d'unités de pêche de la flottille.
Une fois l'enquête réalisée sur le terrain, l'information doit être centralisée et stockée sur ordinateur. La saisie des données est une étape particulièrement importante car de nombreuses erreurs sont souvent liées à des problèmes de lecture de l'information ou de fautes de frappe, inévitables dans ce type de travail fastidieux, surtout s'il n'est pas effectué par des personnes ayant l'habitude de saisir des données au clavier. Afin de minimiser ces erreurs, il est souvent conseillé de réaliser 1- une double saisie (l'investissement à ce stade se révèle souvent plus rentable par rapport aux coûts reliés aux erreurs détectées ultérieurement dans les bases de données) ou 2- un masque de saisie: ce dernier permet de contrôler, au moment de la saisie, l'information donnée au clavier avec le type de réponses admissibles pour la question correspondante (ex: suite à un décalage des questions, la saisie d'une donnée quantitative - par exemple “12” - à une colonne correspondant à une question qualitative - par exemple “licence de pêche” - est impossible; la saisie d'une valeur quantitative doit correspondre à l'intervalle des réponses possibles correspondant à la question: saisir “2001” pour la colonne “âge du bateau” n'est pas admissible; dans ces différents cas, le programme refuse la saisie de l'information). Le masque de saisie est généralement défini au moment de la conception du questionnaire ou de la base de données sur ordinateur.
Les données informatisées sont stockées sous forme de fichiers gérés par des tableurs (EXCEL, DBASE, LOTUS) ou d'une base de données gérée par un Système de Gestion de Base de Données (SGBD tel que ACCESS, ORACLE). La conception d'une base de données nécessite une compétence technique en informatique: une telle expérience s'avère particulièrement rentable, notamment pour des grosses quantités de données devant faire l'objet d'une mise à jour régulière et/ou d'un transfert vers d'autres systèmes informatiques.
Les données sur les 497 unités de pêche de l'enquête menée par l'Institut National de Recherche Halieutique, INRH, au Maroc sur la pêcherie côtière ont été saisies et stockées en fichier DBASE. Huit fichiers différents ont été constitués:
Chaque fichier comportait 497 lignes et un nombre de champs correspondant au nombre de variables propres à chacun des thèmes. Plusieurs champs sont, en général, communs aux différents fichiers, tels que le port ou le nom du bateau, pour permettre une concaténation ultérieure (fusion) des différents fichiers. L'ensemble des 8 fichiers sur les unités de pêche marocaines représente un total de 601 variables, dont 550 de natures différentes. |
Les données saisies sous un système informatique peuvent faire l'objet de traitements ultérieurs par d'autres utilisateurs. Il existe deux types de problème de compatibilité informatique: différence de type d'ordinateur et de système d'exploitation (ex : ordinateur PC, Mac-Intosh, Sun sous Unix) et différence de format des logiciels : les fichiers EXCEL présentent, par exemple, une extension .XLS qui permet d'identifier le logiciel source sous lequel a été créé le fichier. Il existe maintenant de nombreuses possibilités d'importation et d'exportation des fichiers qui règlent ces problèmes de compatibilité.
Les 8 fichiers de l'INRH ont été saisis à l'aide d'un tableur (logiciel DBASE) et présentent, de par leur format, une extension .DBF. Afin d'être accessibles à d'autres logiciels, ces fichiers d'origine ont été ensuite convertis au format TEXTE (extension .TXT). A l'aide du logiciel de statistique SAS, les 8 fichiers ont pu ainsi être assemblés en une seul base de données comportant 497 unités et 550 variables différentes (base de données SAS avec une extension .SSD). Une nouvelle conversion au format TEXTE de cette base unique a permis ensuite de l'importer dans le logiciel SPAD d'analyse de données pour réaliser l'analyse typologique proprement dite. La typologie des flottilles marocaines aura donc nécessité l'utilisation de trois logiciels informatiques : DBASE pour la saisie et compilation de base, SAS pour la gestion des données et certains traitements statistiques et SPAD pour l'analyse typologique.
La chaîne de traitement informatique peut comporter une série de manipulations entre différents ordinateurs et logiciels informatiques. Le traitement des données nécessite en effet souvent l'utilisation de plusieurs outils informatiques, selon les fonctionnalités offertes par chacun: gestion des données (lecture, vérification, compilation), analyse graphique, analyse statistique élémentaire, analyse de données multivariées. Une seule personne doit cependant être en charge de la base de données originale, afin d'éviter des problèmes de révision et de duplication des données. Par contre, puisque plusieurs personnes sont souvent impliquées dans l'analyse des données, une documentation appropriée sur le descriptif des fichiers doit être disponible. Ce descriptif présente généralement les informations suivantes:
Cette liste comporte autant de lignes qu'il y a de champs (variables) dans le fichier. Il est également conseillé d'indiquer la longueur et la nature de la variable de chacun des champs (quantitatif, qualitatif, textuel). Ceci afin de faciliter la lecture des données pour les traitements ultérieurs.
L'annexe III fournit le descriptif des 8 fichiers constitués lors de la saisie informatique des questionnaires de l'enquête de typologie de flottilles côtières marocaines. Cet exemple montre comment chaque question a été intitulée et exprimée sous la forme d'un ou de plusieurs champs dans le fichier informatique.
Il est également fréquent d'utiliser des fichiers de données déjà existants, venant d'autres sources et apportant des informations complémentaires sur les objets de l'étude. Les problèmes rencontrés dans la confrontation des données de différentes sources sont souvent reliés au codage de l'information. Vouloir récupérer des données issues d'un fichier B pour les “coller” aux données du fichier A nécessite d'avoir un champ commun (appelé “clé”), c'est à dire une référence identique entre les deux fichiers. Ce type de manipulation nécessite, d'une part, l'identification des deux sources de données et la disponibilité de personnes ressources pour résoudre les problèmes rencontrés et, d'autre part, la réalisation d'une analyse préalable des deux fichiers A et B pour vérifier l'adéquation entre la référence utilisée pour faire la fusion des deux fichiers.
Pour la flotte côtière marocaine, la Direction de la Marine Marchande possédait un fichier sur les bateaux immatriculés en 1996 comprenant 2169 enregistrements (bateaux) et 19 variables. Parallèlement, la Direction des Pêches Maritimes a fourni un fichier sur les bateaux de la pêcherie côtière opérationnelle, détenteurs d'une licence de pêche en 1996; ce fichier comportait 1777 unités et 14 variables. Ces données étaient intéressantes pour étudier la représentativité de l'échantillon “enquête typologie” de 497 bateaux par rapport à la flotte immatriculée et la flotte avec licence de pêche. Il a fallu cependant au préalable “nettoyer” les fichiers en comparant l'appartenance des bateaux de l'échantillon aux deux autres fichiers maîtres, sur la base du No d'immatriculation et du nom du bateau (il a fallu, par exemple, rajouter dans le fichier de la flotte avec licence plusieurs bateaux de l'échantillon, non recensés dans le fichier informatique de 96) et la pertinence de la liste des bateaux des différents fichiers (ex: certains bateaux dupliqués ont du être enlevés des fichiers maîtres).
Quelque soit la nature des données, captures et efforts de pêche, caractéristiques des unités de pêche ou calendriers des activités, le traitement des données pour une typologie de flottilles respecte nécessairement les étapes suivantes:
la lecture des données: cette étape, si les données n'ont jamais fait l'objet d'une validation préalable, permet de vérifier la saisie des données et de corriger souvent de nombreuses erreurs! Elle permet d'analyser les taux de réponse aux questions posées et les absences d'information;
la constitution des tableaux de données par le choix des individus et des variables qui seront soumis aux analyses statistiques; les logiciels de statistique nécessite généralement un fichier présentant un tableau avec un nombre de lignes égal au nombre d'individus (les n éléments de l'échantillon, soit les n unités de pêche qui font l'objet de la typologie) et un nombre de colonnes égal au nombre de variables sur lesquelles seront effectuées les statistiques. A ce stade, il peut être intéressant de distinguer deux types de variables: les variables principales et les variables supplémentaires; les premières sont prises en compte dans la construction de la typologie (variables actives), alors que les secondes interviennent en second lieu pour expliquer les résultats de la typologie. Par exemple, il n'est pas pertinent de mettre la variable “port” dans l'élaboration de la typologie (sinon on classera les bateaux en fonction, entre autre, du critère géographique) mais de regarder a posteriori si la typologie établie sur la base d'autres variables (caractéristiques techniques, calendriers de pêche) montre une relation avec la variable “port”: cette dernière est appelée “variable supplémentaire”, utilisée pour expliquer les résultats obtenus avec les “variables actives”.
la description de chacune des variables d'intérêt par analyse univariée: tout travail d'analyse statistique nécessite au préalable une analyse systématique des variables à partir des statistiques élémentaires (moyenne, écart-type, minimum, maximum, mode, médiane): outre la prise de connaissance des données et de leur variabilité, cette étape contribue souvent à détecter des erreurs au sein du tableau. La meilleure validation des données passe en effet par leur analyse! Les systèmes de double-saisie et de masque de saisie (cf. 2.5) ne permettent pas de détecter toutes les erreurs de saisie et il est fréquent de trouver des aberrations dans les jeux de données au moment de l'interprétation des résultats de l'analyse des données.
l'étude des relations entre les variables d'intérêt par analyse bivariée: une analyse bivariée est réalisée à partir de méthodes statistiques qui permettent d'étudier les relations entre les variables prises deux à deux. Ces méthodes comprennent des techniques graphiques et des techniques quantitatives qui offrent la possibilité de tester l'intensité de la relation entre les variables.
l'étude des ressemblances entre les individus et entre les variables du tableau par analyse multivanée: ces méthodes statistiques permettent de visualiser et de quantifier, d'une part, les relations entre toutes les variables qui auront été conservées suite à l'analyse bivariée et, d'autre part, les ressemblances entre les individus du tableau décrit par la “multivariable” du tableau. Ces méthodes comprennent des techniques graphiques pour visualiser les relations entre les individus et les variables et des techniques quantitatives qui fournissent des indices pour interpréter les résultats et, éventuellement, tester la validité du modèle statistique.
la synthèse et la restitution des résultats: une des grandes difficultés des analyses statistiques impliquant un grand nombre de variables, et donc les analyses typologiques, est de fournir un résumé suffisamment clair et synthétique des analyses successives réalisées sur l'ensemble des variables décrivant les individus du tableau de données.
La statistique offre toute une panoplie de méthodes dont le choix va dépendre de quatre critères :
Réaliser une typologie de flottilles consiste à explorer la structure des données par des analyses, d'une part, des relations entre les variables et, d'autre part, des ressemblances entre les individus décrits par ces variables. La première catégorie d'analyses permet de sélectionner les variables les plus pertinentes pour la typologie et de dégager les combinaisons entre les valeurs de ces variables qui caractériseront les classes d'unités de pêche. La deuxième catégorie permet de dégager ces classes en regroupant les individus qui se ressemblent sur la base des descriptions des variables dutableau de données. On distingue deux étapes : 1- la mise en évidence de la structure des données et 2- l'interprétation de la structure des données. La première étape implique la mise en œuvre de méthodes exploratoires, ou descriptives, qui fourniront une synthèse du jeu de données sous la forme de tableaux et de graphiques statistiques (ex : classes d'individus décrites par des moyennes); la deuxième étape nécessite l'utilisation de tests statistiques qui valideront la pertinence des classes par la mise en évidence de variables significatives de ces classes.
2.6.2.1 Tableaux statistiques
Les variables peuvent être résumées par plusieurs indices statistiques: pour les variables quantitatives, on utilise la moyenne ou la médiane pour décrire la position des n individus sur l'échelle de la variable et l'écart-type, le minimum et le maximum pour décrire leur dispersion (variabilité). Il est également intéressant d'utiliser les quantiles qui correspondent aux valeurs de la variable qui séparent les n individus en fonction d'un pourcentage donné; par exemple, les quartiles séparent la distribution en 4 parties égales: Q1 pour les premiers 25% [Min-Q1], la médiane qui sépare la distribution en deux parties égales [Q1-Med]= [Med-Q3]=25% et Q3 pour le dernier 25% [Q3-Max]; les centiles séparent la distribution en 100 parties égales: il est notamment intéressant d'analyser C1 et C99 qui correspondent respectivement à la valeur de la variable qui sépare 1% des individus extrêmes de la distribution [min-C1]=[C99-Max]=1%.
Les variables qualitatives sont décrites par la fréquence en valeur absolue (nombre) et en valeur relative (pourcentage) des individus dans les différentes valeurs (modalités) des variables.
Les 497 bateaux de l'échantillon de la flotte côtière marocaine sont décrits par les statistiques élémentaires des variables quantitatives disponibles dans les fichiers maîtres (“Immatriculation” et “Licence”) afin d'étudier la représentativité de l'échantillon par rapport à l'ensemble de la flotte. L'effectif N indique le nombre de valeurs trouvées dans le fichier; il ne correspond pas forcément au nombre de bateaux de l'échantillon, 497: en effet, plusieurs de ces bateaux ne possèdent pas d'information dans les fichiers fournis par l'administration (absence d'information).
Les bateaux échantillonnés ont, par exemple, une longueur qui varie de 6 à 26.76 m, pour une moyenne de 16.14 m. L'écart-type de 4.85 m indique que la majorité de l'échantillon à une longueur comprise entre 11.26 (16,14-4,84) et 20,99 m (16,14 + 4,84). Parallèlement, on étudie la répartition des 497 bateaux par région et par type de pêche. Le total des lignes et des colonnes décrit la distribution de l'échantillon entre les différentes régions du Maroc et entre les différents types de pêche. Le pourcentage par région, si l'échantillonnage stratifié a été réalisé correctement, doit refléter le pourcentage de la flotte globale. Le tableau croisé permet d'étudier la relation entre les deux variables qualitatives (région et type de pêche) à partir de la répartition des effectifs dans les différentes cases du tableau. (CHAL: chalutier, CHPA: chalutier-palangrier, CHSA: chalutier-sardinier, DIV: divers, SARD: sardinier, SECH: senneur-chalutier, SEPA: senneur-Palangrier, PASA: palangrier-sardinier, PALA: palangrier).
Ce tableau montre que le plus grand nombre de bateaux est localisé à Tanger, avec une majorité de palangriers et sardiniers. Le tableau croisé met en évidence une relation entre la région et le type de pêche: au nord du Maroc, dominance des sardiniers (sauf à Tanger) et au sud de Casablanca, ce sont les chalutiers qui dominent la flotte côtière. |
2.6.2.2 Graphiques statistiques
Aux tableaux statistiques sont associés des graphiques qui permettent de visualiser la distribution et les relations entre les variables; on distingue par exemple:
Le graphique permet d'explorer rapidement la structure des données et de comparer plusieurs jeux de données; il est également utilisé à des fins de communication pour résumer et illustrer les valeurs d'un tableau statistique.
La longueur des bateaux par type de licence de l'échantillon de flottilles côtières marocaines est comparée sur la base des quantiles, illustrés par les boîtes de dispersion; l'axe vertical correspond à l'échelle des longueurs; chaque boîte est délimitée par les quartiles Q1 et Q3, dont l'écart Q3-Q1 correspond à 50% des individus les plus au centre de la distribution; le trait horizontal au centre de la boîte représente la valeur médiane: si ce trait est au milieu de la boîte, il indique que la distribution de la variable est symétrique (distribution normale). Les deux extrémités des barres verticales correspondent aux valeurs du premier et du dernier centiles (C1 et C99) et délimitent 98% de la distribution de l'échantillon (= 497 bateaux); les points en-dessous ou au-dessus des centiles C1 et C99 correspondent à 1% des bateaux ayant une valeur de variable en dehors de cette distribution (exemple PALA ou CHAL); les deux traits extrêmes indiquent les valeurs minimale et maximale de la variable. On voit par exemple sur cette figure, que le type de pêche “palangrier” correspond à des bateaux plus petits que les chalutiers ou les sardiniers et que les senneur-chalutiers sont les bateaux les plus homogènes au point de vue longueur (petite boîte de dispersion). |
La comparaison de la distribution de fréquence par type de licence de pêche entre l'échantillon et la population d'où est issu cet échantillon (flotte globale = bateaux du fichier licence 96) est illustrée par les histogrammes de fréquences des deux jeux de données, soit 497 individus et 1777 individus répartis entre les 9 modalités de la variables qualitative “type de pêche”. La comparaison entre les deux graphiques montre que l'échantillonnage a surestimé les sardiniers et sous-estimé les palangriers par rapport aux informations fournis par le fichier-maître sur les licences opérationnelles en 1996. Il sera donc important de “redresser” les résultats de l'échantillon au moment de l'extrapolation des conclusions à l'ensemble de la flotte côtière. |
L'évolution au cours du temps du nombre de bateaux ayant acquis un équipement électronique est illustrée par une courbe de fréquence cumulée: la comparaison de la forme de la courbe des différents équipements permet d'illustrer le processus de modernisation électronique des flottilles côtières marocaines. On note une accélération dans les années 90 des acquisitions en équipement de base (compas, VHF et sondeur) - suite sans doute à des programmes d'incitation - et l'apparition de nouveaux équipements, dont le GPS, depuis 95. |
2.6.2.3 Tests statistiques
Les relations entre deux variables quantitatives, qualitatives ou mixtes (1 quantitative et 1 qualitative) peuvent être testées à l'aide de méthodes statistiques (test d'hypothèses). Pour interpréter les résultats de la typologie et, donc, trouver les variables qui expliquent significativement les différences entre les types, on utilisera surtout 3 méthodes:
Dans une typologie de flottilles, la mise en évidence de la structure consiste à dégager des classes de bateaux qui se ressemblent et dont les classes sont différentes entre elles. L'interprétation des structures consiste alors à trouver par test statistique les variables qui présentent des différences significatives entre les classes. Pour les variables qualitative, on compare la distribution de fréquence des individus dans les différentes modalités de chaque variable entre la classe et l'ensemble de l'échantillon. Pour les variables quantitatives, on compare les moyennes observées dans la classe et dans l'ensemble de l'échantillon. Ces différents indicateurs (fréquences et moyennes) sont portés dans les tableaux présentant les résultats de la typologie afin de résumer les variables caractéristiques des classes. C'est par l'étude des valeurs et des modalités significatives des classes qu'il est possible de donner une interprétation à la classe et de confirmer ainsi la pertinence de la typologie.
La comparaison de la distribution par type de pêche de l'échantillon de 497 bateaux et de la population cible de 1777 bateaux avec licence est réalisée par le test du χ2. Les résultats confirment qu'il existe une différence significative entre l'échantillon et la population, due à une sous-estimation du nombre de palangriers au profit des sardiniers. Parallèlement, on compare les longueurs de bateaux de la population avec ceux de l'échantillon par type de pêche afin de voir si l'échantillon montre une différence significative avec la population au point de vue taille des bateaux: la comparaison de cette variable quantitative entre les différents groupes de bateaux (7 types de pêche - les senneurs sont regroupés avec divers - x 2 fichiers: licences96 et échantillon = 14 groupes) est réalisée par une analyse de variance à deux facteurs, soit pour le facteur 1, le groupe de bateaux associé à chacun des deux fichiers (population/échantillon) et pour le facteur 2, le type de pêche; l'analyse statistique montre qu'il existe une différence significative, d'une part, entre les deux fichiers de bateaux - ce résultat est basé sur l'analyse de la probabilité pour que la valeur du test soit supérieure à une valeur théorique appelée F; cette probabilité doit être inférieure à 5% pour avoir une différence significative entre les groupes comparés-; dans notre cas, cette différence significative entre la population et l'échantillon de bateaux est due à l'importance relative des sardiniers et des palangriers. D'autre part, on trouve une différence significative entre les types de pêche; ceci confirme les différences mises en évidence par les boîtes de dispersion dans l'analyse graphique des données. Cependant il n'existe pas d'interaction significative entre les groupes de bateaux des deux fichiers et les types de pêche - l'interaction est nommée type*fichier - puisque la probabilité pour que la valeur du test soit supérieure à F est égale à 0.2203; elle est donc > 5%; ceci indique que les tailles des bateaux par type de pêche de l'échantillon sont similaires aux tailles de bateaux par type de pêche de la population globale. Le modèle d'analyse de variance est globalement significatif: il explique 66% de la variabilité totale des longueurs observées pour les bateaux des différents types de pêche et des différents fichiers. Cette valeur donnée par le R2 permet d'évaluer la qualité du modèle statistique. RESULTATS DE L'ANALYSE DE VARIANCE A DEUX FACTEURS : Variable: L_HT longueur
|
2.6.2.4 Analyse de Données
On appelle “Analyse de Données”, l'ensemble des techniques de statistique descriptive multidimensionnelle (ou multivariée). Pour la typologie des flottilles, on utilise deux types de méthodes: les analyses factorielles et la classification automatique. Ces méthodes, dont les premières répondent à une approche géométrique, permettent de mesurer la distance, ou la similarité, entre les individus et entre les variables, et d'évaluer leur degré de ressemblance; ces ressemblances sont visualisées soit par l'intermédiaire d'une projection du nuage des individus (ou des variables) dans un plan factoriel, soit sous la forme d'un arbre dichotomique (dendrogramme) dont les embranchements successifs illustrent le regroupement des individus dans des classes emboîtées. A partir d'une coupure de l'arbre de classification, une partition de l'ensemble des individus analysés est définie et interprétée en fonction des variables ayant participé à l'analyse (variables actives) et des variables externes à l'analyse (variables supplémentaires). Cette partition, interprétée, constitue le résultat de la typologie, soit l'identification et la description des éléments au sein des différentes classes.
Il existe différentes méthodes d'analyse factorielle et de classification dont le choix dépend des caractéristiques du tableau soumis à l'analyse, notamment de la nature quantitative ou qualitative des données, et du critère de distance pour mesurer les relations entre les individus ou les variables. Le choix judicieux de ces méthodes nécessite impérativement une connaissance minimale sur le fondement théorique des techniques d'Analyse de Données. La figure 2 présente les différentes étapes de l'exploration de la structure des données par ces méthodes. Dans une première étape, il est conseillé d'effectuer une analyse factorielle pour explorer la structure des données en étudiant les relations entre les variables et la ressemblance entre les individus soumis à la typologie. La figure 3 illustre, à titre d'exemple, le résultat que l'on obtient avec une analyse factorielle adaptée à l'étude des relations entre des variables qualitatives (Analyse de Correspondances Multiples): quatre variables qualitatives sont utilisées pour effectuer la typologie des tactiques d'une pêcherie multispécifique, 1- la cible (appréhendée par le profil de capture des unités de pêche), 2- la période, 3- l'engin et 4- le lieu de pêche. Le plan factoriel permet de visualiser les proximités entre les différentes modalités des variables (8 cibles, 12 mois, 3 engins et 28 lieux de pêche). Parallèlement à l'étude des modalités, il est possible d'analyser le plan des individus et de visualiser la position des unités de pêche en rapport avec le plan des variables. La deuxième étape d'une typologie consiste ensuite à grouper les individus par un algorithme de classification ou de partition automatique. Il existe de nombreux algorithmes de classification dont le choix dépend du principe d'agglomération, et donc de ressemblance des individus au sein des classes. Le choix d'une méthode nécessite, là encore, la connaissance du principe de la méthode.
La typologie des 497 bateaux de flottilles côtières marocaines a été réalisée à l'aide de quatre méthodes d'analyse multidimensionnelle:
La classification est effectuée à partir des coordonnées factorielles des individus-bateaux sur les principaux axes factoriels, afin de lisser la variabilité des données et obtenir un arbre de classification (dendrogramme) dégageant des classes bien distinctes. La coupure de l'arbre de classification permet de définir une partition des individus-bateaux en un certain nombre de classes. Cette partition est ensuite optimisée par la méthode des nuées dynamiques qui permet d'affecter à posteriori les individus-bateaux dans les classes afin de minimiser la variabilité intra-classe et de maximiser la variabilité inter-classe. L'ensemble de cette démarche, analyse factorielle, suivie d'une classification puis d'une partition, contribue à l'étape de mise en évidence de la structure du tableau de données. |
Figure 2: Exploration de la structure des données par méthodes d'Analyse de Données
Figure 3: Exemple d'un plan factoriel issu d'une Analyse de Correspondances Multiples appliqué à des variables qualitatives pour effectuer une typologie de tactiques de pêche (pêcherie artisanale de Kayar au Sénégal en 1992).
La démarche d'analyse est résumée sous la forme d'un organigramme présentant les étapes du traitement, les tableaux de données sur lesquels portent les analyses, avec leur taille (nombre d'individus et de variables), et les méthodes choisies pour effectuer ces analyses. On présente, à tire d'exemple, 3 schémas d'analyse de typologie de flottilles concernant les tactiques de pêche (Figure 4), les caractéristiques techniques des bateaux (Figure 5) et les stratégies d'exploitation (Figure 6).
La figure 4 illustre les démarches utilisées sur des données de captures et d'efforts de pêche pour établir une typologie des tactiques de pêche, schémas similaires appliqués à la pêcherie artisanale au Sénégal et à la pêcherie chalutière de Mer Celtique. Une tactique correspond aux choix effectués au cours d'une sortie de pêche, ou d'un coup de pêche, pour le lieu, la période, l'effort de pêche (engin utilisé pour un métier polyvalent ou temps de pêche) et l'espèce(s)- cible. Le schéma d'analyse résume l'enchaînement des méthodes utilisées pour effectuer deux typologies successives: les résultats de la première typologie sur les espèces sont utilisés pour construire un deuxième tableau de données associant les différentes variables d'intérêt pour identifier les tactiques associées aux sorties de pêche. Si toutes les sorties de pêche des bateaux de la flottille sont caractérisées par leurs tactiques, il est possible ensuite de construire un troisième tableau qui donnera par bateau le temps passé dans les différentes tactiques de pêche (calendrier de pêche).
La figure 5 illustre le schéma d'analyse appliqué pour la typologie des caractéristiques techniques des bateaux des flottilles côtières marocaines. La première étape consiste à tester la représentativité de l'échantillon des 497 bateaux impliqués dans l'enquête par rapport à la population des fichiers-maîtres décrivant l'ensemble de la flotte marocaine: soit les 2169 bateaux du fichier “Armement” fourni par la Direction de la Marine Marchande et les 1777 bateaux du fichier “Licence96” fourni par la Direction des Pêches Maritimes et de l'Aquaculture; la deuxième étape consiste à décrire chacune des variables par les statistiques élémentaires; la troisième étape représente la typologie même des bateaux. Toutes les variables soumises à l'analyse étant quantitatives, la mise en évidence de la structure des données est réalisée par une ACP suivie d'une classification automatique à partir des variables de caractéristiques techniques (117 variables des 4 premiers fichiers de la base de données: 1- caractéristiques générales et équipements du pont, 2- équipement de la passerelle, 3 et 4- matériel de pêche: chalut, senne, filet, autre). L'interprétation des structures revient à faire les calculs statistiques pour chaque classe identifiée par l'étude typologique, pour toutes les variables du tableau des données.
La figure 6 illustre le deuxième schéma d'analyse appliqué aux 497 bateaux des flottilles marocaines pour reconnaître les diverses stratégies d'exploitation. Le fichier 5 de la base de données, intitulé “opérations de pêche”, comprenait 124 variables décrivant jusqu'à 4 différentes opérations de pêche effectuées par un même bateau au cours de l'année 1995. Chaque opération du questionnaire de l'enquête correspond à une campagne de pêche décrite par l'engin utilisé, la zone de pêche visitée, les espèces capturées et la période (mois du début et de la fin de la campagne). Une campagne regroupe un ensemble de sorties de pêche de même nature du point de vue engin, cible et zone de pêche. Par l'analyse de la combinaison engin * espèces * zone * période, il est possible de voir si les bateaux qui effectuent différentes campagnes de pêche utilisent plusieurs “métiers” au cours du temps, notamment pour les bateaux polyvalents possédant une licence mixte. L'analyse des stratégies d'exploitation est basée sur l'étude des campagnes de pêche en 3 étapes successives: 1- Typologie des opérations de pêche en campagne-type : 2- Construction et typologie des calendriers de pêche: 3- Interprétation des stratégies d'exploitation par les variables des autres fichiers de données: |
Figure 4: Schéma d'analyse appliqué à la typologie des tactiques de pêche de la pêcherie artisanale sénégalaise et de la pêcherie chalutière de mer celtique (ACP: Analyse en Composante Principale; ACM: Analyse des correspondances multiples; AFC: Analyse des correspondances; CAH: Classification ascendante hiérarchique) (tiré de Pelletier et Ferraris, 2000).
POPULATION CIBLE | ECHANTILLON | |
Fichier Armement 2169 bateauxx 19 variables | Fichiers Enquête 497 bateauxx 601 variables | |
Fichier Licence 96 1777 bateauxx 14 variables |
Comparaison Echantillon/Population
Test t de comparaison de moyennes
Test χ2 de comparaison de distributions
↓
Description statistique
Boites de dispersion
Histogrammes de fréquence
Statistiques élémentaires
↓
Typologie sur les caractéristiques techniques
Construction des matrices de données
497 bateaux x 117 variables
Mise en évidence de structures
Analyse en Composantes Principales
Classification ascendante hiérarchique de Ward
Partition par nuées dynamiques
Interprétation des structures
Comparaison des moyennes de classes
et des distributions de fréquences de classes
Valeur-test
Figure 5: Schéma d'analyse de la typologie de la flottille marocaine sur les caractéristiques techniques
TYPOLOGIE DES OPÉRATIONS DE PÊCHE
Mise en évidencedes campagnes-types de pêche
engin X espèces-cibles X lieu X période
Classification sur les espèces
Classification sur les zones de pêche
Classification sur les dates de pêche
Analyse des correspondances multiples
Classification automatique des opérations
TYPOLOGIE DES CALENDRIERS D'EXPLOITATION
Mise en évidence des stratégies d'exploitation
Analyse en Composantes Principales
Classification automatique des bateaux
INTERPRETATION DES STRATÉGIES D'EXPLOITATION
Relations avec les caractéristiques techniques, la typologie
sur les caractéristiques techniques, les comptes
d'exploitations et les caractéristiques de l'équipage
Figure 6: Schéma d'analyse de la typologie de la flottille marocaine sur les stratégies d'exploitation