2. Collecte et gestion des données de recherche

Site: Centre d’excellence africain pour la prévention et le contrôle des maladies transmissibles
Cours: C06_Méthodologie de la Recherche
Livre: 2. Collecte et gestion des données de recherche
Imprimé par: Visiteur anonyme
Date: mercredi 25 mars 2026, 23:44

Ce chapitre est constitué de deux sections :  la collecte des données de recherche  et  la gestion des données de recherche.

2.1 Collecte des données de recherche
A ce niveau, il semble utile de faire la distinction entre les données primaires et les données secondaires mais aussi entre les outils de collecte et les techniques ou méthodes de collecte des données:
-         Les données primaires sont des données collectées par la personne qui effectue la recherche soit à partir des personnes ou des registres existants (Wikipédia, 2016).
-         Les données secondaires sont des données collectées par une personne différente de l’utilisateur (Wikipédia, 2016).
-         Les outils de collecte des données : sont des moyens permettant de recueillir les données. Ce sont par exemples : le questionnaire, le guide d’entretien, la checklist (ou liste de vérification).
-         Les techniques ou méthodes de collecte des données : sont des stratégies utilisées pour recueillir les données. Ce sont par exemples : l’entretien individuel, l’entretien de groupe (ou focus groupe), l’observation,  le  questionnaire (auto-administré), l’enregistrement (registres, audio).
La collecte des données permet au chercheur de rassembler le matériel nécessaire sur lequel il va fonder sa recherche. Avec ce recueil direct se pose alors la question des outils avec lesquels le chercheur va obtenir les données primaires de sa recherche. Ces outils sont différents, selon l’approche, quantitative ou qualitative, adoptée par le chercheur.
C’est la raison pour laquelle, nous avons distingué les méthodes de collecte de données utilisables en recherche quantitative (sous-section 1), de celles qui relèvent de la recherche qualitative (sous-section 2). A la sous-section 3, nous aborderons la collecte des données secondaires.
Si les sujets à enquêter sont les humains, il est à noter que leurs consentements individuels éclairés écrits ou oraux doivent être obtenus avant le début de la collecte des données.


2.1.1 Collecte des données primaires en recherche quantitative 
Dans cette sous-section, nous traitons de l’élaboration, du pré-test et de l’administration du questionnaire ainsi que de l’observation.
Le mode de collecte de données primaires le plus développé dans les recherches quantitatives est la collecte par questionnaire. Nous l’abordons en premier, ensuite nous présentons l’observation.


2.1.1.1.  La collecte par interview 
 Le questionnaire est un outil de collecte de données primaires bien adapté aux recherches quantitatives puisqu’il permet de traiter de grands échantillons et d'établir des relations statistiques ou des comparaisons chiffrées. Il est généralement composé de questions fermées ou semi-ouvertes. Certains questionnaires peuvent avoir des questions ouvertes en plus des questions fermées et semi-ouvertes. Lorsque le questionnaire est composé de questions fermées et/ou semi-ouvertes, on parle de questionnaire structuré. S’il comporte des questions ouvertes, on parle de questionnaire semi-structuré. Toutefois, il est conseillé d’éviter les questions ouvertes dans un questionnaire quantitatif, car ce type de questions est approprié pour les données qualitatives.

Trois grandes étapes ponctuent la collecte de données par questionnaire : la construction initiale du questionnaire, le  pré-test pour vérifier la validité et la fiabilité   du questionnaire et l’administration définitive.


a.     L'élaboration et le pré-test du questionnaire
·        L'élaboration du questionnaire
 Lors de l’élaboration du questionnaire, il faut éviter les erreurs dans la formulation et l'agencement des questions ainsi que dans les choix de réponses proposées. Nous résumons ici quelques points fondamentaux à respecter impérativement. Un questionnaire doit toujours être formé de questions simples, faciles à comprendre par le maximum possible de personnes à interroger. Autant que possible, les questions doivent se suivre dans un ordre logique privilégiant les regroupements thématiques et facilitant le passage d'un thème à l'autre.
·        Le pré-test
Une fois la première version du questionnaire élaborée, le chercheur doit effectuer un pré-test pour vérifier la validité et la fiabilité du questionnaire c-à-dire pour mettre à l'épreuve la forme des questions, leur ordonnancement et vérifier la compréhension des répondants ainsi que la pertinence des modalités de réponse proposées.
Dans l'idéal, le questionnaire doit être administré en face à face avec quelques répondants afin de permettre également le recueil de leurs réactions non verbales. Ensuite, un pré-test réalisé selon le mode d'administration du questionnaire définitif est recommandé si l'on veut respecter les conditions d'interaction avec les répondants. Il est à noter que le pré-test se fait sur un nombre restreint de sujets similaires à la population d’étude, MAIS pas dans la population à laquelle sera administré le questionnaire. Par exemple, si l’enquête se fera à Maferinyah, on peut tester sur la population correspondante de Farmoriah. À l'issue de la phase de pré-test, le questionnaire doit être pertinent et clair pour le chercheur comme pour les répondants.


b.  L’administration du questionnaire
Il existe plusieurs types d’administration du questionnaire. On peut l’administrer en face à face, par téléphone ou par voie électronique.
Nous présentons les spécificités de chacun de ces modes d'administration mais dans tous les cas, la phase d'administration du questionnaire recèle ses propres difficultés et demande un soin tout particulier. Enfin, l’administration d’un questionnaire mobilise des techniques différentes selon qu’elle s’opère en face à face, par téléphone ou encore par voie électronique.
·        L'administration d'un questionnaire en face à face
Cette procédure d'administration permet de répondre directement aux interrogations que peuvent se poser les répondants sur la nature même des questions. Elle permet également un meilleur contrôle de l'échantillon (savoir qui a repondu). Les principales limites sont que le chercheur doit toujours se garder d'exprimer toute opinion ou forme d'approbation ou de désapprobation au risque d'influencer le répondant. Par ailleurs, ce mode d'administration bloque les réponses de certaines personnes qui les considèrent comme trop personnelles pour être exprimées en face à face.
·        L'administration d'un questionnaire par téléphone
Comme pour les techniques précédentes, le chercheur doit amorcer l'interaction en exposant les objectifs et la contribution de la recherche. Le contact préalable par courrier permet, là encore, de préparer et de valoriser le répondant
potentiel. Cette technique évite la surprise et réduit la réaction négative propre à cet outil de communication souvent dérangeant.
·        L'administration d'un questionnaire par voie électronique
Ce mode d'administration peut s'opérer selon deux techniques. Le chercheur peut envoyer une disquette contenant un programme que les répondants lanceront sur leur ordinateur personnel pour répondre directement au questionnaire. Ils renvoient ensuite la disquette.

 Il est également possible d'utiliser le réseau internet en demandant aux répondants de se connecter sur un site web où ils trouveront le questionnaire et pourront y répondre directement. Ces deux méthodes présentent l'avantage de dispenser le chercheur des tâches ingrates de mise sous plis, d'envoi, et de saisie informatique des réponses, celles-ci étant directement utilisables pour des analyses statistiques.
L’administration d’un questionnaire par voie électronique ne s’applique pas aux répondants illettrés.
En annexe 1 (Tableau 1), nous proposons quelques comparaisons entre les différents modes d'administration d'un questionnaire.


2.1.1.2    L’observation dans les recherches quantitatives
L’observation n’est pas une méthode de collecte très courante dans les recherches quantitatives pour deux raisons :
·        Il est difficile de mener des observations sur de larges échantillons.
·        Si toutefois, le dispositif de collecte permet de résoudre ce problème de taille d’échantillon en mobilisant plusieurs observateurs, cela peut créer un autre problème de fiabilité de la mesure, les observations risquent de ne pas être homogènes.
Dans ce cas, il est donc nécessaire de recourir à une fiche d’observation "systématique" dont les éléments seront cochés au fur-et-à mesure de l’observation afin de décrire de la même façon les variables observées (comportements, attitudes, pratiques, environnement).
Cette fiche est construite comme un questionnaire sur la base du modèle conceptuel de la recherche et du choix de la méthode d'analyse des données que le chercheur compte utiliser. Les données collectées par observation systématique peuvent faire l'objet d'un traitement quantitatif.


2.1.2. Collecte des données primaires en recherche qualitative 
Dans cette sous-section, nous abordons les principaux modes de collecte en recherche qualitative : entretien individuel approfondi, discussion de groupe, observation participante ou non participante.


2.1.2.1.         L’entretien

Il existe deux types d’entretiens : Entretien individuel approfondi et la discussion de groupe ou focus groupe.
   L’entretien individuel approfondi

Après l’obtention d’un consentement éclairé (voir module 3) et l’acceptation (ou non) par le participant d’un enregistrement (si prévu par l’étude), l’entretien individuel approfondi consiste à diriger une conversation avec le répondant, en se basant sur une liste de questions ouvertes ou une liste de sujets de discussion préparés dans d’un guide appelé guide d’entretien. Ces questions ou sujets peuvent être modifiées en cours d’étude (processus itératif). L’entretien individuel approfondi peut aussi consister en une conversation ouverte sur un thème donné, sans se référer d’un guide d’entretien. Dans cette situation la conversation n’est pas guidée par le chercheur.
    L’entretien de groupe ou  «discussion de groupe» ou encore « focus groupe »
Après l’obtention d’un consentement éclairé (voir module 3) et l’acceptation (ou non) par le participant d’un enregistrement (si prévu par l’étude), la discussion de groupe consiste à animer une conversation de groupe (regroupant généralement 6 à 8 (max 12 répondants), animé par le ou les chercheur(s) et avec l’aide d’un rapporteur.    Le rôle du (ou des) animateur(s) consiste à faciliter l’expression des différents individus et à gérer la dynamique du groupe. La discussion de groupe est généralement guidée par un guide de discussion qui comporte les questions ou sujets clés autour desquelles la conversation se tient. La discussion de groupe demande donc une préparation substantielle car les objectifs et les règles d’intervention des sujets, prise de parole et thèmes à aborder, doivent être clairement définis au début de l’entretien. Par exemple on peut se mettre d’accord d’utiliser des surnoms (par les participants) pour éviter toute identification dans l’enregistrement. Le rapporteur notera les interactions et des attitudes, réactions pour compléter la transcription.
Toutefois, la maîtrise de la discussion de groupe exige certaines aptitudes spécifiques de la part de l’investigateur afin de ne pas altérer la dynamique de l’entretien et fausser les données recueillies. Ces aptitudes sont les suivantes :
-         Empêcher un individu ou une petite coalition de dominer le groupe ;
-         Encourager les sujets récalcitrants à participer ;
-         Obtenir du groupe une analyse la plus complète possible du thème abordé ;
-         Savoir équilibrer entre un rôle directif et un rôle modérateur afin de prêter attention à la fois au guide d’entretien et à la dynamique de groupe ;
-         Enfin la constitution du groupe doit limiter la redondance et viser l’exhaustivité de la représentation des acteurs concernés par la question de recherche.

2.1. 2. 2.       L’observation dans les recherches qualitatives
L’observation est un mode de collecte des données par lequel le chercheur observe de lui-même, de visu, des processus ou des comportements se déroulant dans une structure de santé, un service, au sein d’une communauté, etc., pendant une période de temps délimitée. L’observation constitue un mode de recueil alternatif (additionnel) de l’entretien dans le sens où le chercheur peut analyser des données factuelles dont les occurrences sont certaines, plutôt que des données verbales (issues de l’entretien) dont l’inférence factuelle est sujette à caution.
Deux formes d’observation peuvent être distinguées en fonction du point de vue ou l’approche du chercheur par rapport aux sujets observés : l’observation participante et celle non-participante.
-         L’observation est participante lorsque le chercheur adopte une approche interne ; C’est-à-dire le chercheur participe au phénomène observé. Exemple : Dans l’objectif d’évaluer la qualité des soins après avortement (SAA) dans un centre médical communal, un chercheur procède à l’observation de la prestation des SAA en participant aux différentes procédures avec le (les) prestataire (s) en charge des SAA.
-         L’observation est non-participante quand le chercheur adopte une approche externe ; C’est-à-dire le chercheur n’interfère pas avec le phénomène observé.
Exemple : Dans l’objectif d’évaluer la qualité des soins après avortement (SAA) dans un centre médical communal, un chercheur procède à l’observation de la prestation des SAA en observant (sans participer) les différentes procédures délivrées par le (les) prestataire (s) en charge des SAA.


2.1.3 Collecte des données secondaires
Les données secondaires sont des données qui existent déjà. Il est conseillé de commencer systématiquement une recherche en s’interrogeant sur l’existence des données secondaires disponibles. L’utilisation de ces données présente de nombreux avantages. Elles sont généralement peu chères et rapides à obtenir. Elles sont déjà assemblées et ne nécessitent pas forcément un accès aux personnes qui les ont fournies. Elles ont une valeur historique et sont utiles pour établir des comparaisons et évaluer des données primaires. Cependant, ces données peuvent être difficiles à obtenir, obsolètes, plus ou moins approchées et exhaustives.
De plus, il se peut que le format des données ne corresponde pas tout à fait à celui du chercheur. Ce dernier doit les convertir c’est-à-dire changer leur forme originelle pour un format mieux adapté à ses besoins. Le chercheur doit donc toujours comprendre pour quel objet les données ont été construites avant de les utiliser.

Exemples de données secondaires : archives, notes, rapports, documents, 

règles et procédures écrites, modes d'emploi, revues de presse, thèses, 

publications gouvernementales (documents officiels, études ministérielles...),

 les publications d'organismes publics et/ou internationaux (WHO, UNICEF, 

etc.), etc.

2.2 Gestion des données de recherche
La gestion des données est un processus cyclique (figure 1) qui commence par la collecte des données, suivie du traitement et de l’utilisation des données pour l’analyse, le stockage, et le partage des données.
La plupart des projets de recherche génèrent une quantité importante de données. Ces données doivent être de bonne qualité car il n’existe pas d’étude qui soit meilleure que la qualité de ses données. Par conséquent, une bonne gestion des données est fondamentale pour une recherche de haute qualité. Les bonnes pratiques en matière de gestion des données aident également les chercheurs à s’assurer que les processus requis de collecte et d’analyse des données soient organisés, compréhensibles et transparents.
 
Les principales responsabilités de gestion des données comprennent :

·         (Transcription des données qualitatives (enregistrement vers fichiers Word électroniques)
·         Enregistrer les données sur une base de données.
·         Corriger et valider les données.
·         Fournir des données sous une forme qui permettra l’analyse.
·         Stocker et partager les données.

Il est important de rappeler que la confidentialité de l’identité des répondants doit être garantie à tout moment dans le processus de gestion des données. Cela est généralement stipulé dans l’approbation éthique reçue (par exemple, conservation de fichiers dans un ordinateur protégé par mot de passe, armoires verrouillées, limite du nombre de personnes ayant accès à des données anonymisées). De plus, vous indiquerez pendant combien de temps vous conserverez les données après la fin de la recherche. Vous devez vous assurer que ces critères éthiques sont appliqués tout au long du projet de Recherche.


Nous vous esquissons ci-dessous, le contenu de chaque étape du processus cyclique de la gestion des données présenté dans la figure 1 :


-         Création ou collecte des données 

La création des données (déjà abordée dans la section précédente (section 1)), est la première étape des processus de gestion des données.
Dans les études quantitatives, cette étape consiste à définir quel type de données sera collecté, leur format et la procédure pour les créer. Le chercheur doit s’assurer que toutes les données recueillies reflètent la réalité, en utilisant des outils normalisés, des procédures de collecte de données, et en vérifiant le taux d’erreur pendant la collecte de données (par exemple, en vérifiant l’exhaustivité et la cohérence des réponses des répondants dans les questionnaires, en vérifiant la validité des réponses par un processus de répétition au hasard des entretiens).
Dans une étude qualitative, cette étape commence par la définition des différents types d’informations que le chercheur a l’intention de rassembler, différents outils (par exemple, entretiens en profondeur ou guide de discussions de groupe) et des activités de collecte de données. Le chercheur doit s’assurer que tous les dispositifs d’enregistrement sont placés de manière à enregistrer au mieux la conversation ou la discussion, et que le lieu d’entretien ou de discussion crée une atmosphère sûre pour une discussion ouverte tout en préservant la confidentialité.
-         Traitement des données
C’est le processus de transformer les données de la forme la plus brute à une forme qui est prête pour l’analyse.
Dans une étude quantitative, cela signifie créer une base de données électronique appropriée pour gérer différents types de données (par exemple, réponses multiples, données numériques, données d’échelle visuelle analogique, etc.). Cela implique la création de structures de fichiers et de codage compréhensibles, le développement d’un livre de codes, des décisions concernant les données à conserver dans la base de données et celles à éliminer. Lors de la saisie des données, les erreurs de saisie doivent être évitées en appliquant une double saisie et en vérifiant la cohérence des réponses.
Dans une étude qualitative, cela signifie que toutes les données enregistrées sont transcrites textuellement et dans certains cas, les transcriptions peuvent être partagées avec les répondants pour en vérifier le contenu. Cela implique également l’élaboration d’un livre de codes, en particulier lorsque plus d’un chercheur effectue l’analyse. Toutes les données qualitatives recueillies doivent être sauvegardées dans une application de gestion de données qualitative.
-         Analyse des données 
L’analyse de données dans les études quantitatives consiste à identifier des tendances par une analyse descriptive, en comparant les données, en testant des hypothèses et en trouvant des relations entre variables. Dans les études qualitatives, ce processus consiste à identifier, comprendre le sens et assigner des codes aux données, identifier les tendances et les thèmes émergents, et construire un cadre pour expliquer certains phénomènes.
-         Stockage des données
Le stockage de données implique des activités non seulement pendant la période d’étude, mais également à long terme en archivant des données dans un dépôt ou un centre de données. Actuellement, le dépôt/stockage de données électroniques est le moyen préféré car il nécessite peu d’espace et est simple à sauvegarder. Cependant, une stratégie de stockage de données est nécessaire car les supports de stockage numériques ont également plusieurs limitations, par exemple, problèmes de qualité et obsolescence des supports de stockage, interopérabilité logicielle, équipement de lecture de données et alimentation électrique. La sécurité des données est un autre problème dans le stockage des données. Les problèmes de sécurité comprennent la sécurité physique des données (par exemple, salle ou armoire verrouillée, journal d’accès) et la sécurité des données électroniques (par exemple, accès sécurisé par mot de passe, niveau d’accès et cryptage des données pour partage et transmission). Les directives de l’OMS sur les bonnes pratiques cliniques recommandent que les données et les documents essentiels soient conservés pendant au moins deux ans après la fin du projet de recherche.
-         Partage des données
Le partage de données est particulièrement important dans les études collaboratives multi-centres ou multi-pays. Le partage de données, ainsi que le transfert de données, le stockage de données et l’accès pour tous les partenaires ou institutions en collaboration peuvent être difficiles car ils peuvent impliquer des réglementations différentes. Le partage de fichiers en ligne (par exemples: Cloud, Google drive) peut être préférable, bien qu’il puisse ne pas convenir à tous les types de données, en particulier aux données confidentielles identifiables. De plus, les chercheurs ne contrôlent pas où les données sont effectivement stockées.
Le partage des données devient obligatoire dans de nombreux domaines afin d’assurer la transparence, d’éviter la duplication ainsi que le plagiat. Étant donné que la recherche peut impliquer différentes institutions ou organisations, les directives pour le partage et l’appropriation des données doivent être clairement énoncées au début par le biais d’accords tels qu’un protocole d’accord. Le partage des données doit suivre un processus clair et peut être effectué entre deux institutions de recherche, mais pas entre deux personnes. Il faut vérifier vos propres directives institutionnelles et nationales avant de concevoir des accords de partage de données.
NB : Il est à noter que le ‘‘processus cyclique’’ de gestion des données de recherche n’est pas un cycle de rotation systématique. Car Il n’y a pas de lien entre le partage des données et le début d’une nouvelle collecte.

Chapitre SUIVANT