Notes
-
[*]
London School of Economics.
Correspondance : Katherine Keenan, London School of Economics, Department of social policy, Houghton Street, London, WC2A 2AE, courriel : k.keenan1@lse.ac.uk -
[1]
La première vague de l’enquête SHARE en Suède a été menée en 2004 ; la première vague de l’enquête GGS en Suède a été menée en 2012-2013.
-
[2]
L’enquête GGS en Estonie et l’enquête SHARE en Allemagne, en Hongrie et aux Pays-Bas précisent que les personnes résidant dans des institutions ont été inclues. Cependant, dans notre analyse, la proportion de ces personnes institutionnalisées âgées de 50 à 80 ans reste négligeable : dans l’enquête GGS en Estonie, il y avait sept personnes (< 0,1 %), et ils n’étaient pas identifiables dans SHARE.
-
[3]
Dans les pays où les GGS ont échantillonné des personnes âgées de 79 ans, les données comprennent des personnes qui ont eu 80 ans entre l’échantillonnage et la passation de l’enquête. Font exception l’enquête GGS en Estonie qui a délibérément échantillonné des personnes âgées de 80 ans, et l’enquête GGS en Hongrie qui n’a échantillonné que jusqu’à 78 ans.
-
[4]
Dans les GGS, de nombreux questionnaires utilisent leur propre classification par pays dont les résultats sont ensuite recodés en équivalent CITE.
-
[5]
Les données sur la population d’Eurostat utilisent une répartition par âge au 1er janvier, tandis que pour les données d’enquête, nous calculons l’âge au moment de l’enquête en utilisant les dates de naissance.
-
[6]
Nous avons choisi les « pondérations calibrées » de SHARE de préférence aux « pondérations d’échantillonnage » qui ne corrigent que les probabilités inégales d’échantillonnage.
1Deux enquêtes européennes sont largement utilisées en démographie, notamment pour étudier les populations vieillissantes. il s’agit de l’enquête sur la santé, le vieillissement et la retraite (SHARE) et de l’enquête Générations et genre (GGS). Si ces deux enquêtes couvrent des groupes d’âges de répondants et des problématiques différents, elles ont beaucoup de points communs. toutes deux longitudinales, ces enquêtes contiennent des questions et des thématiques communes et présentent des échantillons de répondants de 50 à 80 ans conséquents dans sept pays européens, qui pourraient permettre des analyses conjointes. Encore faut-il que ces enquêtes soient comparables. C’est ce que proposent ici de vérifier Katherine Keenan, Else Foverskov et Emily Grundy, en s’interrogeant sur la cohérence des réponses entre GGS et SHARE. Prenant pour illustration deux indicateurs de santé courants que sont la santé perçue et les affections de longue durée, ainsi que leur lien avec le niveau d’éducation et le statut conjugal, les auteures mettent en exergue l’importance de la pondération des enquêtes, de la formulation des questions et de leur place dans le questionnaire pour expliquer les écarts de résultats.
2La bonne compréhension de l’impact du vieillissement sur les comportements sociodémographiques, la santé, les ressources et les modèles d’activité est une priorité en Europe, étant donné l’augmentation, passée et à venir, de la part des personnes âgées dans la population (Nations unies, 2013). Cette compréhension doit se baser sur des données longitudinales représentatives et de bonne qualité. À cette fin, des ressources considérables ont été consacrées pour constituer un ensemble de données longitudinales à grande échelle et transnationales, notamment l’enquête sur la santé, le vieillissement et la retraite en Europe (Survey of Health, Ageing and Retirement in Europe, SHARE) (Börsch-Supan et al., 2013) et l’enquête Générations et genre (Generation and gender Survey, GGS) (Vikat et al., 2007), toutes deux libres d’accès et largement utilisées. Bien que chacune collecte des données sur les personnes âgées, les deux enquêtes ont des objectifs différents. GGS a été principalement conçue pour analyser la famille et les processus intergénérationnels de l’entrée dans la vie adulte jusqu’à la vieillesse, tandis que SHARE porte plus spécifiquement sur le vieillissement. Les deux enquêtes ont commencé dans les années 2000. Bien que la qualité des données collectées ait été vérifiée à travers des comparaisons avec d’autres sources, notamment des données nationales et des enquêtes démographiques européennes telles que le panel européen des ménages sur les revenus et conditions de vie dans l’Union européenne (EU-SILC) (Fokkema et al., 2014 ; Börsch-Supan et al., 2005 ; Croezen et al., 2013 ; Vergauwen et al., 2015), elles n’ont à ce jour pas été analysées ensemble. Nous comparons ici les données GGS et SHARE sur leur échantillon commun en termes de pays et de tranches d’âges.
3Cet article a pour ambition de présenter les origines des possibles différences entre les enquêtes SHARE et GGS et de déterminer si de mêmes mesures de la santé fournissent des informations comparables selon les deux enquêtes, en termes de prévalence de mauvaise santé compte tenu des caractèristiques sociodémographiques de la population. Nous commençons par examiner les méthodologies des enquêtes GGS et SHARE, puis nous comparons les données sur les indicateurs communs, notamment l’âge, le sexe, l’éducation, la fécondité, le mariage et la santé. Nous poursuivons par l’évaluation de la comparabilité des résultats à partir d’un modèle de régression multivariée afin de mettre en évidence des relations entre deux indicateurs sociodémographiques, que sont l’éducation et le statut conjugal, et ces mesures de la santé.
I – Méthodologie : comparaison entre les enquêtes SHARE et GGS
Conception des enquêtes
4Les deux enquêtes de référence SHARE et GGS ont été menées dans dix pays communs : Allemagne, Autriche, Belgique, Estonie, France, Hongrie, Italie, Pays-Bas, Pologne, Suède. Nous avons comparé les mesures de sept de ces pays pour la population âgée de 50 à 80 ans. Nous avons exclu l’Italie et l’Autriche parce qu’aucune de leurs données GGS ne comprenait de répondant âgé de 65 ans ou plus. Au moment de la rédaction de cet article, les données GGS pour la Suède n’étaient pas disponibles et ont donc été également écartées. Les données GGS et SHARE n’ont généralement pas été collectées la même année et l’écart séparant les deux enquêtes est plus ou moins grand selon les pays (jusqu’à huit années) [1], ce qui peut gêner leur comparabilité.
5Le tableau 1 montre les principales caractéristiques des procédures d’échantillonnage et du type de collecte des enquêtes analysées ici : les enquêtes GGS de la première vague, et les enquêtes SHARE de la vague de référence (l’Estonie, la Hongrie et la Pologne ont rejoint l’enquête SHARE lors de la seconde vague ou après). Tous les pays, à l’exception de l’Estonie et des Pays-Bas (GGS), utilisent des stratégies d’échantillonnage basé sur une source extérieure, les sources les plus courantes étant le recensement ou le registre de population. Dans la plupart des pays, l’échantillonnage a été conçu pour couvrir la population vivant dans des ménages privés, mais les enquêtes menées dans certains pays incluent également les personnes vivant en institution [2].
Échantillonnage et méthodologie d’enquête pour la première vague GGS et les données de référence SHARE (pays communs à l’exception de l’Autriche, de l’Italie et de la Suède)(a),(b),(c),(d),(e),(f)
Échantillonnage et méthodologie d’enquête pour la première vague GGS et les données de référence SHARE (pays communs à l’exception de l’Autriche, de l’Italie et de la Suède)(a),(b),(c),(d),(e),(f)
ND : Information non disponible.(a) : PPT = probabilité proportionnelle à la taille, EAS = échantillonnage aléatoire simple, IA = itinéraire aléatoire, SysA = échantillonnage systématique avec point de départ aléatoire.
(b) : Travail de terrain mené par les services statistiques belges entre février 2008 et avril 2009, et par TNS Dimarso de novembre 2009 à mai 2010.
(c) : « Taux moyen » calculé par Fokkema et al. (2014).
(d) : et leur partenaire et époux de tous âges.
(e) : Aquitaine, Île-de-France, Languedoc-Roussillon, Nord-Pas-de-Calais, Pays de la Loire, Rhône-Alpes.
(f) : Fait référence aux caractéristiques d’échantillonnage de la vague 1 des « points décisifs du programme sur le parcours de vie ».
6Les populations interrogées sont différentes et reflètent les objectifs distincts des enquêtes GGS et SHARE. L’enquête SHARE cible l’ensemble des ménages comprenant au moins une personne âgée de 50 ans ou plus et, au sein de ces ménages, les époux ou partenaires de ces personnes quel que soit leur âge (Börsch-Supan et Jürges, 2005). Dans l’enquête GGS, au contraire, la population cible est constituée d’individus âgés de 18 à 79 ans [3] et seule une personne par ménage est interrogée. Les taux de réponse les plus faibles pour GGS et SHARE sont observés en Belgique (respectivement 43,8 % et 39,2 %). L’enquête GGS aux Pays-Bas affiche également un taux de réponse relativement faible de 44,7 %. Cependant, dans la plupart des autres pays, les taux de réponse dépassent 60 % pour les deux enquêtes.
Échantillon analysé
7Nous avons sélectionné des hommes et des femmes âgés de 50 à 80 ans au moment de l’enquête en nous basant sur les dates de naissance fournies (50- 79 ans dans les données GGS pour la Hongrie). Les partenaires en dehors de la tranche d’âge SHARE (moins de 50 ans) ont été exclus des analyses parce qu’ils ne constituent pas un échantillon représentatif. Cela donne des échantillons de 2 255 à 10 447 individus pour chacune des enquêtes et pays envisagés (tableau 2). La proportion des valeurs manquantes sur les variables se situe entre 0,1 % et 4,1 %. Les différences de calendrier entre GGS et SHARE, en particulier pour la Belgique, l’Estonie, la Hongrie et la Pologne, signifient que les enquêtes comprennent les survivants à un certain âge, et ce pour différentes cohortes de naissance (tableau 2), ce qui pourrait biaiser les évolutions dans le temps pour certaines variables. Afin d’évaluer si ces différentes dates d’enquête affectent la comparabilité, nous avons effectué des comparaisons supplémentaires sur un sous-ensemble de cohortes de naissance identiques. Cependant, nous reconnaissons que cela implique de comparer les cohortes ayant survécu à différents âges, et cette sélection peut également biaiser la comparabilité des indicateurs de santé, en particulier lorsque la période entre deux enquêtes est longue.
Calendrier des enquêtes, taille des échantillons et cohortes de naissances
Calendrier des enquêtes, taille des échantillons et cohortes de naissances
Mesures sociodémographiques
8Nous avons comparé les répartitions par âge, niveau d’éducation, statut conjugal et nombre d’enfants. L’âge a été catégorisé en groupes quinquennaux. SHARE et GGS utilisent toutes deux la mise à jour de la classification internationale type de l’éducation (CITE) de 1997 [4] pour classer les niveaux de formation. Sont distingués le niveau d’éducation faible (CITE 0-2, pas d’éducation, éducation primaire et premier cycle du secondaire) ; le niveau intermédiaire et supérieur (CITE 3-6, second cycle du secondaire, postsecondaire et enseignement supérieur).
9Nous utilisons une mesure légale du statut conjugal divisé en quatre catégories (jamais marié, marié, divorcé et veuf) réduit à deux catégories « marié » et « non marié » pour certaines analyses et les régressions. Dans l’enquête GGS, le statut conjugal a principalement été construit à partir des réponses aux questions sur l’histoire conjugale ou la vie de couple. La variable obtenue disposait des quatre modalités. Pour SHARE, nous avons utilisé une seule question, demandant au répondant s’il était marié et vivant avec son conjoint, dans un partenariat enregistré, marié et vivant séparément de son conjoint, jamais marié, divorcé ou veuf. Nous avons regroupé les trois premières catégories établies dans SHARE sous la catégorie « marié ». Dans SHARE ou GGS, si les répondants précisaient (dans d’autres questions) qu’ils n’étaient pas mariés mais vivaient avec leur partenaire, nous avons codé leur statut conjugal en conséquence (jamais marié, divorcé ou veuf).
10Pour l’indicateur de descendance finale, nous avons regroupé le nombre d’enfants en cinq catégories : 0, 1, 2, 3 et 4+ simplifié en « avec enfant(s) » ou « sans enfant » pour la plupart des analyses. Le nombre d’enfants dans SHARE a été mesuré en demandant : « Combien avez-vous d’enfants qui sont encore en vie ? Prenez en compte tous vos enfants naturels, accueillis dans votre famille, adoptés, ainsi que ceux de votre conjoint ou partenaire ». Le questionnaire de la première vague de l’enquête SHARE demande également spécifiquement si les enfants sont biologiques ou non biologiques, mais seulement pour les quatre premiers enfants déclarés. Un décompte similaire d’enfants biologiques, adoptés, accueillis ou de beaux-enfants encore vivants a été obtenu pour GGS en combinant des informations de la liste des membres du ménage et les questions sur les enfants non résidents dans le ménage. Cependant, le manque d’information sur les beaux-enfants non résidents dans les enquêtes en Pologne et en Estonie, et sur le décès des beaux-enfants dans l’enquête en France, peut se traduire par de légères différences d’estimation pour ces pays.
Mesures de la santé
11Deux indicateurs de santé sont mobilisés : la santé subjective ou autoévaluée (SAE) et la présence d’affections de longue durée (ALD) ou de maladies chroniques. À cause des différences de formulation des questions, la SAE n’est directement comparable entre les enquêtes qu’en Allemagne, en Belgique, en France et aux Pays-Bas. La première vague de GGS a utilisé la version européenne de la mesure de la SAE (Robine et al., 2002) qui dispose d’une échelle de notation de 1 à 5, soit de « très bonne » à « très mauvaise ». Les enquêtes de référence SHARE en Allemagne, en Belgique, en France et aux Pays-Bas utilisent à la fois cette version européenne et la version américaine de la SAE qui dispose d’une échelle de 1 à 5 allant d’« excellente » à « mauvaise ». Les enquêtes SHARE d’Estonie, de Hongrie et de Pologne n’ont demandé que la version américaine. Pour la version européenne, nous avons divisé les réponses en « bonne » (pour ceux qui déclaraient avoir une très bonne ou une bonne santé) ou « mauvaise » (pour ceux qui déclaraient avoir une santé moyenne, mauvaise ou très mauvaise). Pour l’échelle américaine, les répondants qui estiment avoir une santé excellente, très bonne ou bonne sont considérés comme ayant une bonne SAE tandis que les répondants qui estiment avoir une santé moyenne ou mauvaise sont considérés comme ayant une mauvaise SAE. Des études ont montré que les versions européenne et américaine des questions SAE ne sont pas tout à fait comparables (Jürges et al., 2008), et l’utilisation de la version américaine conduit habituellement à des estimations rendant compte d’une meilleure santé que les réponses à la version européenne. Lorsque les deux versions sont disponibles, nous montrons les deux distributions de SAE à laquelle elles conduisent, ce qui nous permet de voir les effets des différences de formulation.
12Les ALD ont été mesurées dans l’enquête GGS en demandant « souffrez-vous d’une affection de longue durée ou d’une maladie chronique » et dans SHARE en demandant « souffrez-vous de problèmes de santé, de maladies, de handicaps ou d’infirmités durable », questions auxquelles il était possible de répondre par oui ou par non. En outre, l’enquête GGS en Estonie spécifiait une maladie « durant trois mois ou plus ».
Méthodes analytiques et pondérations post-stratification
13Premièrement, pour évaluer la représentativité, nous comparons la répartition pondérée par âge et par sexe dans les enquêtes GGS et SHARE entre elles, puis avec les données sur la population nationale telles qu’elles apparaissent dans Eurostat pour l’année où l’enquête a eu lieu [5]. Des analyses descriptives sont ensuite réalisées pour comparer les proportions pondérées avec des caractéristiques particulières dans SHARE et GGS par pays et par sexe. Les comparaisons des versions non binaires des variables (avec l’ensemble des modalités de réponses) d’éducation, de statut conjugal et de nombre d’enfants sont présentées dans les figures annexes A.1 à A.3. Nous utilisons les pondérations post-stratification fournies avec les enquêtes GGS et SHARE pour effectuer les comparaisons. Dans GGS, les facteurs de pondération varient selon les pays, et pour certains pays comme la Hongrie, aucune information n’est disponible (Fokkema et al., 2014). Nous fournissons des informations de base sur les facteurs de pondération de GGS dans le tableau annexe A.1. Pour la plupart des pays, la pondération doit ajuster l’échantillon afin qu’il soit représentatif au niveau national sur des aspects importants tels que l’âge, le sexe, l’urbanisation, la région et la taille du ménage. Les poids d’échantillonnage GGS pour la Belgique, l’Estonie et la Suède ne prennent pas en compte la taille du ménage, nous avons donc recalculé la pondération dans ces pays en utilisant les données de l’année d’échantillonnage sur la répartition par taille des ménage téléchargées sur Eurostat (2015). Cet ajustement est important, car seule une personne par ménage a été interrogée dans l’enquête GGS (ce qui résulte en une plus forte probabilité de sélection de personnes vivant seules) tandis que dans SHARE, tous les individus de 50 ans et plus ont été échantillonnés. L’enquête GGS en Pologne ne disposant pas de pondération, nous avons donc également pondéré les données sur la taille du ménage (sans recourir à d’autres facteurs comme le sexe ou l’âge). Pour les enquêtes SHARE, nous avons utilisé des « pondérations transversales calibrées » qui tiennent compte des probabilités inégales d’échantillonnage, et s’adaptent à la structure par âge et par sexe connue dans la population générale [6] (Institut de recherche en économie du vieillissement de Mannheim (MEA), 2013).
14En dépit des différences de structures de la population des répondants, on pourrait s’attendre à ce que le gradient sociodémographique de santé soit similaire dans les deux types d’enquêtes. Pour évaluer si c’est le cas, nous avons utilisé des modèles de régression logistique multivariée pour analyser les relations entre deux indicateurs sociodémographiques (l’éducation et le statut conjugal) et les deux indicateurs de santé (SAE et ALD). Les modèles multivariés ne sont pas pondérés, mais les modèles sont contrôlés par l’âge (mesure en continu), le statut conjugal et le niveau d’instruction. Pour tester si les estimations des modèles multivariés étaient significativement différentes dans SHARE et GGS, nous avons combiné les données des deux sources dans un seul modèle en ajoutant des interactions avec une variable indiquant la source.
Représentativité
15Les travaux antérieurs comparent l’une des deux enquêtes avec les estimations nationales de population pour évaluer leur représentativité (Fokkema et al., 2014 ; Börsch-Supan et Jürges, 2005). Pour GGS, l’utilisation de pondérations post-stratification a permis de réduire (sans les annuler) les différences avec la population générale sur les variables d’âge, de sexe et de région, mais n’a pas corrigé les éventuels biais qui peuvent exister pour le statut conjugal et l’éducation (Fokkema et al., 2014). D’autres études ont montré que les taux de mariage et de fécondité pour les cohortes les plus âgées de l’enquête GGS sont sous-estimés lorsqu’ils sont comparés avec les données exhaustives, même lorsque les poids d’échantillonnage sont appliqués, alors que les indicateurs transversaux à partir de 1970 correspondent approximativement à ceux observés sur des données exhaustives (Vergauwen et al., 2015 ; Kreyenfeld et al., 2013). Pour SHARE, l’utilisation de la « pondération calibrée » post-stratification produit des estimations très proches des estimations nationales sur ces populations (Börsch-Supan et Jürges, 2005). Afin de poursuivre la vérification, nous avons comparé les répartitions par groupe d’âges et de sexe des échantillons SHARE et GGS avec ces mêmes répartitions dans les données nationales pour les années d’enquête concernées (figure 1). Dans l’ensemble, les échantillons SHARE et GGS ont des structures par âge très similaires, à l’exception de l’enquête SHARE hongroise qui affiche une proportion nettement plus marquée d’hommes et de femmes âgés de 55 à 59 ans que GGS. Cela est en partie dû au délai écoulé de 5 à 6 ans entre les deux enquêtes, ce qui signifie que l’enquête la plus tardive comprend une plus grande proportion de personnes nées durant le « baby boom » d’après-guerre. Les autres plus grandes différences entre les données nationales et les données d’enquête ont été constatées pour les femmes des échantillons GGS belge et allemand, les hommes des échantillons GGS français et polonais et de l’échantillon SHARE hongrois. Les poids d’échantillon du GGS polonais n’étant pas ajustés selon l’âge, il n’est pas surprenant de constater davantage de différences. Souvent, les estimations pondérées des enquêtes GGS (en Estonie, en France et en Pologne) sous-représentent les hommes et les femmes âgés de 50 à 54 ans, ce qui pourrait être lié à une catégorisation plus large de l’âge (45-64 ans) lors des pondérations GGS, tandis que pour SHARE, les pondérations sont ajustées à 50 ans. La figure 2 montre la proportion pondérée de femmes dans SHARE et GGS par rapport aux données nationales. Sans surprise, la plus grande différence de répartition par sexe s’observe pour l’enquête GGS en Pologne où les pondérations ne sont pas ajustées selon le sexe. Les répartitions par sexe les plus proches sont pour l’Allemagne et la Hongrie. Dans aucun pays la différence n’est supérieure à deux points de pourcentage.
Distributions pondérées des hommes et des femmes âgés de 50 à 80 ans dans les enquêtes GGS et SHARE, comparées aux données de population générale aux mêmes dates
Distributions pondérées des hommes et des femmes âgés de 50 à 80 ans dans les enquêtes GGS et SHARE, comparées aux données de population générale aux mêmes dates
Proportions de femmes dans la populaion âgée de 50 à 80 ans d’après les enquêtes GGS et SHARE, par comparaison aux données de population générale aux mêmes dates
Proportions de femmes dans la populaion âgée de 50 à 80 ans d’après les enquêtes GGS et SHARE, par comparaison aux données de population générale aux mêmes dates
II – Résultats
Répartition par caractéristiques sociodémographiques et de santé
16Les tableaux 3 et 4 montrent la répartition pondérée (mais non ajustée) des indicateurs sociodémographiques et sanitaires dans les enquêtes SHARE et GGS, respectivement pour les femmes et les hommes. Les différences entre SHARE et GGS en termes de proportion de personnes mariées et sans enfant sont relativement faibles (les résultats sont similaires avec les mesures disposant de tous les choix de réponses sur le statut conjugal et le nombre d’enfants). En Belgique, l’échantillon GGS a proportionnellement plus de répondants sans enfant que l’échantillon SHARE. Dans l’ensemble, les différences de répartition les plus importantes sont constatées pour le niveau d’éducation et les ALD, avec des écarts similaires pour les hommes et les femmes.
Proportions pondérées des variables sociodémographiques dans les enquêtes GGS et SHARE, femmes âgées de 50 à 80 ans(a)
Proportions pondérées des variables sociodémographiques dans les enquêtes GGS et SHARE, femmes âgées de 50 à 80 ans(a)
ND : Non disponnible.(a) Les questions étaient formulées différemment dans GGS et SHARE.
Proportions pondérées des variables sociodémographiques dans les enquêtes GGS et SHARE, hommes âgés de 50 à 80 ans(a)
Proportions pondérées des variables sociodémographiques dans les enquêtes GGS et SHARE, hommes âgés de 50 à 80 ans(a)
ND : Non disponnible.(a) Les questions étaient formulées différemment dans GGS et SHARE.
17En Estonie et en Hongrie, les échantillons GGS ont une proportion plus grande de personnes déclarant avoir un faible niveau d’éducation, tandis qu’aux Pays-Bas et en Pologne, ce sont les échantillons SHARE qui comprennent plus de répondants avec un faible niveau d’instruction. Dans l’enquête GGS en Pologne, 30 % des femmes ont un niveau d’instruction faible, contre 51 % dans l’enquête SHARE. La proportion de Polonaises ayant un niveau d’instruction élevé est deux fois plus importante dans GGS que dans SHARE (12 % contre 5 %) (figure annexe A.1). Ces différences peuvent refléter une pondération inadéquate qui s’est traduite par une structure par âge différente dans la version polonaise de GGS. Cela met en avant l’importance d’ajuster la structure des échantillons par des variables démographiques de base comme l’âge ou le sexe lorsque l’on compare des estimations entre plusieurs pays. Quand l’analyse a été répétée en utilisant des cohortes de naissance équivalentes au lieu des groupes d’âges pour déterminer si les différences de calendrier des enquêtes avaient un impact, les différences en matière d’éducation disparaissent pour l’Estonie (où les enquêtes SHARE et GGS ont été menées à 5-6 ans d’écart). En Hongrie et en Pologne (où les enquêtes ont été menées respectivement à 6-7 ans et 4-5 ans d’écart), les différences sont atténuées mais subsistent parfois assez fortement.
18Lorsqu’on utilise la variante européenne de la SAE dans les deux enquêtes, il y a peu de différences notables. La variante américaine produit toutefois une prévalence plus faible de la mauvaise santé que la variante européenne, un résultat conforme aux études précédentes (Jürges et al., 2008). Les proportions de mauvaise SAE, quelle que soit la variante utilisée, étaient plus fortes dans les pays d’Europe de l’Est, et particulièrement en Estonie.
19Comme les différences de formulation des questions pouvaient le laisser présager, les proportions de personnes déclarant avoir une ALD sont systématiquement différentes et plus importantes dans l’enquête SHARE. Tous les pays, à l’exception des Pays-Bas et de la France, affichent des différences de plus de 10 points de pourcentage et, en Allemagne et en Estonie, cette différence atteint 30 points. Ces écarts entre les enquêtes ne sont pas corrélés avec la prévalence globale de la mauvaise santé observée dans chaque pays.
20Les figures 3 et 4 montrent les résultats issus des différents modèles logistiques multivariés afin d’explorer les relations entre facteurs sociodémographiques et état de santé dans les différents pays et enquêtes. La figure 3 montre un lien (non pondéré) entre un faible niveau d’instruction (niveau 1-2 du CITE) et les deux variables dichotomiques de santé : déclarer une mauvaise SAE et déclarer une ALD, à âge et statut conjugal donnés. Tous les rapports de risque de la figure 3 sont supérieurs à 1, ce qui signifie qu’un faible niveau d’instruction est associé à une plus forte probabilité de déclarer une mauvaise SAE ou une ALD. Pour certains pays (particulièrement la Hongrie et la Pologne), l’échantillon GGS est plus important que l’échantillon SHARE, et les écarts types par conséquent plus faibles, ce qui peut affecter les différences de niveaux de significativité. Les modèles combinant les pays sur chaque enquête montrent que les risques de mauvaises SAE et d’ALD associés à un niveau d’instruction faible peu élevé sont légèrement plus importants dans GGS que dans SHARE, bien que les intervalles de confiance se chevauchent. Pour la SAE, le même type d’effet est observé pour les hommes et les femmes, mais il y a des variations selon le sexe dans les résultats des modèles pour les ALD. Certains coefficients par pays montrent des différences significatives et substantielles, les plus notables portent sur les hommes et les femmes de Hongrie où l’analyse SHARE établit des risques plus élevés de mauvaise santé parmi les personnes ayant un niveau d’instruction faible que les résultats GGS, qui ne peuvent s’expliquer par des changements dans la prévalence de la mauvaise santé en général. Les risques exposés par les deux enquêtes ne sont similaires que pour très peu de pays (la France, les Pays- Bas et l’Allemagne sont probablement les plus constants). Comme précédemment décrit dans la partie consacrée aux méthodes, nous avons regroupé les données SHARE et GGS et testé la significativité des différences observées entre les enquêtes. Dans la plupart des cas, les différences ne sont pas significatives, mais la SAE et les ALD en Hongrie et la SAE en Pologne figurent parmi les exceptions notables (tableau annexe A.2).
Associations non pondérées entre le faible niveau d’instruction et la mauvaise santé autoévaluée ou les affections de longue durée, à âge et statut conjugal donnés (odds ratios et intervalles de confiance à 95 %)(a),(b),*
Associations non pondérées entre le faible niveau d’instruction et la mauvaise santé autoévaluée ou les affections de longue durée, à âge et statut conjugal donnés (odds ratios et intervalles de confiance à 95 %)(a),(b),*
(a) : Question sur la santé autoévaluée : version européenne de GGS ; version américaine de SHARE.(b) : Les enquêtes GGS et SHARE ont été effectuées à des intervales de plus de 5 ans.
Note : Groupe de référence : niveau d’éducation intermédiaire ou supérieur.
Significativité : * p < 0,05 ; ** p < 0,01 ; *** p < 0,001.
Associations non pondérées entre le statut de non-marié et la mauvaise santé autoévaluée ou les affections de longue durée, par pays, sexe et enquête, à âge et niveau d’instruction donnés (odds ratios et intervalles de confiance à 95 %)(a),(b),*
Associations non pondérées entre le statut de non-marié et la mauvaise santé autoévaluée ou les affections de longue durée, par pays, sexe et enquête, à âge et niveau d’instruction donnés (odds ratios et intervalles de confiance à 95 %)(a),(b),*
(a) : Question sur la santé autoévaluée : version européenne de GGS ; version américaine de SHARE.(b) : Les enquêtes GGS et SHARE ont été effectuées à des intervalles de plus de 5 fois.
Note : Groupe de référence : mariés.
Significativité : * p < 0,05 ; ** p < 0,01 ; *** p < 0,001.
21La figure 4 montre la relation entre le statut conjugal (le fait d’être non marié, c’est-à-dire : jamais marié, divorcé ou veuf) et les deux indicateurs de santé, à niveau d’éducation et âge donnés. Les résultats des analyses dans le modèle qui combine tous les pays montrent que le fait de ne pas être marié est associé à une plus mauvaise santé pour les hommes et les femmes. Cependant, les analyses spécifiques par pays montrent que cette relation n’est significative qu’en Belgique, en Allemagne et, uniquement pour les femmes, aux Pays-Bas. Il y avait plus de cohérence entre différentes enquêtes d’un même pays pour les rapports de risques par niveau d’éducation, en particulier pour la Belgique et l’Allemagne et, dans une moindre mesure, pour la France et la Hongrie. Les estimations pour la Pologne semblent incohérentes, plus élevées pour GGS que pour SHARE. Nous avons trouvé des preuves que les estimations étaient différentes pour SHARE et GGS pour les Polonaises sur les résultats d’ALD.
III – Discussion et conclusion
22Cet article apporte une contribution unique en comparant les données sociodémographiques et de santé de la population âgée de 50 à 80 ans des enquêtes SHARE et GGS, et complète des études précédentes qui ont comparé ces enquêtes à des données nationales ou à d’autres enquêtes comme EU-SILC (Croezen et al., 2013 ; Fokkema et al., 2014 ; Kreyenfeld et al., 2013 ; Sauer et al., 2012 ; Vergauwen et al., 2015). En outre, cet article prolonge des travaux précédents en comparant les relations entre variables sociodémographiques et niveaux de santé dans les deux enquêtes.
23Nous avons supposé que les estimations des variables démographiques de base des deux enquêtes seraient similaires après avoir appliqué une pondération post-stratification, mais cela n’a pas toujours été le cas. Les comparaisons des estimations pondérées de l’âge provenant des deux enquêtes avec les données nationales (figure 1) montrent que les pondérations post-stratification fournies, en particulier dans l’enquête GGS, ne parviennent pas toujours à rendre représentative la population cible. Les facteurs utilisés dans les pondérations diffèrent dans les différentes enquêtes GGS, et entre les enquêtes GGS et SHARE, ce qui peut expliquer une partie des différences observées. Les enquêtes sont toutefois relativement comparables en termes de répartition par âge, sexe, statut conjugal, proportion de personnes sans enfant et mauvaise SAE (à condition que la même variable de mesure de la SAE soit utilisée). Les différences dans le niveau d’instruction observées en Estonie, en Hongrie et en Pologne peuvent être liées à la différence de calendrier des enquêtes. Dans ces pays, les enquêtes GGS et SHARE ont été menées à 4-7 ans d’écart, et les changements en matière de scolarité obligatoire durant la période soviétique peuvent avoir perturbé la répartition par niveau d’éducation dans les cohortes plus âgées (Pennar et al., 1971 ; Róbert, 1991 ; Szebenyi, 1992). Cependant, il convient de noter que même lorsque l’on compare les cohortes de naissance équivalentes, certaines différences demeurent pour la Hongrie et la Pologne. Des différences existent également aux Pays-Bas alors que les deux enquêtes ont été menées à peu près au même moment. Ces différences peuvent suggérer des applications différentes de la codification des niveaux d‘éducation CITE (ISCED) et des réponses avec la codification CITE.
24Les différences de prévalence des ALD entre les enquêtes soulignent à quel point l’ordre des questions et leur formulation peuvent être déterminants dans les questionnaires portant sur la santé (Dubuc et al., 2004 ; Freedman et al., 2004 ; Jette, 1994 ; Picavet et van den Bos, 1996). Dans SHARE, la question sur les ALD mentionne des « handicaps et infirmités » ayant un caractère permanent, ce qui conduit habituellement à minimiser la déclaration de problèmes de santé (Picavet et van den Bos, 1996). Certaines études suggèrent que le thème des enquêtes et l’ordre des questions sont également connus pour être importants (Bowling et Windsor, 2008 ; Freedman et al., 2004). Cet ordre des questions aurait en outre un effet plus marqué pour les évaluations de santé des personnes âgées que pour des personnes plus jeunes (Crossley et Kennedy, 2002). Conformément aux recommandations habituelles, la question sur la SAE dans les deux enquêtes a été posée au début du module santé, mais cela n’empêche pas de possibles biais de contexte (Lee et Grant, 2009). Alors que les enquêtes GGS ont collecté des informations plutôt limitées sur la santé tandis que pour les enquêtes SHARE, ce thème était majeur. Cela signifie probablement que les répondants étaient plus attentifs et sensibilisés aux questions de santé que pour GGS. La découverte selon laquelle les répondants de SHARE déclarent une SAE meilleure est cohérente avec les résultats d’une précédente étude comparant SHARE à d’autres enquêtes, à savoir les Enquêtes de santé nationales (HIS), l’Enquête sociale européenne (ESS) et les statistiques sur les revenus et conditions de vie dans l’Union européenne (EU-SILC) (Croezen et al., 2013).
25Les différences des relations entre santé et niveau d’instruction, ou entre santé et statut conjugal, peuvent dans bien des cas être expliquées par une variabilité d’échantillonnage. La principale exception est la Hongrie et à certains égards la Pologne, où d’importantes différences significatives demeurent, ce qui peut refléter des disparités de répartition par niveau d’éducation entre les enquêtes. Il y a également plus de différences entre les enquêtes dans la relation santé/niveau d’éducation que dans la relation santé/statut conjugal, là où les répartitions des variables explicatives étaient plus inégales. Cela indique dans l’ensemble la nécessité d’examiner en détail la répartition des variables explicatives lorsque l’on interprète des résultats multivariés.
26La comparaison a mis en avant des différences importantes en termes d’objectifs et de populations cibles qui doivent guider les chercheurs lorsqu’ils choisissent quelle enquête utiliser. Pour étudier la population des plus de 50 ans, les estimations pondérées de SHARE évaluent habituellement mieux la répartition par âge et par sexe dans la population cible. La construction de pondérations plus efficaces pour les enquêtes GGS dans cette tranche d’âges pourrait garantir une meilleure adéquation de l’échantillon. La cohérence des mesures est cruciale pour les comparaisons entre pays, et certains estiment que l’enquête SHARE est plus adéquate pour comparer car le même instrument a été utilisé dans tous les pays, alors que les enquêtes GGS ont dû procéder à une harmonisation post hoc. L’enquête SHARE pose une plus grande variété de questions sur la santé tandis que l’enquête GGS a une portée plus large dans d’autres domaines tels que les comportements démographiques. Nos comparaisons des variables de santé montrent que (pour une même formulation) les répartitions et les liaisons sont relativement similaires. Toutefois, les chercheurs qui utilisent les enquêtes doivent prêter simultanément attention aux différences de formulation des questions et à la représentativité lorsqu’ils analysent, comparent les données et interprètent les résultats.
Remerciements
Cette recherche a été financée par une bourse du Conseil européen de la recherche (FAMHEALTH) attribuée au professeur Emily Grundy, dans le 7e programme-cadre de l’Union européenne (FP7/2007-2013)/ ERC, numéro de référence 324055). Les données GGS ont été obtenues à partir des archives du programme Générations et genre et ont été créées par les organisations et individus listés sous chaque pays à http://www.ggp-i.org/online-data-analysis.html.Cet article utilise des données de la vague 4 de SHARE version 1.1.1, du 28 mars 2013 (DOI : 10.6103/SHARE.w4.111) celles des vagues 1 et 2 de SHARE version 2.6.0, du 29 novembre 2013 (DOI : 10.6103/SHARE.w1.260 et 10.6103/SHARE.w2.260). La collecte de données SHARE a été principalement financée par la Commission européenne à travers le cinquième programme-cadre (projet QLK6-CT-2001-00360 du programme thématique Qualité de vie), le sixième programme-cadre (projets SHARE-I3, RII-CT-2006-062193, COMPARE, CIT5- CT-2005-028857, et SHARELIFE, CIT4-CT-2006-028812) et le septième programme-cadre (SHARE-PREP, N° 211909, SHARE-LEAP, N° 227822 et SHARE M4, N° 261982). Nous remercions l’Institut national du vieillissement des États-Unis (U01 AG09740-13S2, P01 AG005842, P01 AG08291, P30 AG12815, R21 AG025169, Y1-AG-4553-01, IAG BSR06-11 et OGHA 04-064), le ministère allemand de l’Éducation et de la Recherche et diverses sources nationales pour les financements supplémentaires apportés (voir www.share-project.org pour une liste complète des bailleurs de fonds).
Résultats des tests de différences dans les rapports de risque relatifs estimés pour les enquêtes SHARE et GGS et les relations montrées dans les figures 3 et 4
Résultats des tests de différences dans les rapports de risque relatifs estimés pour les enquêtes SHARE et GGS et les relations montrées dans les figures 3 et 4
ns = Non significatif (p ≥ 0,05).Niveaux d’instruction des hommes et des femmes âgés de 50 à 80 ans dans les enquêtes SHARE et GGS
Statut conjugal des hommes et des femmes âgés de 50 à 80 ans dans les enquêtes SHARE et GGS
Statut conjugal des hommes et des femmes âgés de 50 à 80 ans dans les enquêtes SHARE et GGS
Bibliographie
Références
- Börsch-Supan Axel, Jürges Hendrik (eds.), 2005, The Survey of Health, Ageing and Retirement in Europe. Methodology, Mannheim, Mannheim Research Institute for the Economics of Aging (MEA), 355 p.
- Börsch-Supan Axel, Brugiavini Agar, Jürges Hendrik, Mackenbach Johan, Siegrist Johannes, Weber Guglielmo (eds.), 2005, Health, Ageing and Retirement in Europe. First Results from the Survey of Health, Ageing and Retirement in Europe, Mannheim, Mannheim Research Institute for the Economics of Aging (MEA), 372 p.
- Börsch-Supan Axel, Brandt Martina, Hunkler Christian, Kneip Thorsten, Korbmacher Julie et al., 2013, « Data resource profile : The Survey of Health, Ageing and Retirement in Europe (SHARE) », International Journal of Epidemiology, 42(4), p. 992-1001.
- Bowling Ann, Windsor Joy, 2008, « The effects of question order and responsechoice on self-rated health status in the English Longitudinal Study of Ageing (ELSA) », Journal of Epidemiology and Community Health, 62(1), p. 81-85.
- Croezen Simone, Burdorf Alex, Van Lenthe Frank J., 2013, « Agreement and disagreement in prevalence estimates of health between SHARE and other European population studies », Erasmus MC, Rotterdam, Department of Public Health, Working paper series n° 14-2013, 62 p.
- Crossley Thomas F., Kennedy Steven, 2002, « The reliability of self-assessed health status », Journal of Health Economics, 21 (4), p. 643-658.
- Dubuc Nicole, Haley Stephen, Kooyoomjian Jill, Jette Alan, 2004, « Assessing disability in older adults : The effects of asking questions with and without health attribution », Journal of Rehabilitation Medicine, 36(5), p. 226-231.
- Eurostat, 2015, « Database », Luxembourg, European Commission.
- Fokkema Tineke, Kveder Andrej, Liefbroer Aart C., 2014, « Report and recommendations for sample and data adjustment procedures », Netherlands Interdisciplinary Demographic Institute GGP 212749 – Work Package 5 Panel methodology.
- Freedman Vicki A, Crimmins Eileen, Schoeni Robert F, Spillman Brenda C, Aykan Hakan et al., 2004, « Resolving inconsistencies in trends in old-age disability : Report from a technical working group », Demography, 41(3), p. 417-441.
- Jette Alan M., 1994, « How measurement techniques influence estimates of disability in older populations », Social Science & Medicine, 38(7),p. 937-942.
- Jürges Hendrik, Avendano Mauricio, Mackenbach Johan P., 2008, « Are different measures of self-rated health comparable ? An assessment in five European countries », European Journal of Epidemiology, 23(12), p. 773-781.
- Kapitány Balázs, 2003, « Turning points of the life-course. Sampling, reliability of raw data », Hungarian Central Statistical Office, Demographic Research Institute, 9 p.
- Kreyenfeld Michaela, Hornung Anne, Kubisch Karolin, 2013, « The German Generations and Gender Survey : Some critical reflections on the validity of fertility histories », Comparative Population Studies – Zeitschrift für Bevölkerungswissenschaft, 38(1), p. 3-28.
- Lee Sunghee, Grant David, 2009, « The effect of question order on self-rated general health status in a multilingual survey context », American Journal of Epidemiology, 169(12), p. 1525-1530.
- Malter Frederic, Börsch-Supan Axel (eds.), 2013, SHARE Wave 4 : Innovations & Methodology, Munich, MEA, Max Planck Institute for Social Law and Social Policy, 79 p.
- Manheim Research Institute For The Economics Of Aging (mea), 2013, « SHARE Release Guide 2.6.0 Waves 1 & 2 », Mannheim, Mannheim Research Institute for the Economics of Aging (MEA).
- Pennar Jaan, Bakalo Ivan I., Beredy George Z.F., 1971, Modernization and Diversity in Soviet Education, New York, Praeger, 395 p.
- Picavet Susan, Van Den Bos Geertrudis, 1996, « Comparing survey data on functional disability : The impact of some methodological differences », Journal of Epidemiology and Community Health, 50(1), p. 86-93.
- Róbert Péter, 1991, « Educational transition in Hungary from the post-war period to the end of the 1980s », European Sociological Review, 7(3), p. 213-236.
- Robine Jean-Marie, Jagger Carol, Romieu Isabelle (eds.), 2002, « Selection of a coherent set of health indicators for the European Union. Phase II : final report », Montpellier, Euro-REVES.
- Sauer Lenore, Ruckdeschel Kerstin, Naderi Robert, 2012, « Reliability of retrospective event histories within the German Generations and Gender Survey », BIB Working paper n° 1-2012, 46 p.
- Szebenyi Péter, 1992, « Change in the systems of public education in East Central Europe », Comparative Education, 28(1), p. 19-31.
- Nations Unies, 2013, « World Population Ageing 2013 », New York, United Nations, Department of Economic and Social Affairs, Population Division, n° ST/ESA/SER.A/348, 114 p.
- Vergauwen Jorik, Wood Jonas, De Wachter David, Neels Karel, 2015, « Quality of demographic data in GGS Wave 1 », Demographic Research, 32(24), p. 723-774.
- Vikat Andres, Spéder Zsolt, Beets Gijs, Billari Francesco C, Bühler Christoph et al., 2007, « Generations and Gender Survey (GGS) : Towards a better understanding of relationships and processes in the life course », Demographic Research, 17(14), p. 389-440.
Mots-clés éditeurs : enquête Générations et genre (GGS), enquête sur la santé, qualité des données, Europe, vieillissement, le vieillissement et la retraite en Europe (SHARE), santé, comparaison
Date de mise en ligne : 27/12/2016.
https://doi.org/10.3917/popu.1603.0547Notes
-
[*]
London School of Economics.
Correspondance : Katherine Keenan, London School of Economics, Department of social policy, Houghton Street, London, WC2A 2AE, courriel : k.keenan1@lse.ac.uk -
[1]
La première vague de l’enquête SHARE en Suède a été menée en 2004 ; la première vague de l’enquête GGS en Suède a été menée en 2012-2013.
-
[2]
L’enquête GGS en Estonie et l’enquête SHARE en Allemagne, en Hongrie et aux Pays-Bas précisent que les personnes résidant dans des institutions ont été inclues. Cependant, dans notre analyse, la proportion de ces personnes institutionnalisées âgées de 50 à 80 ans reste négligeable : dans l’enquête GGS en Estonie, il y avait sept personnes (< 0,1 %), et ils n’étaient pas identifiables dans SHARE.
-
[3]
Dans les pays où les GGS ont échantillonné des personnes âgées de 79 ans, les données comprennent des personnes qui ont eu 80 ans entre l’échantillonnage et la passation de l’enquête. Font exception l’enquête GGS en Estonie qui a délibérément échantillonné des personnes âgées de 80 ans, et l’enquête GGS en Hongrie qui n’a échantillonné que jusqu’à 78 ans.
-
[4]
Dans les GGS, de nombreux questionnaires utilisent leur propre classification par pays dont les résultats sont ensuite recodés en équivalent CITE.
-
[5]
Les données sur la population d’Eurostat utilisent une répartition par âge au 1er janvier, tandis que pour les données d’enquête, nous calculons l’âge au moment de l’enquête en utilisant les dates de naissance.
-
[6]
Nous avons choisi les « pondérations calibrées » de SHARE de préférence aux « pondérations d’échantillonnage » qui ne corrigent que les probabilités inégales d’échantillonnage.