Notes
-
[*]
Cet article développe la présentation de la théorie de l’agrégation logique faite par Mikaël Cozic et les deux auteurs au colloque « New Developments in Social Choice and Welfare Theories. A Tribute to Maurice Salles » (Caen. 10-12 Juin 2009). Il reprend aussi les présentations faites par le premier auteur au « Workshop on Judgment Aggregation » (Barcelone, 14-16 décembre 2009) et au colloque LOFT 2010 (Toulouse, 5-7 juillet 2010). L’article incorpore les observations pertinentes et constructives que deux rapporteurs ont faites sur la version antérieure ; qu’ils soient ici chaleureusement remerciés.
-
[**]
Adresse : GREGHEC, 1 rue de la Libération, 78350 Jouy-en-Josas, FR. Courriel : mongin@greg-hec.com Centre National de la Recherche Scientifique & Groupe HEC
-
[***]
Adresse : Dept of Philosophy, Logic and Scientific Method, Houghton Street, London WC2A 2AE, GB. Courriel : f.dietrich@lse.ac.uk London School of Economics
-
[1]
La théorie de l’agrégation des probabilités remonte aux années 1960 avec des travaux de Stone, Raiffa et Winkler. Les principaux résultats ont été acquis rapidement, de sorte que la synthèse de Genest et Zidekh [1986] reste d’actualité. Chez McConway [1981], la théorie reproduit le modèle axiomatique de celle du choix social, tandis que, chez Lehrer et Wagner [1981], elle revêt la forme d’une théorie du consensus applicable à l’activité scientifique.
-
[2]
Monjardet [2003] isolait chez Guilbaud un théorème et sa démonstration relevant du choix social arrovien. Eckert et Monjardet [2009] lui attribuent un théorème et une démonstration qui relèvent de l’agrégation logique, et cette lecture est plus fidèle que la précédente à l’inspiration que Guilbaud trouvait chez Condorcet. Sur le plan strictement technique, on peut apercevoir chez Guilbaud le premier usage démonstratif des filtres et des ultrafiltres, dont les notions venaient d’entrer dans les mathématiques de l’époque. Depuis Kirman et Sondermann [1972] la théorie de choix social et, désormais, celle de l’agrégation logique empruntent couramment ce procédé.
-
[3]
Outre Guilbaud, Granger [1956] et Rashed [1974] ont participé à la redécouverte de la mathématique sociale du Condorcet, mais leur interprétation du paradoxe du vote reste cependant marquée par la lecture arrovienne. Le théorème du jury fait aujourd’hui l’objet d’une vaste littérature spécialisée qui recoupe parfois celle de l’agrégation logique, mais que nous devons malheureusement laisser de côté ici.
-
[4]
Le paradoxe doctrinal est mentionné pour la première fois chez Kornhauser [1992]. Les bibliographies citent abusivement Kornhauser et Sager [1986], qui mettaient en évidence des problèmes agrégatifs distincts du paradoxe.
-
[5]
En droit anglo-américain, les textes normatifs jouent un rôle presque exclusif en matière pénale, mais la jurisprudence compte beaucoup à côté des premiers en matière civile. Les sources de la doctrine juridique ne font pas une différence fondamentale pour les problèmes agrégatifs examinés ici. Nous remercions Lewis Kornhauser de cet éclaircissement et d’autres qui nous ont été précieux.
-
[6]
Voir notamment Post et Salop [1991-1992], qui écrivent peu après Kornhauser et Sager, et Nash [2003], qui synthétise la littérature juridique ultérieure sur le paradoxe doctrinal.
-
[7]
L’expression affaire par affaire ne devrait pas figurer dans la version synchronique, car l’affaire est alors fixée : on peut supposer que Kornhauser et Sager font écho à la version diachronique d’abord mise en exergue. Parmi les théoriciens de l’agrégation logique, il n’y a que List [2004] à s’être attaqué à cette version.
-
[8]
Le débat entre Kornhauser et Sager [2004] et List et Pettit [2005] n’identifie pas leurs différends avec une clarté entière.
-
[9]
La Logique de Kant, parue en 1800, est une synthèse remarquable de la conception dite ancienne. C’est dans les Recherches logiques de Frege (1918-1919) qu’apparaît le mieux la conception dite moderne.
-
[10]
Dietrich et Mongin [2007], suivis par Herzberg et Eckert [2010] et Herzberg [2010], ont traité des groupes infinis. Les résultats transposent ceux déjà obtenus en théorie du choix social, notamment par Kirman et Sonderman [1972].
-
[11]
La théorie de l’agrégation logique a seulement commencé à étudier les domaines restreints (avec les travaux de List [2003], et Dietrich et List [2010]).
-
[12]
Selon Mongin [2003], cette dualité rapproche la méthode axiomatique du choix social de celle de la logique. La définition des règles joue le rôle d’une sémantique par rapport à la syntaxe constituée par les axiomes, et les théorèmes de représentation deviennent ainsi des approximations des théorèmes de complétude prouvés en logique.
-
[13]
Selon l’un des premiers critiques de List et Pettit, Chapman [2002], la systématicité oblitère la dissymétrie fondamentale des prémisses et des conclusions, les premières servant de raisons aux secondes, mais non l’inverse. La faiblesse normative de l’axiome est, plus généralement, qu’il ignore la différence sémantique des propositions.
-
[14]
Les règles à quotas sont définies comme chez Dietrich et List [2007a], qui, après Nehring et Puppe [2002, 2008], en font l’étude détaillée : voir aussi Dietrich [2010].
-
[15]
De ce fait, l’indépendance améliore le statut normatif de la systématicité, mais des objections demeurent cependant [voir Mongin, 2008].
-
[16]
Pour tout sous-ensemble cohérent B ? X, le sous-ensemble nié { –| ? : ? ? B } doit être aussi cohérent.
-
[17]
Curieusement, la théorie de l’agrégation logique et celle du choix social ont suivi des progressions opposées. Le théorème d’Arrow en 1951 procède de l’indépendance, et ce n’est qu’ensuite et pour des contextes spéciaux que certains théorèmes partiront de la neutralité. Fleurbaey et Mongin [2005] réexaminent l’enchaînement historique.
-
[18]
Tout en étant classique au sens de la section 3, le calcul propositionnel de Pauly et van Hees autorise des valeurs de vérité en nombre fini quelconque. Van Hees [2007] et Duddy et Piggins [2009] se placent aussi en dehors de la sémantique bivalente ordinaire, à laquelle notre formalisme syntaxique se conforme implicitement.
-
[19]
Sans la restriction à D ou D *, il existerait une fonction du jugement social constante et systématique : pour tout (A 1,..., An ), F (A 1,..., An ) = X.
-
[20]
Des individus peuvent faire les mêmes comparaisons d’utilité espérée alors qu’ils s’opposent à la fois sur les valeurs d’utilité et de probabilité. Mongin [1995] explique par là l’impossibilité du bayésianisme collectif. Généralisant le propos, Mongin [1997] parle d’unanimité factice lorsque l’accord sur un jugement collectif s’accompagne de désaccords sur les raisons de le porter. Nehring [2005] retrouve l’idée dans son formalisme abstrait d’agrégation parétienne.
-
[21]
Nehring et Puppe [2010] abandonnent la condition – dite de vérifonctionnalité (truth-fonctionality) – qui correspond ici à la fermeture de l’agenda par variables propositionnelles. Il existe alors des F qui échappent à la dégénérescence oligarchique.
-
[22]
Dietrich [2007a] posait directement que chaque ensemble cohérent de formules s’étend à un ensemble maximal cohérent, ce qui correspond au lemme de Lindenbaum bien connu en logique. Cette propriété importante est ici déduite à partir de (E3).
-
[23]
Priest [2002] expose les calculs paraconsistants et leurs motivations.
-
[24]
C’est le cas des logiques épistémiques probabilistes [voir Heifetz et Mongin, 2001] et de certaines logiques de la connaissance commune (mais non pas de toutes, voir Lismont et Mongin, [2002]).
-
[25]
Techniquement parlant, on exploite l’homomorphisme entre le calcul des prédicats et son calcul propositionnel associé : voir par exemple Barwise [1977].
-
[26]
La condition est équivalente si, plus généralement, Z est de cardinalité paire (voir Dokow et Holzman [2010], et Dietrich et Mongin [2010]).
-
[27]
Pour qu’ils ne le soient pas, il faudrait qu’ils contiennent soit { v, r, –| d }, soit { –| v, d }, soit { –| r, d } ; or les trois cas sont exclus par définition de .
-
[28]
Un résultat oligarchique de Gärdenfors [2006] précède le Théorème 7, mais il n’impose que des conditions suffisantes, et d’ailleurs inutilement fortes, à l’agenda d’impossibilité.
-
[29]
Dietrich [2007b] obtient le théorème d’Arrow intégral par un autre détour. Il se place dans un autre cadre que celui du théorème canonique, où les formules entretiennent des relations de pertinence [relevance] en sus des relations logiques. La dérivation de Nehring [2003] doit être signalée, quoiqu’elle ne relève pas formellement de l’agrégation logique.
-
[30]
L’exemple provient de List et Puppe [2009].
-
[31]
Voici quelques exemples non exhaustifs. Pauly [2007 et 2009] propose de représenter l’acceptation des formules à l’aide d’un opérateur propositionnel non classique plutôt que par l’appartenance ensembliste. Cariani, Pauly et Snyder (2008) appliquent aux fonctions de jugement social une propriété métathéorique d’invariance qui débouche sur de nouveaux résultats d’impossibilité. Représentatifs d’un courant plus vaste, Konieczny et Pino-Perez [2002], Pigozzi [2006] et Miller et Osherson [2009] étudient des règles de fusion (merging) pour les ensembles de jugement. Dans cette dernière option, le dilemme discursif est surmonté par l’abandon de l’indépendance.
-
[32]
Voir Nash [2003]. Pour leur part, Kornhauser et Sager vont varier la résolution avec les cas, en recommandant au tribunal de procéder à un « méta-vote » sur la méthode de décision, par les prémisses ou bien par la conclusion.
-
[33]
Très développées aujourd’hui, les logiques conditionnelles procèdent des travaux de Stalnaker [1968] et Lewis [1973]. Elles visent à dépasser les paradoxes de l’implication « matérielle » (booléenne), dont le paragraphe suivant livre un nouvel échantillon.
-
[34]
Le lecteur peut se reporter à Nute et Cross [2001].
1. Introduction
1 Les théories agrégatives contemporaines plongent leurs racines dans les analyses mathématiques du vote, développées en France dès la fin du XVIIIe-siècle, et dans les formulations techniques de l’utilitarisme et de sa variante épurée, l’économie du bien-être, qui se succédèrent en Grande-Bretagne du XVIIIe au milieu du XXe siècle. Les économistes classiques, puis néoclassiques, firent grand cas de la seconde inspiration, mais ignorèrent complètement la première, jusqu’à ce qu’à ce qu’Arrow orchestre magistralement leur réconciliation dans Social Choice and Individual Values (1951). Le titre de l’ouvrage a fixé l’appellation reçue de la théorie qu’il expose,social choice theory, appellation inexacte en fait, parce que celle-ci part de la préférence, et non pas du choix, comme concept fondamental, et qu’elle s’énonce pour toute espèce de collectivité, la société entière n’étant qu’une illustration particulière. Avec la fonction dite non moins improprement de bien-être social, qui est définie sur les profils autorisés de préférences individuelles et qui prend ses valeurs dans l’ensemble autorisé de préférences collectives, avec les axiomes qui, posés sur cette fonction, en décrivent les propriétés désirables, avec les théorèmes de possibilité ou d’impossibilité qui résultent de conjonctions particulières de ces axiomes, la théorie arrovienne développe un formalisme susceptible de couvrir en une fois les problèmes agrégatifs que les deux traditions historiques, la française et la britannique, offraient dissociés. En effet, la notion de préférence, individuelle ou collective, peut incliner soit du côté de la fonction d’utilité, qui la « représente » suivant la conception moderne des économistes, soit du côté du choix, qui la « révèle » d’après cette même conception, et le vote n’est qu’une forme particulière de choix ; c’est ainsi qu’Arrow et ses successeurs ont pu réunir Bentham avec Condorcet.
2 Mais si grand que soit le pas de généralisation effectué, il n’est pas encore suffisant. Car les préférences des individus ou de la collectivité entre deuxétats de choses n’épuisent pas les jugements qu’ils sont susceptibles de porter sur ces états, et il n’est pas moins légitime d’examiner l’agrégation d’autres jugements que ceux de préférence. « Louis préfère une longue réunion mensuelle à de courtes réunions hebdomadaires » se paraphrase en disant que Louis juge l’une préférable aux autres, ce qui fait sentir que la préférence est une espèce du genre constitué par le jugement ; elle se définit comme un jugement comparatif porté au point de vue évaluatif spécifique de la préférabilité. Sur les mêmes états de choses. Louis peut former d’autres jugements, absolus ou de nouveau comparatifs, qui se placent à d’autres points de vue spécifiques, factuels ou de nouveau évaluatifs : une longue réunion mensuelle est fatigante, plus fatigante que de courtes réunions hebdomadaires, réussie, plus réussie que de courtes réunions hebdomadaires, et ainsi de suite. Il est même inévitable que Louis forme d’autres jugements que celui de préférence, parce que celui-ci, comme toute évaluation, s’appuie sur des jugements factuels antérieurs. Quand des Louis multiples s’expriment sur les deux plans de la préférence et de ce qui la fonde, la théorie agrégative devrait-elle s’en tenir aux résultats en ignorant les intermédiaires ? La restriction paraît contre-productive, et elle est pourtant imposée en théorie du choix social, puisque celle-ci ne connaît pas d’autres jugements que ceux de préférence.
3 Une théorie nouvelle, qu’on nomme de l’agrégation des jugements, surmonte la limitation de celle du choix social. Son formalisme lui permet de représenter les jugements individuels et collectifs au-delà du cas particulier de la préférence, et par ce moyen, d’attaquer une classe entière de problèmes agrégatifs négligés. Les auteurs de cette théorie enchaînent donc un pas de généralisation sur celui qu’Arrow et ses disciples réalisèrent en leur temps. Tout en renouvelant l’objet d’étude de leurs prédécesseurs, ils en reproduisent strictement la démarche axiomatique. Leur méthode générale consiste en effet à soumettre les jugements individuels et collectifs à certaines propriétés normatives qui sont le pendant des contraintes imposées à la préférence, puis à définir une fonction de jugement collectif, allant des profils autorisés de jugements individuels vers les jugements collectifs autorisés, qui est l’analogue rigoureux la fonction de bien-être social. Après avoir énuméré les propriétés que la fonction de jugement collectif pourrait satisfaire, ils étudient les assemblages de ces propriétés au travers de théorèmes d’impossibilité ou de possibilité.
4 Ces recherches axiomatiques sont déjà suffisamment nombreuses et diversifiées pour qu’il ne soit plus possible d’en rendre compte sans fixer un angle d’attaque. En accord avec les travaux spécialisés de ses auteurs, ce bilan interprétatif souligne la pente logicienne de la théorie de l’agrégation des jugements et il en expose les résultats sous cet angle particulier ; du coup, il la désignera comme étant la théorie de l’agrégation logique. Plus informatif que l’autre, l’intitulé présente aussi l’avantage de marquer une séparation nette avec la théorie antérieure de l’agrégation des probabilités. Dans une conception large du jugement, qui est en fait celle du sens commun, la certitude subjective ne lui est pas inhérente, et il peut produire des affirmations dont la force est moindre que celle des valeurs « vrai » et « faux », seules considérées par la logique ordinaire. Si la théorie de l’agrégation des jugements relevait de la conception large, elle devrait englober lathéorie l’agrégation probabiliste : mais il n’en est rien, la première s’étant constituée sans l’appui de la seconde, et les deux s’ignorant encore l’une l’autre sauf exceptions [1].
5 De fait, c’est la logique, et non pas la théorie des probabilités, qui a fourni la notion technique de jugement qui généralise celle de préférence. En substance, le sujet individuel ou collectif qui porte un jugement s’exprime sur la proposition qui lui est associée : ou bien il l’affirme en lui donnant la valeur « vrai », ou bien il la nie en lui donnant la valeur « faux ». Il est aussi possible que le sujet ne porte pas de jugement, auquel cas il n’attribue pas de valeur de vérité du tout à la proposition. Ce schéma s’étoffe lorsqu’on introduit un langage symbolique dans lequel chaque proposition est représentée par une formule ; à partir de là, il est loisible de doser plus ou moins les composantes sémantique et syntaxique de l’analyse. La logique propositionnelle classique suffit aux premiers résultats, et même à quelques résultats avancés, mais nous pousserons cet article dans la direction de logiques moins élémentaires.
6 C’est avec List et Pettit [2002] que, pour la première fois rigoureusement, la théorie agrégative s’est incorporé l’analyse logique du jugement qui précède. Antérieurement, deux juristes américains, Kornhauser et Sager [1986, 1993] avaient ébauché une conception agrégative du jugement, mais pris dans le sens judiciaire et non pas dans le sens philosophiquement général. Ils avaient montré que les tribunaux collégiaux étaient exposés au paradoxe doctrinal (doctrinal paradox) : les opinions individuellement cohérentes des juges peuvent mener le tribunal dans son ensemble à une incohérence. Dans un article-charnière qui prépare le formalisme introduit avec List, Pettit [2001] réexamine le paradoxe de Kornhauser et Sager, et l’ayant jugé trop spécial, propose de le reformuler comme un problème universel qu’il nomme le dilemme discursif (discursive dilemma). Nous approfondirons cette étape sémantique et montrerons – c’est une thèse de l’article – qu’il n’y avait pas de nécessité à transformer le paradoxe doctrinal en dilemme discursif pour le traiter analytiquement. Il peut servir de point de départ à une branche de la théorie de l’agrégation logique dont les résultats sont encore plus généraux que ceux du rameau principal. Nous suivrons ici Dietrich et Mongin [2010] sans reproduire l’ensemble de leur développement technique.
7 Sans que List et Pettit en aient eu connaissance, un spécialiste français de mathématique sociale, Guilbaud [1952], avait déjà procédé à la généralisation de la préférence en jugement. Inspiré par Arrow, qui venait de publier son ouvrage, mais aussi par Condorcet, qu’il aura contribué à tirer de l’oubli, Guilbaud reformule la théorie agrégative du premier comme l’aurait fait le second, c’est-à-dire non pas seulement pour des relations de préférences, mais pour tout ensemble d’« opinions » – Guilbaud préfère ce terme, venu de Condorcet, à celui de jugement, qu’il emploie cependant quelquefois.Hostile au bourbakisme qui domine alors les mathématiques françaises, Guilbaud se refuse à la méthode axiomatique et même aux démonstrations générales, ce qui rend complexe d’évaluer ses anticipations, mais la tendance est aujourd’hui d’y voir un précurseur direct de la théorie de l’agrégation logique [2].
8 S’il faut trouver au travail actuel son premier inspirateur, Condorcet s’impose avec l’Essai sur l’application de l’analyse à la probabilité des décisions à rendre à la pluralité des voix [1785] et ses autres mémoires ou articles sur la mathématique électorale. Sa méthode constante est de traiter la préférence comme l’acceptation ou le rejet de certaines propositions de préférabilité : l’électeur qui préfère A à B, B à C, A à C, accepte « A est préférable à B », « B est préférable à C », « A est préférable à C », et rejette les propositions contraires. On penserait, sous l’influence d’Arrow, que Condorcet ne fait que retranscrire un concept initial de préférence ordonnée, mais il n’en est rien. Il part des propositions et de leurs liaisons logiques supposées, et il n’attribue la propriété d’ordre à la relation de préférence qu’en vertu de ces liaisons logiques. La généralité supérieure de son raisonnement apparaît mieux dans le théorème du jury que dans le paradoxe du vote, mais celui-ci est déjà représentatif : il le commente en logicien, par exemple quand il écrit que les propositions choisies par la majorité forment un « système contradictoire » (Essai, p. LV-LVI). Que la contradiction logique porte sur la préférence est une particularité de l’exemple et non pas de la méthode. Relu de cette manière, qui est précisément celle de Guilbaud, Condorcet devient le précurseur lointain du paradoxe doctrinal, du dilemme discursif et de toutes les recherches actuelles [3].
9 L’article qui suit forme un long développement circulaire autour du paradoxe doctrinal. La section 2 l’expose en revenant à la source judiciaire initiale, puis le compare à sa réinterprétation comme dilemme discursif, laquelle motive le cadre formel posé à la section 3. A partir de là, les théorèmes d’impossibilité s’enchaînent. Celui de List et Pettit (Théorème 1) impose à la fonction de jugement collectif l’axiome discutable de systématicité, alors que ceux de la section 4, dus à Pauly et van Hees, Dietrich, Mongin, Nehring et Puppe (Théorèmes 2-5), ne supposent que l’axiome d’indépendance, normativement plus acceptable et d’ailleurs proche de la célèbre condition arrovienne d’indépendance des options non pertinentes (independence of irrelevant alternatives). La section 5 reprend la logique générale de Dietrich, qui a permis de dépasser la limitation des résultats précédents, formulés dans des logiques encore trop particulières ; elle figureici dans une version qui l’améliore, proposée ailleurs par Dietrich et Mongin. En s’aidant de cet outil, la section 6 énonce les théorèmes qui structurent le mieux le domaine aujourd’hui et qui peuvent, à ce titre, passer pour canoniques. Ils ont pour objet mathématique l’agenda, c’est-à-dire l’ensemble des formules logiques représentatives des propositions sur lesquelles opinent les individus et la collectivité, et comme ils imposent à cet objet des conditions non seulement suffisantes, mais nécessaires, pour que toute fonction de jugement collectif vérifiant une certaine liste d’axiomes soit dégénérée, ils constituent des théorèmes de possibilité non moins que d’impossibilité. Chacun des théoriciens de l’agrégation logique y a peu ou prou contribué, mais nous privilégierons la formulation synthétique de Dokow et Holzman (Théorèmes 6-7). La section 7 retourne au paradoxe doctrinal pour lui donner son développement théorique autonome en s’appuyant sur les résultats récents de Dietrich et Mongin (Théorèmes 8-9). En substance, ils sont l’analogue pour ce paradoxe de ce que les théorèmes canoniques sont pour le dilemme discursif.
2. Du paradoxe doctrinal au dilemme discursif
10 La théorie de l’agrégation logique trouve son origine immédiate dans l’analyse du fonctionnement collectif de l’institution judiciaire qu’ont proposée les deux juristes américains Kornhauser et Sager [1986, 1993 ; voir aussi Kornhauser, 1992]. De cette analyse, les spécialistes de la théorie n’ont véritablement retenu que le paradoxe doctrinal (doctrinal paradox), et il ne leur sert guère qu’à introduire et motiver des théorèmes dont la généralité couvre beaucoup d’autres exemples, paradoxaux ou non. Nous restituons ici le problème juridique initial et les transformations qu’il a connues chez Pettit [2001], puis List et Pettit [2002]. En le présentant comme un dilemme discursif, ces deux auteurs en ont facilité le traitement analytique, mais nous ferons sentir aussi les préoccupations conceptuelles qu’ils écartent.
11 Avant de définir abstraitement le paradoxe doctrinal, comme le font Kornhauser et Sager [1993], nous emprunterons l’exemple, désormais classique et même rebattu, dont ils se servent pour l’illustrer [4]. Une partie P, le plaignant, a intenté une action civile contre une autre partie D, le défendeur, en alléguant la rupture d’un contrat passé entre eux. Le tribunal est composé de trois juges A, B et C, qui doivent, en s’appuyant sur le droit des contrats, déterminer si D doit ou non verser des dommages-intérêts à P, ce qu’on représentera par les formules logiques d ou –| d. Par hypothèse, l’affaire soulève les deux questions de savoir si le contrat était valide ou non (v ou –| v) et s’il a été rompu ou non (r ou –| r), et le droit tranche dans tous les casde réponses à partir de la règle suivante : D doit des dommages-intérêts à Psi, et seulement si, le contrat était valide et que D l’a rompu. Supposons que les délibérations des juges les conduisent aux réponses et conclusions suivantes :
A | v –| r | – | d |
B | – | v r | – | d |
C | v r | d |
12 Si le tribunal décide à la majorité simple sur l’affaire directement, il rendra la conclusion –| d, défavorable au plaignant ; mais s’il décide, toujours à la majorité simple, les deux aspects de l’affaire, et tire ensuite sa décision de la règle, il recueillera les réponses v et r, d’où la conclusion d, favorable au plaignant.
13 Par la suite, nous reviendrons souvent sur cet exemple de base, remarquablement choisi. Comme il est permis de s’y méprendre, il vaut la peine d’ajouter qu’il simplifie outrageusement le droit américain des contrats. Kornhauser et Sager examinent des cas authentiques, mais dont la complexité nuit à l’effet de paradoxe, et ils ont donc conçu didactiquement, et d’ailleurs tardivement, celui-ci. Leur intention dernière est d’approfondir l’effet que la forme collective de la décision judiciaire produit sur le contenu du droit et, particulièrement, de la jurisprudence. Concrètement, le système judiciaire américain réserve la collégialité aux tribunaux d’appel (appellate courts) des États et de l’Union. Tout un chacun connaît la Cour Suprême, dont les neuf juges se prononcent par délibérations et par votes sur les affaires de nature fédérale, mais à un degré moindre de notoriété, les cours d’appel des États, souvent composées de trois membres, et les cours suprêmes correspondantes, en reproduisent le fonctionnement.
14 Nous rappellerons sommairement la méthode d’analyse judiciaire de Kornhauser et Sager, plus particulièrement exposée chez Kornhauser [1992], car c’est d’elle que procèdent les concepts qui serviront à définir le paradoxe doctrinal. Quand une affaire (case) est portée devant un tribunal, il la soumet à une caractérisation (characterization) qui revient à déterminer si le droit s’applique à elle et, en cas de réponse positive, dans lesquelles de ses dispositions précisément. Ce que Kornhauser et Sager nomment la doctrine juridique (legal doctrine) est l’ensemble des dispositions applicables. Dans l’exemple précédent, elle se ramène à une disposition unique et qui, de plus, affecte la forme spéciale d’une équivalence logique ; généralement, la doctrine se présente de manière plus complexe. Quant aux sources, elle provient à la fois des textes normatifs (statutes) et de la jurisprudence (common law), selon des proportions qui varient notamment avec la nature civile ou pénale de l’affaire [5]. La doctrine juridique joue un double rôle informatif : elledétermine quels sont les aspects (issues) pertinents de l’affaire et comment l’affaire se décide en fonction des aspects. Kornhauser et Sager acceptent ici une idéalisation commode : la décision du tribunal sur l’affaire serait une réponse par oui ou par non à une question univoque (dans l’exemple : faut-il accorder des dommages-intérêts au plaignant ?) ; il en irait de même pour les décisions relatives à chaque aspect de l’affaire (le contrat était-il valide ? a-t-il été rompu ?) ; enfin, la doctrine juridique dicterait une et une seule réponse du premier type dès lors que les réponses du second type sont connues.
15 La dernière hypothèse est sujette à interprétations. Quand on expose ordinairement l’exemple, on se sert de la formule d ? v ? r pour représenter la doctrine juridique, et de l’inférence déductive, menée avec cette prémisse supplémentaire, pour représenter les délibérations des juges. Pareille modélisation est naturelle et commode, mais il pourrait s’en trouver d’autres qui répondent moins sommairement à l’idée que la doctrine juridique dicte aux juges la décision sur l’affaire une fois qu’ils ont tranché les questions d’aspect, et les divers écrits de Kornhauser et Sager semblent justement pointer dans ces autres directions.
16 Les concepts qui précèdent ne suffisent que si l’on s’occupe d’un juge unique ; dans le cas d’un tribunal collectif, il faut aussi décrire l’opération qui transforme les réponses individuelles en jugement final. Kornhauser et Sager n’en conçoivent que deux formes : ou bien, le tribunal enregistre directement les réponses individuelles sur l’affaire et il leur applique une procédure convenue de décision collective, qui est d’ordinaire le vote à la majorité simple ; ou bien, il enregistre les réponses individuelles sur chaque aspect, et c’est à elles, considérées tour à tour, qu’il applique la procédure de décision collective avant de tirer une réponse globale en s’appuyant sur la doctrine juridique retenue. Le paradoxe doctrinal tient dans le fait que la première méthode, dite affaire par affaire (case-by-case), ne donne pas toujours le même résultat que la seconde, dite aspect par aspect (issue-by-issue). Telle est la définition précise qu’en donnent Kornhauser et Sager [1993, p. 10-12 ; voir déjà Kornhauser 1992, p. 453] et les juristes qui les ont suivis [6].
17 Chez Condorcet, le paradoxe du vote sert à motiver une solution particulière, ou peut-être plusieurs selon les interprètes, mais il ne contient pas en lui-même les réponses qu’on peut lui apporter. En revanche, le paradoxe doctrinal fixe par avance les réponses, puisqu’il se définit justement par leur antagonisme. Il diffère encore de son prédécesseur par un niveau d’abstraction et une qualité structurelle qui le rapprochent déjà d’un théorème d’impossibilité ; du coup, il est plus à même de recevoir des interprétations diverses. Celle que manifeste l’exemple didactique, par un collège qui déciderait simultanément, n’est ni la seule concevable, ni la plus intéressante au point de vue juridique. Ainsi, A, B et C, siégeant séparément, pourraient avoir porté les jugements indiqués plus haut, alors qu’un quatrième juge, sollicité après eux, se demanderait comment tenir compte de la jurisprudence qui lui est transmise : peut-il ne retenir que les réponses aux questions d’affaire, ou bien doit-il tenir compte des réponses aux questions d’aspect ? Au départ, sans avoir encore imaginé le paradoxe, Kornhauser et Sager [1986] se préoccupaient du fonctionnement collectif des tribunaux sous l’angle principal de leur cohérence diachronique, et si, le paradoxe enfin dégagé, leur travail privilégie la cohérence synchronique, c’est à notre sens pour une simple raison de commodité intellectuelle. Des deux problèmes, le premier importe plus que le second, parce qu’il affecte tous les tribunaux, qu’ils soient collectifs ou individuels, et cela d’autant plus que la jurisprudence tend à l’emporter sur les textes dans les sources du droit. Mais il est aussi vrai que ce problème est très difficile et qu’il est de bonne politique de commencer par l’autre [7].
18 Si l’antagonisme des méthodes du jugement collectif s’apparente à unparadoxe, c’est que chacune peut se prévaloir d’un solide argument normatif en sa faveur. En décidant affaire par affaire, le tribunal tient compte des délibérations de chaque juge intégralement, c’est-à-dire jusqu’au stade de la décision qu’il propose sur l’affaire. C’est une manifestation de respect pour la personne de juge, et elle s’accompagne d’une confiance totale dans sa rationalité individuelle, en particulier dans son aptitude à tirer correctement des conclusions. En décidant aspect par aspect, le tribunal garantit que sa propre décision sur l’affaire est défendable par des raisons et, plus précisément, des raisons qui tiennent compte de celles mises en avant par les juges. C’est une autre manifestation de respect pour la personne des juges, mais la confiance dans la rationalité individuelle n’est pas poussée au même degré, puisque le tribunal se réserve l’inférence finale. En revanche, il garantit la rationalité collective au niveau formel : la décision sur l’affaire procède logiquement de raisons qui sont du même type – défini par la doctrine – que celles des individus, même si, substantiellement, l’ensemble des raisons du tribunal diffère de chaque ensemble individuel de raisons.
19 Cette analyse normative se retrouve plus succinctement chez les inspirateurs de la théorie. Selon Kornhauser et Sager, « lorsque le paradoxe doctrinal se produit, le jugement et la raison sont immédiatement et inexorablement tirés dans des directions différentes » [1993, p. 25]. Il faut lire ce commentaire à la lumière du cas favorable où ne siège qu’un juge : alors, en principe, c’est-à-dire toute objection de rationalité limitée mise à part, le jugement peut être indifféremment constaté sur l’affaire directement ou à partir des raisons qui le fondent, ce qui n’est pas vrai en général dans le cas collectif. Quant à List et Pettit [2002, p. 94], il décrivent ainsi les deux principes normatifs sous-jacents au paradoxe : l’« attention aux individus » (individual responsiveness) et la « rationalité collective » (collective rationality). Ces deux expressions peuvent servir de résumé à l’analyse du paragraphe précédent, et nous les conserverons par la suite.
20 Au-delà du paradoxe qu’il fait naître psychologiquement, l’antagonisme des deux méthodes pose un dilemme, au sens habituel d’un choix forcé entre deux options insatisfaisantes ; car la raison de désirer l’une est aussibien la raison de ne pas désirer l’autre. Il s’agit même d’un dilemme théorique, puisqu’il oppose, on le voit, des principes fondamentaux de la décision collective. Pettit [2001], puis List et Pettit [2002], tirent le paradoxe dans cette direction où leurs prédécesseurs ne s’engageaient pas tout à fait ; cependant, la transformation du problème qu’annonce leur nouveau concept de dilemme discursif ne réside pas dans cette inflexion limitée. Il ne faut pas la chercher non plus dans l’observation de ces auteurs que le paradoxe doctrinal se manifesterait en dehors des tribunaux, car celle-ci est d’une évidence trop immédiate. Pettit signale notamment les assemblées délibératives ou les exécutifs collégiaux des institutions démocratiques, les comités d’expertise et les instances de régulation économique, les clubs ou les autres groupes dont les membres se cooptent, et même, dans une mesure à déterminer, les partis, les syndicats, les églises. Simple affaire de constatations empiriques, la liste peut s’allonger à volonté. La seule adjonction qui n’aille pas de soi est la société politique entière, que Pettit choisit précisément d’inclure au prix d’un détour argumentatif ; il en appelle à la conception délibérative de la démocratie, qu’il a étoffée par ailleurs. Ce nouvel approfondissement du paradoxe doctrinal excède toutefois aussi la sphère d’application normale du dilemme discursif.
21 Pour arracher le problème de Kornhauser et Sager à son origine judiciaire, Pettit écarte les deux termes d’aspect et d’affaire, et le reformule par le conflit de deux méthodes abstraites, fondées, respectivement, sur les prémisses de la décision et sur les conclusions (premiss-driven way, conclusion-driven way, 2002, p. 274). Diffusée par List et Pettit, cette nouvelle dénomination reflète mieux que la précédente l’extension effective du paradoxe doctrinal, et nous en ferons usage à notre tour, mais elle n’en change pas la nature, et il ne saurait être question de ramener le dilemme discursif à cette banale clarification.
22 Ce qui distingue substantiellement les deux problèmes n’est pas tant lasémantique, comme le voudraient les suggestions qui viennent d’être écartées, que la syntaxe, comprise au sens des opérations sur les formules logiques représentatives des propositions. Voici comment List et Pettit [2002] reconstruisent l’exemple de base. Ils associent une formule à toutes les considérations qui influencent la délibération, et, pour la doctrine juridique, prennent d ? v ? r. Supposant alors que le tribunal T vote sur chaque formule simultanément, ils mettent en évidence la contradiction logique de l’ensemble de formules qu’il accepte :
A | v | – | r | – | d | d ? v ? r |
B | – | v | r | – | d | d ? v ? r |
C | v | r | d | d ? v ? r |
T | v | r | – | d | d ? v ? r |
23 Le paradoxe doctrinal se définissait par la divergence des moyens pour faire émerger une conclusion à partir de prémisses, mais le dilemme discursif se définit par la contradiction au sein du jugement collectif total, c’est-à-dire de l’ensemble des propositions délibérées, sans qu’on cherche à distinguer entre prémisses et conclusion. Ainsi présenté, le problème est facile à traiter par la logique propositionnelle ordinaire. Il ouvre la voie au formalisme de la théorie agrégative qu’on appelle, précisément, logique. Une fois cette théorie pleinement développée, il n’y aurait plus lieu de douter qu’on ait reformulé le problème comme il convenait.
24 Si grands que soient les avantages conceptuels et techniques, il reste que, si l’on se préoccupe d’approfondir le paradoxe doctrinal dans le contexte judiciaire où il est né, la reformulation de List et Pettit n’est pas nécessairement la bonne. En effet, dans ce contexte, leur définition englobante du jugement collectif est particulièrement discutable. Elle suppose que la doctrine juridique soit une proposition en tout point comparable aux propositions d’affaire et d’aspects, ce qui veut dire, plus précisément, (i) qu’elle se représente par une formule de la logique ordinaire, et (ii) qu’elle tombe comme les autres formules sous la règle de décision. La théorie de l’agrégation logique a suscité, chez Kornhauser et Sager, des réserves qu’ils n’ont pas complètement éclaircies et qui peuvent tenir aux hypothèses (i) et (ii), ou même, plus radicalement, à l’hypothèse (iii) que la doctrine juridique ait la nature d’une proposition plutôt que d’une règle ou d’un commandement [8]. Nous ne reprendrons pas la dernière objection, qui rendrait plus difficile de recourir à la logique, mais la section 7 s’efforcera de prendre en compte les deux premières.
25 La présente section avait pour but de comparer le paradoxe doctrinal et le dilemme discursif. Notre analyse de ce qui les distingue peut se résumer en la confrontant à celle de Pettit :
26 « Je décris le problème [le paradoxe doctrinal] sous sa forme générale comme un dilemme discursif. Je préfère le mot « discursif » parce que le problème en question n’est pas lié à l’acceptation d’une doctrine commune et ne suppose que l’entreprise de former des jugements de groupe sur la base de raisons. Je préfère le mot « dilemme » parce que le problème conduit à un choix dans lequel chaque options a ses difficultés propres et ne constitue pas un paradoxe dans un sens rigoureux » [Pettit, 2001, p. 272].
27 Comme il a été dit, l’opposition du « paradoxe » et du « dilemme » est un simple choix d’accent et le problème judiciaire se transpose facilement ailleurs. La nouveauté du dilemme discursif est mieux cernée dans cette autre affirmation du passage : le dilemme dépasse la contrainte, incorporée au paradoxe, de la « doctrine commune ». En effet, prise à l’échelle de la société entière, la délibération démocratique tend à ne rien laisser à l’extérieur, même ses propres conditions de fonctionnement ; les libertés publiques, par exemple, ne restent fixes qu’aussi longtemps que le corps politique ne révise pas la constitution qui les définit. A une moindre échelle collective, il est banal que les organes délibératifs partent d’une table rase, en se donnant leurs règles et leurs missions. Ainsi, les désaccords ne sont pas toujours cantonnés comme dans le paradoxe doctrinal. Cette observation est plus clairement identifiée et hiérarchisée chez List et Pettit [2002],qui abolissent définitivement le statut d’exception conféré à la doctrine juridique pour la traiter comme n’importe quelle partie du jugement collectif.
3. Le cadre formel de la théorie de l’agrégation logique
28 La théorie se développe à partir des trois notions spécifiques de l’agenda, des ensembles de jugement et de la fonction de jugement collectif, ainsi que d’un petit groupe d’axiomes, posés sur la fonction de jugement collectif, qui rappellent immédiatement ceux que la théorie du choix social fait porter sur la fonction de bien-être social. Dans cette section et la suivante, nous présentons la théorie avec un minimum de détails logiques ; nous n’y développons en fait que la composante du langage formel, renvoyant à la section 5 la définition complète de l’inférence et des notions logiques associées.
29 Par définition, un langage de la théorie L est un ensemble de formules ?,?, ?, … contenant des symboles logiques pris dans un certain ensemble S. Il n’est pas nécessaire de préciser la nature des formules au-delà de cette unique restriction : S contient le symbole de la négation booléenne –| (« non ») et L est fermé pour ce symbole, ce qui veut dire que, si ? ? L, alors – | ? ? L. Si l’ensemble S contient d’autres symboles, ils seront pris parmi les connecteurs booléens restants, ? (« ou »), ? (« et »), ? (« si…, alors… »), ? (« si et seulement si…, alors… ») ou parmi les symboles d’opérateurs non booléens représentant des modalités (« il est obligatoire de… », « il est désirable que… », « il est connu que… », « si… alors… » pris dans un sens non booléen, par exemple contrefactuel). Pour chaque symbole supplémentaire de S, on pose la règle de fermeture correspondante ; s’il s’agit de ?, on demandera que si ? ? L et ? ? L, alors ? ? ? ? L, et de même pour les autres symboles.
30 Dans la classe très vaste des langages autorisés, un cas particulier se dégage, celui des langages propositionnels LP. Leur définition fait intervenir un ensemble P de formules élémentaires, ou variables propositionnelles, qui ne contiennent pas de symboles logiques, et un ensemble de symboles logiques S égal à celui des cinq symboles de connecteurs booléens. En fait, comme ces connecteurs sont interdéfinissables, il est identique de poser { –| , . } ? S, en remplissant la place vide indiféremment par ?, ?, ? ou ?. Nous distinguerons les langages propositionnels classiques et non-classiques selon que, respectivement, S ne contient que des symboles booléens ou en contient d’autres en sus. Techniquement, un langage LP se définit comme le plus petit ensemble qui contienne P et qui vérifie les règles de fermeture pour les symboles de S.
31 Par calcul de la théorie, nous entendons la donnée, simultanément, d’un langage L et d’un système d’axiomes et de règles qui détermine les liaisons logiques entre les formules de ce langage. Il n’est pas plus nécessaire de préciser entièrement ce système – la logique proprement dite – que le langage à l’étape antérieure. La section 5 montrera qu’il suffit de se donner unsymbole de relation d’inférence B ? ?, défini pour B ? L et ? ? L, qui réponde à des restrictions très générales. Dans cette section et la suivante, nous nous en tenons au cas particulier des calculs propositionnels classiques. De tels calculs comportent en effet, pour leur partie logique, des systèmes d’axiomes et de règles bien connus et conformes à l’intuition, et ce sont eux qui fixeront temporairement le sens de la règle d’inférence – également symbolisée par ? – et de ses notions formelles associées : vérité logique, contradiction logique, cohérence, incohérence. Simples cas particuliers au regard de la théorie générale, les calculs propositionnels classiques se désignent à l’attention par leurs propriétés élémentaires. Nous nous en sommes servis comme M. Jourdain de la prose lorsque nous avons formalisé l’exemple de base : notre langage était alors LP, construit sur P = { v, r, d } et S = { –| , ? }, et l’ensemble { v, r, –| d, d ? v ? r } était contradictoire au sens technique d’un système propositionnel classique.
32 Dans le langage L, la théorie fixe un sous-ensemble X représentatif des propositions que les membres du groupe mettent à l’examen ; c’est l’agenda. Il peut être vaste ou restreint suivant les applications, mais en toute généralité, la théorie a seulement besoin qu’il soit non-vide et que, à l’instar de L, il satisfasse la clôture par négation. L’agenda que List et Pettit retiennent pour l’exemple de base s’écrit :
33 Si l’on ajoutait dans X les négations multiples, comme –| –| v, –| –| –| v, …, la logique en assurerait finalement la simplification. Il vaut mieux anticiper le processus et définir les agendas comme des ensembles :
34 dont les éléments ?, ?, ?, … sont des formules positives, c’est-à-dire ne commençant pas par –|, chacune étant doublée de sa négation (ce qu’indique le symbole ± mis en exposant). Pour simplifier, nous imposerons une restriction supplémentaire à celles dont la théorie se contente minimalement : nos agendas se composeront de formules contingentes, c’est-à-dire qui ne sont ni des vérités logiques, ni des contradictions logiques.
35 On représentera les jugements que portent soit les membres du groupe, soit le groupe lui-même, par des sous-ensembles de X, les ensembles de jugement, qui répondent éventuellement à certaines contraintes logiques, détaillées ci-dessous ; la plus attendue est la cohérence. Les ensembles de jugement seront notés B, B ? , … génériquement, et Ai , A ? i , … A, A ? , … quand ils appartiennent à des individus i et au groupe qu’ils forment, respectivement. Une formule ? de ces ensembles représente une proposition, au sens d’un objet sémantique doté d’une valeur de vérité, et si elle sert à représenter aussi un jugement, au sens d’une opération cognitive, c’est en vertu de la règle d’interprétation naturelle :
36 (R) i juge que ? ssi ? ? Ai , et la collectivité juge que ? ssi ? ? A.
37 Nous traitons la formule ? dans cet énoncé comme si elle était elle-mêmela proposition qu’elle exprime ; la facilité de style est banale en logique etnous nous la permettrons souvent par la suite. Grâce à la règle (R), les jugements obéissent à une distinction de deux types de négation, interne et externe, qui n’a pas d’analogue au niveau des propositions ou des formules, celles-ci étant niées d’une seule manière. En effet, « juger que ne pas » (–| ? ? Ai ) diffère de « ne pas juger que » (? ? Ai ). Une fois la relation d’inférence définie, la cohérence logique des ensembles de jugement reliera une négation à l’autre comme on l’attendrait : « juger que ne pas » entraîne « ne pas juger que », sans que la réciproque ait toujours lieu.
38 Par ce qui précède, on voit que la théorie de l’agrégation logique se rattache à une conception philosophique déterminée du jugement et de la proposition. Le langage L représente toutes les propositions exprimables, donc susceptibles de devenir objets de jugements, mais seules les propositions représentées dans X le seront effectivement. Ainsi, les deux concepts sont dissociés à l’avantage de la proposition, qui couvre plus largement, ce qui est caractéristique de la conception moderne du jugement – depuis Frege et Russell – par opposition à l’ancienne – celle d’Aristote, qu’on retrouve encore chez Kant [9]. La théorie de l’agrégation logique mobilise en fait le concept frégéen d’assertion, ici rendu par ? ? Ai ou ? ? A, et l’on vérifie qu’elle honore le principe, qui est aussi typiquement frégéen et moderne, voulant que l’assertion reste indifférente aux transformations opérées par la logique. Peu importe, en effet, que ? soit positive ou négative, conditionnelle ou inconditionnelle, de type modal ou non ; l’indicateur choisi pour l’assertion, qui est l’appartenance à un ensemble, fonctionne à l’identique. Sans doute est-il permis à un moderne de faire porter les distinctions logiques par le jugement, mais c’est alors par voie de conséquence ; de cette manière, il parlera de « jugement positif » ou de « jugement négatif » sur ? suivant que? ou –| ? appartient à l’ensemble de jugement considéré ; mais c’est uniquement par la négation mise ou non devant la formule qu’il différencie les deux cas.
39 Reprenant la description du cadre formel, nous définirons l’ensemble des individus { 1,..., n }, avec n ? 2, et la fonction de jugement collectif, qui associe un ensemble de jugement collectif à chaque configuration, ou profil, d’ensembles de jugement pour les n individus :
40 Comme celle du choix social, la théorie de l’agrégation logique privilégie les groupes de cardinalité finie [10]. Généralisant la fonction arrovienne de bien être social, F formalise les règles de décision que le groupe est susceptible d’appliquer aux formules de l’agenda. Dans sa définition ordinaire, la seule considérée ici, elle part du domaine universel, c’est-à-dire de l’ensemble de tous les profils concevables, étant donné les contraintes logiques posées surles ensembles de jugement ; ces contraintes, que nous allons maintenant préciser, influencent aussi le choix de l’espace d’arrivée [11].
41 Un ensemble de jugement B peut répondre à ces trois exigences :
- B est déductivement clos, i.e., pour tout ? ? X et tout B, si B ? ?, alors? ? B
- B est cohérent, i.e., pour tout ? ? X, non (B ? ? et B ? –| ?)
- B est complet, i.e., pour tout ? ? X, ou bien ? ? B, ou bien –| ? ? B
43 Ces propriétés se combinent entre elles pour donner des concepts inégalement forts d’ensembles de jugement. Voici les deux familles principales :
- l’ensemble D des ensembles de jugements cohérents et complets, qui satisfont les trois propriétés ou, de manière équivalente, les deux dernières, la première suivant alors facilement ;
- l’ensemble plus vaste D * des ensembles de jugements cohérents et déductivement clos, tels que définis par les deux premières propriétés.
- partir de là, on peut combiner librement les définitions pour contraindre le domaine de F et son espace d’arrivée en appliquant l’hypothèse de domaine universel, mais nous considérerons seulement les cas suivants :
(ii) F : Dn ? D *,
(iii) F : (D *) n ? D *,
(iv) F : Dn ? 2 X ou F : (D *) n ? 2 X .
45 Avec (iv), les ensembles de jugement collectifs échappent à toute contrainte logique et sont ainsi traités différemment des ensembles individuels. Ce cas sert uniquement à faciliter l’exposition des autres, sur lesquels portent les résultats de la théorie. Au départ, elle n’a traité que le cas (i), commode pour les démonstrations, mais douteux au regard de la psychologie cognitive, qui privilégierait des hypothèses logiques plus faibles. On peut aussi – plus subtilement – contester le choix de D au nom de la conception moderne du jugement qui sous-tend le formalisme. En interdisant l’abstention, il élimine la possibilité qu’elle offre, et que n’offrait pas l’ancienne, de traiter d’une proposition sans qu’on doive l’asserter ou asserter sa négation. De même, la théorie perd la distinction de la négation interne et la négation externe : « ne pas juger que » devient équivalent à « juger que ne pas ». Il y a donc des raisons diverses à développer les cas fondés sur D *, soit (ii) et (iii).
46 La fonction de jugement collectif F doit formaliser les règles de décision que se donnent concrètement les groupes. Deux moyens se présentent pour qu’elle joue son rôle : ou bien l’on précisera F au point de la faire coïncider avec une règle déterminée, ou bien l’on déterminera F par des conditions axiomatiques, représentatives des principes auxquels obéissent les règles particulières. La même dualité se retrouve mutatis mutandis en théorie du choix social à propos de la fonction de bien-être social, et comme ce précédent l’a montré, on obtiendra le plus si l’on recourt aux deux moyens à la fois [12]. Le vote majoritaire proposition par proposition (proposition-wise majority voting), qui est la règle de décision appliquée dans l’exemple judiciaire, illustrera la démarche.
47 Cette règle se définira ici comme la fonction de jugement collectifFmaj : Dn ? 2 X telle que, pour tout profil (A 1,..., An ) du domaine,
48 avec si n est impair et si n est pair.
49 L’espace d’arrivée n’est pas D parce que Fmaj ne tranche pas toujours l’égalité entre ? et –| ? quand n est pair, et il n’est même pas D *, puisque le dilemme discursif correspond à un profil (A 1,..., An ) qui rend Fmaj (A 1,..., An ) incohérent. Après qu’on a formalisé la règle, il est souhaitable d’introduire ses propriétés axiomatiques. Dans cette section, nous en retenons trois, définies abstraitement pour toute F concevable, grâce auxquelles un théorème d’impossibilité – le premier apparu par ordre chronologique – se démontre aisément. La liste des propriétés se développera en section 4 avec des résultats plus avancés.
50 Systématicité. Pour tout couple de formules ?, ? ? X, et pour tout couple de profils (A 1,..., An ), (A ? 1,..., A ? n ), si, pour tout i = 1,..., n, ? ? Ai ? ? ? A ? i , alors
51 D’après la systématicité, le groupe, devant un profil d’ensembles de jugement individuels, se prononce sur une formule exactement de la même manière que, devant un autre profil, il se prononcerait sur une autre formule, dès lors que la répartition des jugements individuels sur la formule du premier profil coïnciderait avec la répartition des jugements individuels sur la formule du second profil. La règle Fmaj vérifie manifestement la systématicité, dont l’analogue en théorie du choix social, est la neutralité [voir d’Aspremont, 1985].
52 Nous dirons qu’une fonction de jugement collectif F est une dictature s’il existe un individu j tel que, pour tout profil (A 1,..., An ),
53 Compte tenu du domaine de F, il n’existe qu’un seul j par dictature, et on le nomme le dictateur. A l’évidence, Fmaj satisfait la condition :
54 Non-dictature. F n’est pas une dictature et même la condition beaucoup plus forte qui suit :
55 Anonymat. Pour tout profil (A 1,..., An ), si (A ? 1,..., A ? n ) s’obtient de (A 1,..., An ) en permutant les individus, alors
56 Le parallélisme avec la théorie du choix social est encore manifeste.
57 Le premier résultat de la théorie mettait en évidence le conflit de l’anonymat et de la systématicité sous une condition très peu contraignante imposée à X [List et Pettit, 2002, Theorem 1]. En fait, le conflit peut s’exprimer plus fortement comme celui de la non-dictature et de la systématicité [Pauly et van Hees, 2006, Theorem 4] et nous le présentons donc dans cette version améliorée.
Théorème 1 (Pauly et van Hees, 2006, généralisant List et Pettit, 2002)
58 Soit un langage propositionnel classique LP avec ; soit deux variables propositionnelles distinctes a, b ? P telles que a, b, a ? b ? X ; alors, il n’existe pas de F : Dn ? D vérifiant à la fois la non-dictature et la systématicité.
59 Comme Fmaj vérifie la non-dictature et la systématicité sur Dn , il faut, par contraposition du théorème, que son espace d’arrivée diffère de D. Avec nimpair, les ensembles de jugement collectifs étant toujours complets, il faut que l’un des Fmaj (A 1,..., An ) soit incohérent. Cette déduction s’accorde avec ce que l’exemple de base donnait à connaître empiriquement, sachant qu’il vérifie les conditions demandées à LP et X. Par delà telle ou telle application, le Théorème 1 approfondit le dilemme discursif : on retrouve la rationalité collective dans l’hypothèse, posée avec la définition de F, que cette fonction va dans D, et l’attention aux individus dans l’axiome de non-dictature ; mais que faire de l’axiome de systématicité, qui n’évoque ni un principe, ni l’autre ? Quoique List et Pettit préfèrent souligner la continuité des analyses formelle et informelle, il nous semble que le Théorème 1 vaut surtout parce qu’il modifie les intuitions premières. Le problème du jugement collectif apparaît en fait comme un trilemme dont la systématicité forme le terme supplémentaire. Contrairement aux deux autres, cette propriété n’a pas de valeur normative, et on ne peut la défendre que pour ses avantages techniques éventuels ; pourtant, elle participe non moins qu’elles à l’impossibilité du jugement collectif [13].
60 A hauteur de sa généralité abstraite, le théorème couvre bien d’autres règles que Fmaj . Nous nous arrêterons sur les variantes qui comportent unquota de majorité qualifiée 1 ? q ? n, c’est-à-dire sur les fonctions de jugement collectif ainsi définies : pour tout profil (A 1,..., An ) du domaine,
61 Dans le cas-limite q = n, une formule est acceptée collectivement si et seulement si tous les individus l’acceptent ; on formalise ainsi la règle de l’unanimité, qui a son analogue en théorie du choix social (voir Sen, 1970). Manifestement, aucune des ces fonctions ne peut aller dans D, puisque certains ensembles de jugement collectifs seront incohérents avec q pris en-dessous des seuils de majorité ordinaires et que d’autres seront incomplets avec q pris en-dessus. Les vérifiant la non-dictature et la systématicité, le Théorème 1 s’impose à elles, et la méthode axiomatique révèle ici le pouvoir unificateur dont on lui fait le mérite [14].
62 En résumé, sur l’arrière-plan banal d’un calcul propositionnel classique, des concepts nouveaux prennent forme, l’agenda, les ensembles de jugement individuels et collectifs, et la fonction de jugement collectif pour relier les premiers aux seconds. Le dernier concept donne à la théorie de l’agrégation logique le moyen de traiter à la fois de règles particulières et de conditions axiomatiques. Elle s’attache à l’effet d’ensemble des conditions en précisant les agendas, et c’est ainsi qu’elle transforme le dilemme discursif en théorème d’impossibilité du jugement collectif. Ce premier résultat illustre la théorie en mouvement, mais il ne fait qu’en effleurer les possibilités démonstratives.
4. Théorèmes fondés sur l’axiome d’indépendance
63 L’étude des règles de vote, formalisées comme cas particuliers de fonctions de jugement collectif, met en évidence d’autres axiomes qu’on peut imposer à ces fonctions : la préservation de l’unanimité, l’indépendance et la monotonie. Les théorèmes de cette section, qui ont servi d’étapes vers le théorème canonique, reposent précisément sur ces axiomes, que nous introduisons maintenant.
64 S’agissant du premier, le cadre formel de la théorie l’autorise à faire porter l’unanimité ou bien sur les ensembles de jugement pris en bloc, ou bien – plus fortement – sur leurs formules considérées une à une. On facilite le parallélisme avec la systématicité et les conditions qui s’en rapprochent si l’on opte pour la plus forte des deux variantes ; elle est aussi l’analogue des conditions de Pareto en théorie du choix social.
65 Préservation de l’unanimité. Pour toute formule ? ? X et tout profil (A 1,..., An ), si pour tout i = 1,..., n, ? ? Ai , alors ? ? F (A 1,..., An ).
66 Par ailleurs, la systématicité donne lieu à une variante affaiblie, donc aussi vérifiée par les règles de vote de la section précédente :
67 Indépendance. Pour toute formule ??X et tout couple de profils (A 1,..., An ), (A ? 1,..., A ? n ) si, pour tout i = 1,..., n, ? ? Ai ? ? ? A ? i , alors
68 L’indépendance revient à limiter l’axiome de la section précédente au cas où ? = ?. Elle fait disparaître l’élément conceptuel de la neutralité, c’est-à-dire l’indifférence à la nature des propositions, tout en préservant un autre élément conceptuel qui s’imbriquait dans celui-là : le jugement collectif sur ?dépend des seuls jugements individuels sur ? [15]. En d’autres termes, l’ensemble A se définit à partir des ensembles A 1,..., An formule par formule(formula-wise). La théorie ne peut exprimer cette idée que par la comparaison d’un profil donné avec des profils hypothétiques, ceux où les jugements individuels sur les ? ? ? varient alors que les jugements individuels sur ?restent identiques. L’axiome, aussi bien que sa formulation multi-profil, suivent de près l’indépendance des options non pertinentes, qui joue le rôle essentiel qu’on sait dans la théorie arrovienne.
69 Les règles de vote satisfont une propriété classique de renforcement : lorsqu’un résultat collectif reflète le jugement d’un groupe d’électeurs, il se maintient si ce groupe rallie de nouveaux électeurs au même jugement. Comme la condition de sensibilité positive (positive responsiveness) qui lui est apparentée en théorie du choix social, celle-ci appelle une formulation multi-profil.
70 Monotonie. Pour toute formule ? ? X et tout couple de profils (A 1,..., An ), (A ? 1,..., A ? n ), si, pour tout i = 1,..., n, ? ? Ai ? ? ? A ? i , avec un j au moins tel que ? ? Aj et ? ? A ? j , alors
71 Nous parlerons d’indépendance, ou de systématicité, monotone pour désigner la conjonction de l’axiome de monotonie avec ceux d’indépendance ou de systématicité. Ils ne l’impliquent pas, comme il est évident pour l’indépendance et comme on peut le vérifier maintenant pour la systématicité. Soit la règle d’antidictature ainsi définie : il existe j tel que pour tout (A 1,..., An ) et tout ? ? X,
72 Sous la restriction d’agenda convenable, l’antidictature est uneF : Dn ? D [16]. Elle est systématique, mais non monotone, comme on le voit en rapprochant deux profils (A 1,..., An ) et (A ? 1,..., A ? n ) tels que et? ? A ? j , et Ai = A ? i , i ? j.
73 On approfondirait l’explication du dilemme discursif si l’on parvenait à reproduire la conclusion d’impossibilité du Théorème 1 sous l’indépendanceen lieu et place de la systématicité. La théorie ferait alors remonter le problème fondamental du jugement collectif à l’un des deux éléments conceptuels, l’agrégation formule par formule, plutôt qu’à l’autre, la neutralité. Sans doute la systématicité demeurerait-elle dans la conclusion – les fonctions dictatoriales, seules existantes d’après le Théorème 1, vérifient cette propriété – et donc aussi dans les hypothèses, mais il serait préférable de l’expliciter seulement dans la démonstration. Par là, on restaurerait le parallèle avec la théorie du choix social, dont les résultats les plus forts traitent l’indépendance des options non pertinentes comme une hypothèse et la neutralité comme un intermédiaire éventuel [17].
74 Ce programme a été mené à bien par Pauly et van Hees [2006, Theorem 4] et Dietrich [2006, Theorem 1, Corollary 2], qui mettent l’indépendance au point de départ. Pour démontrer leurs résultats, ces auteurs se servent de la préservation de l’unanimité, mais ils n’ont pas besoin de la prendre comme hypothèse, ce qui fait une grande différence avec les démonstrations correspondantes en théorie du choix social. En effet, sous leurs conditions d’agenda respectives, cet axiome découle de l’indépendance. L’économie de moyens est remarquable, mais on peut vouloir faire apparaître au grand jour les principes distincts qu’elle assimile. Mongin [2008, Theorem 2] propose alors d’expliciter la préservation de l’unanimité dans les hypothèses, et pour cela, il affaiblit l’indépendance de manière que celle-ci ne l’implique plus. Sous les restrictions d’agenda qui sont les siennes, ce théorème d’impossibilité restaure le parallélisme avec la théorie du choix social.
75 Les trois théorèmes ont en commun de renforcer les conditions d’agenda peu exigeantes du Théorème 1, ce qui est la contrepartie des affaiblissements obtenus du côté de la systématicité. Nous dirons qu’un agenda X estfermé par variables propositionnelles si, pour tout ? ? X et tout a ? P qui figure dans ?, a ? X. Par exemple, si , on aura v, r, d ? X ; ainsi l’agenda convient. Un littéral se définit comme une variable propositionnelle a ou sa négation –| a ; il est noté par ± a. Compte tenu de la fermeture de X par négations, la condition demande en fait que, pour tout? ? X et tout a ? P qui figure dans ?, ± a ? X.
76 Théorème 2 (Pauly et van Hees [2006]). Soit un langage propositionnel classique LP avec ; soit X fermé par variables propositionnelles, contenant deux variables propositionnelles distinctes, et tel que, si ; alors toute F : Dn ? D qui vérifie à la fois la non-dictature et l’indépendance est une fonction constante [18].
77 Une fonction de jugement collectif F est constante s’il existe un ensemble de jugement A tel que, pour tout profil (A 1,..., An ), F (A 1,..., An ) = A. Ce cas dégénéré survient à propos des fonctions de bien-être social, et certainesaxiomatiques du choix social choisissent de l’exclure d’emblée. En théorie de l’agrégation logique, il se présente avec l’affaiblissement de la condition la plus caractéristique : une fonction de jugement collectif dans D ou D * qui est constante n’est pas systématique, mais elle est indépendante [19].
78 Nous n’avons fait jusqu’à présent, et ne ferons en général, aucune hypothèse sur la cardinalité de l’ensemble des variables propositionnelles. Mais le théorème suivant s’énonce mieux avec P fini (et donc, à l’équivalence logique près, LP également fini). On peut alors définir les atomes de LP, qui sont les formules du type , dans lesquelles figurent lesk variables propositionnelles distinctes de P. Soit AT l’ensemble des atomes de LP ; il constitue la partition logique – c’est-à-dire la classe de formules logiquement exclusives et logiquement exhaustives – la plus fine concevable pour ce langage. La proposition qui correspond sémantiquement à un atome décrit les états du monde possibles avec une précision maximale. Dietrich montre que, si l’agenda contient les atomes, la conclusion de Pauly et van Hees se retrouve à l’identique : il suffit même que l’indépendance porte seulement sur les atomes au lieu de l’agenda entier.
79 Théorème 3 (Dietrich [2006]). Soit un langage propositionnel classique LPavec et P fini contenant deux variables propositionnelles au moins ; soit AT ? X ; alors toute F : Dn ? D qui vérifie à la fois la non-dictature et l’indépendance restreinte à AT est une fonction constante.
80 Il ne s’agit en fait que d’un cas particulier du théorème d’origine. Pour illustrer plus complètement celui-ci, considérons l’exemple où P = { a 1, a 2 } et Cet agenda ne contient pas tous les atomes de LP, mais satisfait néanmoins une propriété approchante : pour tout B ? D, il existe dans X une formule équivalente à la conjonction des éléments de B. En effet, D contient trois ensembles de jugement,
{ –| a 1, –| (–| a 1 ? a 2, –| a 1 ? –| a 2) }
81 et la conjonction de chacun d’eux est représentée par une formule équivalente :
82 Parce qu’elles résument les ensembles cohérents et complets de formules qui sont permis par X, ces trois formules jouent le rôle d’atomes relatifs de X. Le résultat de Dietrich porte sur cette notion plus générale que celle d’atome, ce qui en accroît la portée relativement au Théorème 3.
83 Dans cet énoncé, l’indépendance porte sur un sous-ensemble particulier de l’agenda. Le résultat qui suit restreint de même l’axiome, mais à un sous-ensemble différent, celui des variables propositionnelles qui apparaissent dans les formules de X.
84 Théorème 4 (Mongin [2008]). Soit un langage propositionnel classique LPquelconque ; soit X fermé par variables propositionnelles et contenant deux variables propositionnelles au moins ; de plus, X satisfait les conditions de la section 7. Alors, il n’existe pas de F : Dn ? D qui vérifie à la fois la non-dictature, la préservation de l’unanimité et l’indépendance restreinte à l’ensemble VPX des variables propositionnelles de X.
85 Les trois théorèmes de cette section concordent pour désigner l’indépendance comme la source principale du dilemme discursif. Les deux premiers disent en substance qu’une fonction de jugement collectif dégénère en dictature ou en fonction constante si elle procède formule par formule sur un agenda dont les formules entretiennent des relations logiques déterminées. Le dernier théorème ajoute une considération nouvelle à ce diagnostic : l’indépendance devrait porter sur les seules formules qui, dans un calcul propositionnel classique, n’entretiennent pas de relations logiques préexistantes, c’est-à-dire sur VPX . La conclusion d’impossibilité demande alors qu’on ajoute la préservation de l’unanimité, qui devient la cible des objections normatives. Mongin rattache le dilemme discursif au problème de l’unanimité factice (spurious unanimity) qu’il a mis en évidence dans le cadre du bayésianisme collectif [20].
86 L’exemple de base met en scène les deux interprétations données tour à tour. Suivant la première, le tribunal s’expose à des difficultés parce qu’il fait voter les juges sur chaque proposition considérée isolément, alors qu’elles sont logiquement reliées par la doctrine juridique. Suivant la seconde, même si le tribunal fait voter les juges sur des propositions indépendantes, il doit encore veiller à soustraire la doctrine juridique à la préservation de l’unanimité : en l’occurrence, les juges ne sont pas d’accord sur la manière de l’appliquer, ce qui prive cet axiome de sa force normative supposée.
87 Un autre exemple, formel celui-là, précisera les deux raisonnements. Soit un langage propositionnel LP avec et P = { a, b, c } ; soit l’agenda , qui entre dans les conditions du Théorème 4 ; soit enfin n = 3 et le profil (A 1, A 2, A 3) ? D 3 ainsi donné :
88 Par clôture déductive, a ? b ? c ? Ai , i = 1, 2, 3. Si l’on applique Fmaj , l’ensemble de jugement collectif A est contradictoire, puisque . Cette observation illustre les difficultés de l’agrégation formule par formule, compte tenu de la liaison logique entre a, b, cinstaurée par a ? b ? c, et elle reflète l’esprit des Théorèmes 2 et 3 (l’esprit mais non la lettre, car le X choisi échappe à leurs conditions d’agenda). Mais loin d’être limitée à Fmaj , la contradiction persiste avec toute F qui coïncide avec elle sur a, b, c et se contente d’enregistrer l’unanimité sur a ? b ? c. LeThéorème 4 laissait attendre cette amplification, et l’exemple en fait comprendre le lien avec l’unanimité factice : les trois individus ont des raisons incompatibles d’accepter la même formule a ? b ? c.
89 Un théorème de Nehring et Puppe [2002], fondé sur l’indépendance monotone, précède les Théorèmes 2-4. Il ne se place pas encore dans le cadre formel de la théorie de l’agrégation logique, mais il est possible d’en faire la traduction rétrospective, ainsi que les deux auteurs l’ont montré [voir Nehring et Puppe, 2010]. Ce résultat se rattache en fait à la section 6, et nous tenterons d’illustrer autrement la force toute particulière de la condition d’indépendance monotone. L’énoncé qui suit s’exprime à l’aide d’une notion affaiblie de dictature. Une fonction de jugement collectif F comporte unpouvoir de veto local s’il existe un individu j et une formule ? ? X tels que, pour tout profil (A 1,..., An ),
90 Pour une F donnée, il peut exister de multiples détenteurs de veto j, chacun étant relatif à une ? particulière. La théorie du choix social définit des notions de veto dont la plus faible – pour deux options données – s’apparente à celle-ci [voir Gibbard, 1969].
91 Absence de veto. F ne comporte pas de pouvoir de veto local.
92 Théorème 5 (Nehring et Puppe [2008]). Soit un langage propositionnel classique LP quelconque : soit X fermé par variables propositionnelles et contenant au moins une formule contingente qui n’équivaut pas logiquement à un littéral ; alors, il n’existe pas de F surjective satisfaisant l’indépendance monotone et l’absence de veto.
93 Par rapport aux Théorèmes 2, 3 et 4, les axiomes sur F se renforcent – l’indépendance s’est accrue de la monotonie, qui, en présence de la surjectivité, implique la préservation de l’unanimité, et l’absence de veto est nettement plus exigeante que celle de la dictature –, mais les contraintes surX s’allègent dans le même temps. Il se confirme ainsi que de nombreux arbitrages sont possibles entre conditions d’agenda et axiomes ; la section 6 développera cette observation au point de préciser les équivalences métathéoriques.
94 Le Théorème 5 affaiblit deux résultats de Nehring et Puppe [2008, Theorems 1 et 2] qui reposent sur une notion particulière aux deux auteurs. Ils définissent F comme une oligarchie avec solution par défaut (oligarchy with default) s’il existe deux sous-ensembles non vides et tels que pour tout (A 1,..., An ) et tout ? ? X,
95 ? ? F (A 1,..., An ) ssi ou bien ? ? Aj pour tout j ? M, ou bien ? ? J et ? ? Aj pour un j ? M.
96 Les j ? M sont alors désignés comme les oligarques, et l’ensemble J comme la solution par défaut (default). En substance, si les oligarques s’accordent sur la formule ?, elle s’impose au jugement collectif, et si elle les divise, on décide entre ? et d’après ce qu’indique la solution par défaut. Pour des agendas dont nous ne reproduisons pas les conditions, Nehring et Puppemontrent que les seules F satisfaisant l’indépendance monotone et la surjectivité sont les oligarchies avec solution par défaut [21].
97 En résumé, avec les Théorèmes 2-5, la théorie l’agrégation logique approfondit encore le dilemme discursif. La systématicité a fait place à l’indépendance, tantôt posée isolément, chez Pauly et van Hees ou Dietrich, tantôt renforcée de la préservation de l’unanimité, chez Mongin, tantôt renforcée de la monotonie, chez Nehring et Puppe. La théorie ultérieure a privilégié l’axiomatique intermédiaire. Avant d’introduire son théorème d’impossibilité canonique, nous reviendrons sur le cadre formel de la théorie pour en faire saisir mieux l’extrême généralité.
5. Une logique générale pour la théorie
98 Les théorèmes des deux sections précédentes sont formulés à propos des calculs propositionnels classiques, ce qui est restrictif. La question se pose de les étendre à des calculs propositionnels non classiques, c’est-à-dire comportant des connecteurs non booléens et des relations d’inférence plus fortes que celles des calculs précédents. De même, la question se pose de les étendre aux calculs des prédicats classiques, qui s’en tiennent aux connecteurs booléens, mais perfectionnent l’analyse des propositions à l’aide de symboles de prédicats et de quantificateurs. Ceux-là renforcent dans une autre direction l’inférence des calculs précédents : ils sont les calculs immédiatement pertinents pour obtenir les théorèmes du choix social à partir de ceux de l’agrégation logique. Mais au lieu de démontrer un résultat de la théorie en deux temps, d’abord pour des calculs élémentaires, puis en le vérifiant sur d’autres plus avancés, il vaut mieux le démontrer en une seule fois dans une logique générale qui englobe tous les calculs auxquels on s’intéresse. Cette exigence métathéorique remonte à Dietrich [2007a], qui l’a réalisée en axiomatisant la relation d’inférence ? sans définir une logique particulière. Nous reprendrons ici l’axiomatique plus perfectionnée de Dietrich et Mongin [2010]. Dès lors qu’un théorème est démontré avec la logique générale, il suffira, pour qu’il s’applique à un calcul dont le langage est du type L défini à la section 3, que sa relation d’inférence obéisse à l’axiomatique en question. Compte tenu de l’importance reconnue au théorème canonique de la section 6, il importera de l’énoncer dans ce nouveau cadre formel.
99 La logique générale comporte six axiomes qui déterminent la relation d’inférence S ? ? entre un ensemble de prémisses S ? L et une conclusion ? ? L. Les écritures S ?/ ? et ? ? ?, signifient, respectivement, que S ? ? n’a pas lieu et que S ? ? a lieu avec S = {?}.
100 (E1) Il n’existe pas de ? ? L tel que ? ? ? et ? ? –| ? (non-trivialité).
101 (E2) Pour tout ? ? L, ? ? ? (réflexivité).
102 (E3) Pour tout S ? L et tout ?, ? ? L, si S ? { ? } ? ? et S ? { –| ? } ? ?, S ? ?(complétion à une étape).
103 (E4) Pour tout S ? S ? ? L et tout ? ? L, si S ? ?, alors S ? ? ? (monotonie).
104 (E5) Pour tout S ? L et tout ? ? L, si S ? ?, il existe un sous-ensemble finiS 0 ? S tel que S 0 ? ? (compacité).
105 (E6) Pour tout S ? L, s’il existe ? ? L tel que S ? ? et S ? –| ?, alors pour tout? ? L, S ? ? (non-paraconsistance).
106 Une nouvelle propriété découle des précédentes :
107 (E7) Pour tous S, T ? L et tout ? ? L, si T ? ? et S ? ? pour tout ? ? T, alorsS ? ? (transitivité).
108 De toute cette liste, (E4) est sans doute la condition la plus importante. Elle exprime la monotonie caractéristique de l’inférence déductive par opposition à la non-monotonie caractéristique des inférences inductives, comme dans l’exemple suivant : S dit que tous les corbeaux examinés jusqu’à l’étape t sont noirs et ? que tous les corbeaux sont noirs : l’inférence inductive de S vers ? n’a plus lieu si S est accru d’un ? disant que le corbeau examiné à l’étape t + 1 n’est pas noir. Or le concept ordinaire ou philosophique du jugement s’articule sur celui du raisonnement pris en général, et non pas seulement de la déduction. Il faut donc voir (E4) comme une restriction apportée aux jugements dont s’occupe la théorie : c’est une raison supplémentaire pour la désigner comme celle de l’agrégation logique.
109 La condition (E1) est essentielle, non seulement parce qu’elle définit une inférence qui est non-triviale, mais parce que, si elle était violée, (E4) ferait que n’importe quelle inférence serait triviale. (E2) énonce une propriété attendue de l’inférence, déductive ou inductive. (E3) autorise l’abréviation des prémisses, ce qui est convenable pour l’inférence déductive : si l’on infère ? à l’aide de ? aussi bien que de –| ?, on peut inférer ? en se passant de l’une et de l’autre formule. D’ordinaire, (E3) se dissimule sous d’autres conditions plus courantes [22]. (E5) permet de supposer que l’ensemble de prémisses est fini, ce que les logiciens justifient notamment par les exigences de l’axiomatisation (un bon système ne comporte qu’un nombre fini d’axiomes). Le théorème canonique et les suivants se démontrent à l’aide de cette propriété (dans la partie qui affirme que les conditions d’agenda sont nécessaires à l’impossibilité). (E6) vise à exclure un groupe de calculs déductifs qui les embarrassent depuis longtemps, celui des logiques paraconsistantes. Leur singularité se comprendra mieux une fois définies les notions de cohérence et d’incohérence.
110 Soit I l’ensemble des ensembles incohérents de formules de L ; par définition, les ensembles cohérents sont ceux qui n’appartiennent pas à I. D’après la définition la plus courante en logique,
111 (Déf*) S ? I si et seulement si pour tout ? ? L, S ? ?.
112 On remarquera que notre définition de la cohérence, à la section 3, se conformait à (Déf*). Les logiciens de la paraconsistance choisissent une définition plus faible :
113 (Déf**) S ? I si et seulement s’il existe ? ? L tel que S ? ? et S ? –| ?.
114 Chaque définition peut contester l’autre au motif qu’elle donne lieu à trop – pour Déf** – ou trop peu – pour Déf* – d’ensembles incohérents. Les mathématiciens ont implicitement écarté ce débat, et (E6), qui rend les définitions identiques, reflète leur position. En reprenant cet axiome, la théorie de l’agrégation logique se conforme aux intuitions démonstratives ordinaires et elle ne laisse de côté qu’une famille assez peu répandue de calculs logiques [23].
115 Sous l’une ou l’autre définition, l’axiomatique (E1)- (E6) implique les propriétés suivantes de I :
116 (I1) ? ? I (non-trivialité).
117 (I2) Pour tout ? ? L, {?, –| ?} ? I (réflexivité).
118 (I3) Pour tout S ? L et tout ? ? L, si S ? I, ou bien S ? { ? } ? I, ou bienS ? { –| ?} ? I (complétion à une étape).
119 (I4) Pour tout S ? S ? ? L, si S ? I, alors S ? ? I (monotonie).
120 (I5) Pour tout S ? L, si S ? I, il existe un sous-ensemble fini S 0 ? S tel queS 0 ? I (compacité).
121 La monotonie se retrouve en (I4). Comme son homologue, (I1) évite de trivialiser la notion qu’on veut définir. (I2) s’impose une fois qu’on a écarté l’option paraconsistante. (I3) justifie rétrospectivement l’appellation donnée à son homologue, puisqu’elle autorise à compléter un ensemble cohérent par une formule ou sa négation. En présence de la compacité, ici (I5), la propriété d’extension cohérente finie implique la propriété infinie correspondante :
122 (I3+) Pour tout S ? L, si S ? I, il existe T ? L tel que (i) S ? T, (ii) T ? I, et (iii), pour tout ?, –| ? ? L, soit ? ? T, soit –| ? ? T (complétion entière).
123 La définition de D à la section 3 est rétrospectivement justifiée : il existe des ensembles de jugement cohérents et complets quelle que soit la cardinalité de L ; le cas infini posait un problème désormais résolu.
124 La logique générale peut s’exposer dans l’ordre inverse, c’est-à-dire en partant de l’ensemble I axiomatisé par (I1)- (I5), et en traitant la relation ? comme dérivée. On vérifie alors qu’elle obéit à (E1)- (E6), qui perdent leur statut d’axiomes pour devenir des propriétés. Une définition nouvelle raccorde les registres si l’on prend cet ordre de parcours :
125 (Déf***) S ? ? si et seulement si S ? { –| ?} ? I.
126 La réduction de l’inférence à l’incohérence dans (Déf***) n’est pas moins commune que la réduction inverse dans (Déf*). Que la logique générale ait deux axiomatisations, cela en facilite beaucoup l’emploi par la théorie agrégative. En fait, comme les axiomes ou propriétés choisis reflètent la pratique immédiate de la déduction, sauf pour la compacité, qui est facultative, les démonstrations n’appellent de précautions particulières que lorsque cette dernière propriété entre en jeu ; il en va ainsi dans la démonstration du théorème canonique.
127 Suivant l’une ou l’autre liste prise comme critérium, les calculs propositionnels classiques tombent sous la logique générale. Les non-classiques, en revanche, doivent être examinés un à un : ceux qui relèvent de la logique déductive, par opposition à la logique inductive ou non-monotone, sont nombreux à remplir les exigences, mais la compacité manque à certains, en particulier dans la classe importante des logiques épistémiques [24].
128 Les calculs des prédicats classiques entrent dans la logique générale une fois qu’on met en relation leurs langages logiques avec ceux de calculs propositionnels introduits pour la circonstance. Dans leur cas, il faut en effet tenir compte de la spécificité morphologique des formules, construites à partir de symboles de prédicats et de quantificateurs, donc à première vue étrangères au cadre formel de la théorie. La méthode consiste à identifier un sous-ensemble pertinent de formules avec l’ensemble des variables propositionnelles P d’un langage L au sens de la section 3 : on vérifie qu’une fois restreinte à L, la relation d’inférence de ces calculs satisfait (E1)- (E6) [25].
129 Outre les notions d’inférence et d’incohérence, que nous emploierons simultanément par commodité, deux notions dérivées vont intervenir dans l’énoncé du théorème canonique. En premier lieu, un ensemble de formulesS ? L est dit minimalement incohérent s’il est incohérent et que tous ses sous-ensembles stricts sont cohérents : avec un calcul propositionnel classique, c’est le cas de
130 mais non pas de
131 En second lieu, on dit, pour ?, ? ? X, que ? s’infère conditionnellement de ? – ce qui se note ? ?* ? – s’il existe un ensemble de prémisses auxiliaires Y ? X tel que (i) Y ? { ? } ? ? et (ii) Y ? { ? } et Y ? { –| ? } soient cohérents (Y = ? est autorisé). L’inférence conditionnelle peut se reformuler comme une propriété d’ensembles minimalement incohérents, et c’est d’abord ainsi qu’elle a été comprise. En effet, sous la compacité (I5), l’inférence conditionnelle ? ?* ? équivaut à la propriété que ? ? –| ? et qu’il existe un Y ? ? Xminimalement incohérent avec ?, –| ? ? Y ? .
132 Il est utile d’enregistrer deux propriétés élémentaires de la relation ?*. D’une part, elle vérifie la contraposition, c’est-à-dire que ? ?* ? ? –| ? ?* –| ? ;d’autre part, ? ?/* –| ?. Pour clore les préparatifs, nous fixons un raccourci de notation. Il nous arrivera de transformer un ensemble Y ? X en un autreY ? qui remplace chaque formule d’un Z ? Y par sa négation ; l’ensemble transformé
133 s’écrira Y –|Z.
6. Le théorème d’impossibilité canonique
134 Outre le fait qu’ils restreignent la logique choisie, les Théorèmes 1 à 5 souffrent d’une certaine imprécision. Tels qu’ils sont formulés, ils se contentent d’énoncer des conditions suffisantes sur l’agenda pour qu’il n’existe pas de fonction de jugement collectif – au moins non-dégénérée – qui vérifie une ou plusieurs propriétés axiomatiques choisies. Ces hypothèses peuvent être trop fortes pour la conclusion obtenue, et si elles ne le sont pas, une démonstration supplémentaire de nécessité devrait l’établir. Sous l’influence de Nehring et Puppe [2002, 2010] et de Dokow et Holzman [2009, 2010a et b], la théorie de l’agrégation logique s’est imposé l’exigence de caractériser, au sens mathématique des conditions nécessaires et suffisantes, les agendas qui transforment une liste donnée d’axiomes en impossibilité d’un certain type. Si les résultats de ces auteurs méritent, selon nous, d’être appeléscanoniques, ce n’est pas tant pour leur généralité supérieure, car ils sont loin d’unifier la théorie entière, que parce qu’ils ont établi un standard pour les théorèmes qui est devenu maintenant le partage de tous. Nous suivrons l’analyse de Dokow et Holzman, plutôt que celle de Nehring et Puppe, parce qu’elle est la plus explicite des deux et qu’elle unifie un plus grand nombre de travaux existants. Nous ne la reproduirons pas telle quelle, mais plongée dans la logique générale, qui n’est pas le formalisme voulu par Dokow et Holzman ; la différence, qui n’est pas négligeable, sera expliquée à la fin de la section.
135 Dokow et Holzman ont posé et résolu le problème agrégatif suivant : comment caractériser les agendas X tels que, si l’on définit D par rapport à X, il n’existe pas de F : Dn ? D qui vérifie simultanément la non-dictature, l’indépendance et la préservation de l’unanimité ? La réponse à ce problème est le théorème canonique annoncé. Elle met en relief les conditions d’agenda suivantes :
136 (a) Il existe un ensemble minimal incohérent de formules Y ? X et un choix de Z ? Y tels que |Z| = 2 et Y –| Z soit cohérent [26].
137 (b) Pour tout couple de formules ?, ? ? X, il existe des formules ? 1,..., ?k ? X telles que
138 Théorème 6 (Dokow et Holzman [2010a] ; pour la suffisance, voir aussi Dietrich et List [2007b]. Sous les conditions (a) et (b), il n’existe pas deF : Dn ? D qui vérifie à la fois la non-dictature, la préservation de l’unanimité et l’indépendance. Pour un nombre d’individus n ? 3, (a) et (b) sont aussi nécessaires à cette conclusion.
139 Comme après le Théorème 1, nous réexaminerons Fmaj à partir de l’exemple de base. Désignons par (Inc) la propriété, manifestée par cet exemple, qu’un (A 1,..., An ) au moins rend Fmaj (A 1,..., An ) incohérent. Dans le cas où nest impair, le seul que nous considérerons, elle équivaut à ce que Fmaj ne soit pas Dn ? D, et comme cette fonction vérifie les deux axiomes, le Théorème 6 donne l’implication :
140 Vérifions-la sur l’agenda :
141 On s’assure de (a) en prenant
142 ou
143 ou d’autres choix encore, ce qui donne à penser que cette condition est facile à remplir malgré son écriture complexe. Quant à (b), elle est satisfaite aussi, comme on le voit sur la Figure 1, dans laquelle nous notonsq = d ? v ? r (les flèches indiquent les inférences conditionnelles et les formules en petits caractères sont des prémisses auxiliaires convenables pour ces inférences).
L’agenda X vérifie (b).
L’agenda X vérifie (b).
144 Nous venons d’illustrer (a) et (b) dans leur rôle de conditions suffisantesde l’impossibilité ; il reste à faire comprendre en quoi elles sont nécessaires.On sait par la section 2 que le choix de accompagne l’abandon du paradoxe doctrinal au profit du dilemme discursif et que l’on peut se refuser à cet abandon. La section 7 remplacera la biimplication classique par une biimplication non-classique dans la formule de la doctrine juridique, ce qui fera échouer la condition (b). A moindres frais, celle-ci peut être mise en défaut par une réinterprétation de la doctrine qui rejette la formule d ? v ? r de l’agenda vers la relation d’inférence. On formalise ainsi le cas, envisagé par Kornhauser et Sager, où le tribunal détermine sa décision à partir d’une doctrine commune qu’il n’a pas mise au vote. Soit, donc la relation d’inférence ? d ? v ? r définie par :
145 et l’agenda concordant :
146 En étudiant les inférences conditionnelles engendrées par ? d ?v?r , on trouve que vérifie (a), mais non pas (b), comme le fait voir la Figure 2.
L’agenda viole (b).
L’agenda viole (b).
X147 D’après le Théorème 6, quand l’agenda est il existe une F : Dn ? Dnon-dictatoriale, indépendante et qui préserve l’unanimité. Soit, par exemple, la fonction ainsi définie sur Dn : pour toute formule positive ? ? X, elle respecte l’unanimité en faveur de ? ou de –| ?, et elle tranche les divisions en sélectionnant toujours –| ?. La fonction va bien dans D : d’une part, elle modifie Fn maj , définie à la section 3, pour que les ensembles de jugement collectif soient complets, et d’autre part, avec l’agenda retenu, ces ensembles sont aussi cohérents [27]. L’exemple repose sur une dissymétrie des formules et de leurs négations qui peut refléter concrètement un privilège accordé au statu quo.
148 Les conditions nécessaires et suffisantes d’impossibilité qu’énonce le Théorème 6 se simplifient souvent lorsqu’on s’intéresse à une fonction de jugement collectif en particulier. Soit encore Fmaj ; nous savons que(a), (b) ? (Inc), mais ne peut-on améliorer l’implication dans le cas d’espèce ? De fait, la condition qui suit, plus faible que (b), est à elle seule nécessaire et suffisante à (Inc) :
149 (c) Il existe un ensemble minimal incohérent de formules Y ? X tel que|Y| ? 3.
150 Il est facile de prouver la suffisance en construisant un profil (A 1,..., An ) tel que Y ? Fmaj (A 1,..., An ). Quant à la nécessité, elle découle du Théorème 6 une fois montré que (b) implique (c). Cette dernière observation découle à son tour facilement. D’après (b), il existe pour tout ? ? X une chaîne d’inférences conditionnelles
151 En l’absence de (c), elle serait faite seulement d’inférences logiques : ce qui est impossible en logique générale, compte tenu de la transitivité de l’inférence.
152 La disparition de (a) et l’amenuisement de (b) en (c) que l’on constate surFmaj pourraient avoir partie liée avec deux propriétés saillantes de cette fonction que le Théorème 6 ne prend pas en compte, la monotonie et la systématicité. Le résultat qui suit, dans sa partie (iii), cautionne formellement la conjecture.
153 Théorème 6’. (i) Sous les conditions (a) et (c), il n’existe pas de F : Dn ? Dqui vérifie à la fois la non-dictature, la préservation de l’unanimité et la systématicité. Pour un nombre d’individus n ? 3, (a) et (c) sont aussi nécessaires à cette conclusion.
154 (ii) Sous la condition (b), il n’existe pas de F : Dn ? D qui vérifie à la fois la non-dictature, la préservation de l’unanimité et l’indépendance monotone, et (b) est aussi nécessaire à cette conclusion.
155 (iii) Sous la condition (c), il n’existe pas de F : Dn ? D qui vérifie à la fois la non-dictature, la préservation de l’unanimité, et la systématicité monotone. Pour un nombre d’individus n ? 3, (c) est aussi nécessaire à cette conclusion.
156 Chacun des trois énoncés a fait l’objet de démonstrations indépendantes, et en particulier, (ii) est la version du théorème canonique établie par Nehring et Puppe. Aujourd’hui, il vaut mieux appréhender (i), (ii) et (iii) en bloc, comme autant de résultats partiels tendant vers le Théorème 6. La comparaison permet de situer chaque fois la contrainte sur X qui équivaut à un axiome sur F : ainsi, l’arbitrage si caractéristique de la théorie nouvelle trouve son expression la plus rigoureuse.
157 Tous les résultats qui précèdent admettent des variantes fondées sur D *au lieu de D. Elles supposent d’introduire un nouvel affaiblissement de la dictature, qui est l’oligarchie, comprise dans un sens qui affaiblit également celui de la section 4. On dira que F est une oligarchie s’il existe un sous-ensemble non vide M ? { 1,..., n } tel que, pour tout (A 1,..., An ),
158 et pour F donnée, on nomme M, qui est nécessairement unique, l’ensemble des oligarques. D’après une observation de logique élémentaire que récupère la logique générale, l’intersection d’une famille d’ensembles cohérents et déductivement clos préserve ces deux propriétés ; il en résulte que, si Fest définie sur Dn ou (D *) n et qu’elle soit une oligarchie, elle va dans D *. Comme rien n’est stipulé pour trancher les désaccords entre les oligarques,F produira souvent des ensembles de jugement collectifs qui ne sont pas complets. Le phénomène s’illustre avec la règle à quota Fn maj , qui correspond au groupe maximal d’oligarques M = N.
159 Non-oligarchie. F n’est pas une oligarchie.
160 Théorèmes 7 et 7’. Les énoncés reproduisent ceux des Théorèmes 6 et 6’ en remplaçant F : Dn ? D par F : Dn ? D * ou par F : (D *) n ? D *, et la condition de non-dictature par celle de non-oligarchie.
161 Ces différentes extensions peuvent se lire chez Dietrich et List [2008] et Dokow et Holzman [2010b] [28].
162 L’ensemble de la section appellerait une comparaison détaillée avec les résultats de dictature et d’oligarchie que la théorie du choix social démontre. Nous nous contenterons ici d’une indication globale, précisée à l’aide d’un exemple remarquable. De chaque théorème d’agrégation logique, on peut déduire un théorème de choix social par la transformation suivante : on spécifie le langage logique L de manière que les ensembles de jugement expriment des relations de préférence, et l’on spécifie la relation d’inférence? de manière que les ensembles de jugement respectent les propriétés voulues pour ces relations. Cette méthode réalise l’objectif, prévu à la section 1, d’englober la théorie du choix social dans celle de l’agrégation logique : la préférence est un cas particulier de jugement, et la logique qui lui correspond un cas particulier de la logique générale.
163 C’est ainsi que Dietrich et List [2007b] dérivent du Théorème 6 une première version du théorème d’Arrow, dans laquelle ne figurent que des préférences strictes. Ils prennent comme langage logique L?, un calcul des prédicats construit sur des formules élémentaires x ? y, interprétables comme « x est strictement préféré à y », et ils définissent une relation d’inférence ?? qui incorpore trois axiomes de la préférence formulés dans L? (de même que, précédemment, la relation d’inférence ? d ? v ? r incorporait un axiome pour la doctrine juridique). Nouveaux par rapport à ceux d’un calcul des prédicats ordinaire, ces axiomes correspondent aux trois propriétés d’asymétrie, de transitivité et de totalité que Dietrich et List retiennent pour la préférence dans leur variante spéciale. Une fois défini un agendaX ? ? L? adapté à cette variante, ils associent une fonction de jugement collectif F à la fonction de bien-être social donnée et montrent que les hypothèses faites sur l’une se transposent en hypothèses vérifiées par l’autre. Comme on peut s’y attendre, l’indépendance des options non pertinentes devient l’indépendance, et la condition faible de Pareto devient lapréservation de l’unanimité. Il reste à vérifier que X ? satisfait les conditions (a) et (b). Alors, le théorème canonique, appliqué dans sa partie de suffisance, implique la variante arrovienne désirée.
164 Pour obtenir le théorème d’Arrow dans son intégralité, c’est-à-dire avec des préférences faibles, Dokow et Holzman [2010b] font un détour par le Théorème 7, qui ne semblait pas destiné à ce but [29]. Le même théorème, en revanche, implique assez directement celui de Gibbard [1969] sur les oligarchies. Le champ des applications au choix social vient à peine d’être ouvert. Jusqu’à présent, les Théorèmes 6 et 7 ont surtout servi en prenant (a) et (b) comme conditions suffisantes et pour retrouver des résultats, comme ceux d’Arrow ou de Gibbard, qui portent sur des domaines non restreints d’options et de préférences. Si l’on considère maintenant les domaines restreints, tels que décrits, par exemple, chez Le Breton et Weymark [2003], on devine que les relations s’établiront plus facilement avec le groupe qui relève de la « politique » qu’avec celui qui relève de l’« économie ». En effet, les domaines du dernier groupe reposent sur des structures mathématiques riches, comme celle d’espace euclidien, qui ne s’expriment pas facilement dans les calculs logiques ordinaires.
165 Nous avons énoncé les résultats de cette section dans la logique générale, ce qui leur donne la plus grande applicabilité possible, mais cette présentation ne reflète pas le processus historique de la découverte, qui a transité par des hypothèses techniques diverses, toutes plus restrictives que les nôtres. Dokow et Holzman, pour leur part, utilisent le formalisme dit de l’agrégation abstraite, qu’on peut faire remonter à Fishburn et Rubinstein [1986], Wilson [1975] et même Guilbaud [1952]. Partant d’un nombre fini kde propositions qui correspondent aux formules positives de nos agendas, les deux auteurs décrivent les jugements individuels et collectifs sur ces propositions par les valeurs 0 ou 1 qui leur sont attribuées. Après avoir fixé un ordre quelconque sur les propositions, ils ramènent le problème agrégatif à l’étude des sous-ensembles de { 0, 1 } k et des fonctions définies à partir de ces sous-ensembles. Plus précisément, si E ? { 0, 1 } k représente l’ensemble des ensembles de jugement autorisés, G : E n ? E représente une fonction de jugement collectif, analogue de notre F : Dn ? D. Les conditions définies sur F, à commencer par l’indépendance et la préservation de l’unanimité, s’énoncent facilement sur G.
166 Une présentation aussi ramassée du problème agrégatif débouche sur des démonstrations rapides et élégantes, comme il s’en trouve déjà chez les prédécesseurs de Dokow et Holzman, mais elle tend à effacer le caractèrelogique et linguistique de ce problème et certaines distinctions qui l’accompagnent naturellement. L’étape de définition de l’agenda est absorbée par celle, normalement ultérieure, de la définition des ensembles de jugement autorisés. Or le même E peut correspondre à des agendas très différents. Voici un exemple représentatif : soit k = 2 et l’ensembleE = { (1, 1), (0, 1), (0, 0) } ; en logique propositionnelle classique, il lui correspond au moins deux agendas, X = { a, a ? b }± et X ? = { a ? b, a ? b }±, qu’il serait conceptuellement abusif d’identifier [30]. Une autre distinction importante, celle des ensembles de jugement de D et D *, devient lourde à traduire dans le cadre de l’agrégation abstraite. A titre d’objection secondaire, l’hypothèse d’un nombre fini k de propositions empêche de localiser le besoin de finitude là où il se manifeste dans les démonstrations. Grâce au recours modulable à la compacité, la logique générale marque ici un avantage technique, payé d’une certaine lourdeur de maniement.
167 Le formalisme ensembliste de Dokow et Holzman ne se confond pas avec les présentations, également différentes de la nôtre, qui optent pour la logique en accentuant la sémantique par rapport à la syntaxe. Lorsque, par exemple, Pauly et van Hees [2006] se servent de valuations booléennes, plutôt que d’ensembles de formules, pour représenter les jugements d’un individu ou de la collectivité, ils font un simple choix technique à l’intérieur du cadre offert par les calculs propositionnels classiques. La théorie se prête au travail du logicien et, d’ailleurs, de l’informaticien de bien des manières encore, que nous ne pouvons malheureusement développer ici [31].
168 Le dilemme discursif a guidé les développements techniques des sections qui se sont succédé jusqu’à celle-ci. Le théorème canonique et ses variantes représentent l’approfondissement ultime de ce problème : dès la section 4, il était apparu qu’il était un trilemme, avec la condition d’indépendance comme branche supplémentaire, et il apparaît maintenant qu’il est un quadrilemme, avec la définition de l’agenda comme dernière branche, puisqu’il se résout tout aussi bien par la violation des conditions (a) ou (b). Comme nous faisons une distinction tranchée entre le dilemme discursif et le paradoxe doctrinal, il reste à voir si les résultats obtenus pour le premier s’étendent au second.
7. Retour au paradoxe doctrinal
169 Le paradoxe doctrinal se distingue du dilemme discursif, en premier lieu, parce qu’il suppose une distinction que celui-ci efface entre les prémisses et les conclusions de la décision collective, en second lieu, parce qu’il met au centre la doctrine juridique dont celui-ci néglige la spécificité conceptuelle. Nous réexaminerons les deux aspects tour à tour et montrerons – c’est lebut dernier de l’article – qu’il est possible de rendre justice au paradoxe doctrinal grâce à la théorie des sections précédentes, à condition de lui faire accomplir un pas de généralité supplémentaire.
170 Dans une théorie axiomatisée comme celle de l’agrégation logique, la distinction des prémisses et des conclusions ne peut évidemment se manifester que si un axiome au moins la prend en charge. A contrario, supposons que toute condition qu’on voudrait imposer à F s’applique identiquement aux deux groupes de formules. Alors, puisque la théorie n’a pas les moyens expressifs de les séparer, il faut opter soit contre elle, soit contre la distinction recherchée. L’opposition latente entre Kornhauser et Sager, d’une part, List et Pettit, de l’autre, pourrait bien refléter cette alternative. Nous y échappons en sélectionnant un axiome qui portera la distinction à exprimer. Le théorème canonique, dont, pour des raisons de méthode, nous voudrions nous éloigner le moins possible, laisse le choix entre l’indépendance et de la préservation de l’unanimité, la non-dictature ne lui servant qu’à énoncer l’impossibilité. Soit P et C les sous-ensembles de X qui représentent les prémisses et les conclusions ; nous supposerons pour simplifier qu’ils forment une partition exacte de X. Parmi les différentes combinaisons axiomatiques, nous retenons celle qui fait porter, sur P, l’indépendance et la préservation de l’unanimité, et sur C, la préservation de l’unanimité seulement ; c’est donc l’indépendance qui joue le rôle discriminant.
171 Le dispositif choisi détermine mieux la méthode des prémisses que celle des conclusions, et nous justifions cette dissymétrie par la théorie judiciaire elle-même. Chez Kornhauser et Sager [1993], les décisions sur les aspects se prennent à la suite d’un vote majoritaire sur chacun d’entre eux, et nous ne faisons qu’étendre leur idée en imposant à P les deux conditions fondamentales que satisfait cette procédure. En revanche, si nous lisons bien les mêmes auteurs, une décision sur l’affaire peut se prendre autrement que par un vote formel, qu’il soit à la majorité simple ou autrement, et c’est par une simple facilité d’exposition que, dans l’exemple de base, ils font voter les juges sur l’affaire aussi. Le respect du consensus est la seule norme que la procédure doive alors garantir, ce que notre unique condition posée sur Cvient retraduire. Il s’ajoute une raison de sous-déterminer la méthode des conclusions si, dans la partition de X, on choisit de rattacher la doctrine juridique à C plutôt qu’à P : car il n’y a pas de doute que Kornhauser et Sager, au contraire de Pettit dans sa reconstruction, ne soumettent pas toujours la doctrine juridique au vote formel des juges. L’accord résulte, ici encore, d’une procédure qui n’est pas entièrement décrite et dont on peut seulement affirmer qu’elle respecte la préservation de l’unanimité.
172 Le Théorème 8 montre que, sous des conditions d’agenda proches de celles du théorème canonique, l’ensemble des conditions proposées sur F la font basculer dans la dictature. Le Théorème 9 énonce le résultat oligarchique correspondant, et des variantes que nous n’exposons pas ici reproduisent les deux conclusions en renforçant l’indépendance (par la systématicité, l’indépendance monotone ou la systématicité monotone). L’analyse, due à Dietrich et Mongin [2010], retrouve la conclusion du théorème canonique en partant d’hypothèses plus faibles, puisqu’elle ne requiert l’indépendance ou les conditions apparentées que sur la partie P de l’agenda. Au plan conceptuel, elle met à l’épreuve le paradoxe doctrinal, quien ressort consolidé : il n’est pas besoin du vote majoritaire pour que la méthode des prémisses et celle des conclusions s’opposent, il suffit d’énoncer quelques-unes des conditions que les deux méthodes vérifient.
173 Définissons P = { p, –| p, q, –| q, ... } ? X comme un sous-ensemble non vide de X qui est fermé par négation, et posons C = X P. Les nouveaux axiomes sur F s’obtiennent par restriction de ceux du théorème canonique à l’un des deux éléments de la partition.
174 Systématicité (Indépendance) sur les prémisses : seulement pour toute paire de formules p, q ? P (toute formule p ? P).
175 Préservation de l’unanimité sur les prémisses (sur les conclusions) : seulement pour toute formule p ? P (toute formule p ? C).
176 Non-dictature sur les prémisses : il n’existe pas de i ? { 1,..., n } tel queF (A 1,..., An ) ? P = Ai ? P pour tout (A 1,..., An ) ? Dn .
177 Non-oligarchie sur les prémisses : il n’existe pas de sous-ensemble non vide M ? { 1,..., n } tel que F (A 1,..., An ) ? P = (? j ? M Aj ) ? P pour tout (A 1,..., An ) ? Dn .
178 De nouvelles conditions d’agenda tiennent compte de la partition de X :
179 (a P ) Il existe un ensemble minimal incohérent de formules Y ? X et un choix de Z ? Y ? P tels que |Z| = 2 et Y –| Z soit cohérent.
180 (b P ) Pour tout couple de formules p, q ? P , il existe des formules p 1,..., pk ? P telles que
181 Par définition de p ?* q, Y ? { p } ?* q pour un choix de Y ? X ; ainsi, les formules de P peuvent être logiquement liées par des formules de C.
182 (c P ) Il existe un ensemble minimal incohérent de formules Y ? X tel que|Y ? P| ? 3.
183 Théorème 8. Sous les conditions (a P ) et (b P ), il n’existe pas de F : Dn ? Dqui vérifie à la fois :
184 • sur les prémisses, la non-dictature, l’indépendance et la préservation de l’unanimité,
185 • sur les conclusions, la préservation de l’unanimité.
186 Pour un nombre d’individus n ? 3, (a P ) et (b P ) sont aussi nécessaires à cette conclusion.
187 Théorème 9. L’énoncé reproduit celui du Théorème 8, avec F : Dn ? D * au lieu de F : Dn ? D, et la non-oligarchie sur les prémisses au lieu de la non-dictature.
188 Comme le sous-ensemble P est quelconque, il est permis de le faire varier librement, et l’on obtient les Théorèmes 6 et 7 en posant P = X. Ainsi, le théorème canonique et sa version oligarchique sont englobés. De même, les Théorèmes 6’ et 7’ sont des cas particuliers de ceux que nous n’énonçons pas. La caractérisation d’agenda propre à Fmaj se retrouve aussi englobée. On vérifie en effet que (b P ) implique (c P ) et que cette dernière condition est nécessaire et suffisante pour qu’il existe un Fmaj (A 1,..., An ) ? P incohérent.
189 Si l’on renforce la définition des prémisses, on renforce du même coup les résultats. Il serait conforme à la notion ordinaire que les formules de P aient une liaison logique avec celles de C, et plus précisément, qu’elles donnent le moyen d’axiomatiser chaque ensemble de jugement B ? D. On envisagera donc la condition :
190 (d P ) Pour tout B ? D.
191 Avec l’adjonction de (d P ), on conclut du Théorème 8 à la dictature, et non plus seulement à la dictature sur les prémisses. Ce corollaire permet de retrouver le Théorème 4 si l’on spécialise la logique générale sous la forme d’un calcul propositionnel classique. On se rappelle que ce résultat limite l’indépendance à PVX ? X et que la section 4 n’énonçait pas toutes les conditions qu’il demande sur X : il se trouve qu’elles coïncident avec (a P ), (b P ) et (d P ) dans le cas où P = PVX . La généralité de l’analyse se vérifie de cette manière aussi.
192 Les deux conditions fondamentales (a P ) et (b P ) peuvent s’illustrer par de nouvelles variantes de l’exemple de base. Soit l’agenda , qui inclut la formule q = d ? v ? r pour la doctrine juridique. Si, comme il est envisageable, on pose P = { v, r }±, alors (b P ) est violée, et la décision judiciaire échappe à l’impossibilité, au contraire de ce que prédisait le théorème canonique (voir Figure 3). Comme (c P ) est aussi violée, Fmaj n’a plus d’inconvénient, du moins si n est impair.
L’agenda avec P = {v, r}± viole (b P ).
L’agenda avec P = {v, r}± viole (b P ).
X193 En revanche, si l’on prend P = { v, r, q }±, en traitant donc la doctrine comme une prémisse supplémentaire, ce qui est un choix naturel, alors (b P ) est satisfaite (voir Figure 4).
194 On constate de même que (a P ) est vérifiée. Ainsi, pour cet ensemble de prémisses, différent de l’ensemble P = X supposé dans le théorème canonique, la décision judiciaire retombe dans l’impossibilité prédite par ce théorème.
195 Soit maintenant l’autre agenda considéré, qui s’étudie avec la relation d’inférence ? q définie à la section précédente. Si l’on prendP = { v, r }±, comme il semble aller de soi, (b P ) est violée, car aucune inférence conditionnelle n’atteint jamais une formule positive (voir Figure 5).
L’agenda avec P = {v, r}± viole (b P ).
L’agenda avec P = {v, r}± viole (b P ).
X196 Même (c P ) est violée, de sorte que Fmaj peut être à nouveau convoquée. De fait, cette résolution illustre l’application exclusive de la méthode des prémisses, qui est la voie de sortie la plus courante du paradoxe doctrinal [32].
197 Les agendas qui précèdent illustrent mathématiquement le Théorème 8, mais leur pertinence est à débattre : ils représentent la doctrine juridique à la manière du dilemme discursif, et la fin de la section 2 a soulevé au moins deux objections contre cette manière. Suivant la première, notée (i), il ne va pas de soi que la doctrine se représente par une formule de la logique ordinaire. Nous renforcerons la critique en montrant que, dans la formulation de la doctrine par équivalence, la biimplication booléenne ? a des effets indésirables que l’opérateur non-booléen ? ? des logiques conditionnelles évite. L’argumentation s’inspire de celle que Dietrich (2010) déploie en leur faveur plus généralement [33].
198 L’agenda engendre la liste suivante de sous-ensembles minimalement incohérents :
199 A considérer Y 5, Y 6, Y 7, on voit que la formule –| q = –| (d ? v ? r) a des propriétés contre-intuitives. En effet, un juge pour lequel les deux clauses mentionnées, la validité du contrat et sa rupture, ne sont pas équivalentes à l’attribution de dommages-intérêts, ne devrait pas pour autant se voir interdire l’une de ces possibilités :
- il accepte la validité du contrat, sa rupture et les dommages-intérêts (c’est qu’il a en vue une troisième condition d’aspect, non mentionnée ici, et qu’il la tient pour satisfaite),
- il refuse la validité du contrat et les dommages-intérêts (c’est qu’il conditionne l’attribution des dommages-intérêts à l’absence de validité seulement),
- il constate l’absence de rupture et n’accorde pas les dommages-intérêts (même raisonnement avec l’absence de rupture).
201 Pour le dire autrement, le théorème de logique propositionnelle classique contredit les intuitions normales sur la délibération judiciaire. On s’attendrait que le refus de la doctrine juridique n’entraîne pour le juge aucune conséquence déterminée, mais ce n’est pas le cas. Il n’y a rien à redire, en revanche, aux ensembles Y 1 à Y 4 ou aux théorèmes correspondants :
202 On s’attend certainement que l’acceptation de la doctrine, par opposition à son refus, ait des conséquences, et celles-là mêmes qui sont indiquées.
203 Les logiques conditionnelles axiomatisent l’implication, ?, et donc la biimplication, ? ?, d’une manière qui répond exactement aux desiderata : elles donnent lieu à une liste d’ensembles minimalement incohérents réduite à Y 1 à Y 4, ou de manière équivalente, aux théorèmes (**) à l’exclusion de (*). C’est pourquoi elles nous semblent préférables aux logiques propositionnelles classiques si l’on veut approfondir la nature du paradoxedoctrinal. Au niveau de la logique générale, il n’est pas nécessaire de trancher entre les systèmes concurrents, car n’importe lequel remplit les besoins [34].
204 Il y aurait donc lieu de remplacer par avecq? = d? ?v ? r. Comme cet agenda est nouveau, il demande à être confronté au théorème canonique. Il apparaît que vérifie encore (a), mais non (b), de sorte que la conclusion négative obtenue pou à la section précédente ne vaut plus maintenant. Il est instructif de comparer la Figure 1 à la Figure 6 :
L’agenda viole (b).
L’agenda viole (b).
X?205 La question se pose ensuite de savoir comment les théorèmes de cette section s’appliquent à . Nous laissons le lecteur constater que (b P ) n’est satisfaite pour aucun des choix de P que nous avons envisagés. La conclusion négative est de nouveau battue en brèche.
206 Qu’en est-il maintenant de l’agenda lorsque la formule placée dans la règle d’inférence est non-classique ? La nouvelle règle ? q ? se définit par :
207 et elle conduit aux mêmes violations de (b) et de (b P ) que ? q précédemment. En effet, avec ces deux règles, seule l’acceptation de la doctrine modifie le jeu normal de l’inférence, et dans ce cas, l’équivalence classique et l’équivalence non-classique reviennent au même. Pour le dire autrement, avec ? q ? , les sous-ensembles minimalement incohérents sont les mêmes qu’avec ? , au remplacement près de q par q? . q
208 En résumé, quand la doctrine juridique est interne à l’agenda, l’abandon de la logique classique ouvre des possibilités supplémentaires, mais elle n’apporte rien de plus quand la doctrine est externe. Y a-t-il moyen de trancher entre les représentations interne et externe, comme nous venons de le faire entre les logiques classique et non-classique ? Nous ne le croyons pas. Le dilemme discursif impose automatiquement la représentationinterne, et la deuxième objection de la section 2, notée (ii), rejette l’automatisme de cet enchaînement, sans imposer l’automatisme inverse de la représentation externe. Kornhauser et Sager et leurs successeurs ne veulent pas exclure que les juges doivent voter sur la doctrine, même s’il s’avère qu’ils ne le font pas couramment. Ainsi, notre conclusion dernière se fait prudente : la modélisation préférable est avec pour règle ? q ou ? q ? , puisque cela ne fait pas de différence pratique, mais conviendra tout de même dans certaines circonstances. Le seul agenda que nous excluons est celui du dilemme discursif de List et Pettit. L’analyse de l’exemple brillamment inventé par Kornhauser et Sager s’achève ainsi, et de même la réhabilitation de leur paradoxe doctrinal, qui a guidé notre long parcours à travers la théorie de l’agrégation logique.
Références bibliographiques
- ARROW K.J. [1951], Social Choice and Individual Values, New York, Cowles Foundation and Wiley, 2nd ed., 1963.
- D’ASPREMONT C. [1985], Axioms for Social Welfare Orderings, dans Social Goals and Social Organization, publié par Hurwicz, L., Schmeidler, D., Sonnenschein. H., Cambridge, Cambridge University Press.
- BARWISE J. [1977], An Introduction to First-Order Logic, dans Handbook of Mathematical Logic, publié par Barwise, J., Amsterdam. North Holland.
- CARIANI F., PAULY M., SNYDER J. [2008], Decision Framing in Judgment Aggregation, Synthese, 163, 1-24.
- CHANG C.C., KEISLER H.J. [1973], Model Theory, Amsterdam, Elsevier.
- CHAPMAN B. [2002], Rational Aggregation, Politics, Philosophy and Economics, 1, 337-354.
- CONDORCET (Nicolas de Caritat, Marquis de) [1785], Essai sur l’application de l’analyse à la probabilité des décisions rendues à la pluralité des voix, Paris Imprimerie Royale. Repris dans les Œuvres, publiées par Condorcet-O’Connor, A., Arago, M.F., Paris, Firmin Didot, 1847-1849. Sur le site des bibliothèques canadiennes : http://www.archive.org/details/essaisurlapplica00cond
- DIETRICH F. [2006], Judgment Aggregation : (Im) Possibility Theorems, Journal of Economic Theory, 126, 286-298.
- DIETRICH F. [2007a], A Generalized Model of Judgment Aggregation, Social Choice and Welfare, 28, 529-565.
- DIETRICH F. [2007b], Aggregation and the Relevance of Some Issues for Others, Research Memoranda 002, METEOR, Maastricht Research School of Economics of Technology and Organization.
- DIETRICH F. [2010], The Possibility of Judgment Aggregation on Agendas with Subjunctive Implications, Journal of Economic Theory, 145, Symposium on Judgment Aggregation, 603-638.
- DIETRICH F., LIST C. [2007a], Judgment Aggregation by Quota Rules : Majority Voting Generalized, Journal of Theoretical Politics, 19, 391-424.
- DIETRICH F., LIST C. [2007b], Arrow’s Theorem in Judgment Aggregation, Social Choice and Welfare, 29, 19-33.
- DIETRICH F., LIST C. [2008], Judgment Aggregation Without Full Rationality, Social Choice and Welfare, 31, 15-39.
- DIETRICH F. and LIST C. [2010], Majority Voting on Restricted Domains, Journal of Economic Theory, 145, Symposium on Judgment Aggregation, 512-543.
- DIETRICH F., MONGIN P. [2007] The Premiss-Based Approach to Logical Aggregation, CR 886/2008, Groupe HEC, Paris.
- DIETRICH F., MONGIN P. [2010], The Premiss-Based Approach to Judgment Aggregation, Journal of Economic Theory, 145, Symposium on Judgment Aggregation, 562-582.
- DOKOW E., HOLZMAN R. [2009], Aggregation of Binary Evaluations for Truth-functional Agendas, Social Choice and Welfare, 32, 221-241.
- DOKOW E., HOLZMAN R. [2010a], Aggregation of Binary Evaluations, Journal of Economic Theory, Symposium on Judgment Aggregation, 145, 495-511.
- DOKOW E., HOLZMAN R. [2010b], Aggregation of Binary Evaluations with Abstentions, Journal of Economic Theory, Symposium on Judgment Aggregation, 544- 561.
- DUDDY C., PIGGINS A. [2009], Many-valued Judgment Aggregation : Characterizing the Possibility/impossibility Boundary for an Important Class of Agendas, Working Paper, J.E. Cairnes School of Business and Economics, University of Galway.
- ECKERT D., MONJARDET B. [2009], Guilbaud’s Theorem : An Early Contribution to Judgment Aggregation, Document de travail 2009.47, Centre d’Economie de la Sorbonne, Paris.
- FISHBURN P.C., RUBINSTEIN A. [1986], Algebraic Aggregation Theory, Journal of Economic Theory, 38, 63-77.
- FLEURBAEY M., MONGIN P. [2005], The News of the Death of Welfare Economics is Greatly Exaggerated, Social Choice and Welfare, 25, 381-418.
- FREGE G. [1918-1919-1923], Logische Untersuchungen, Beiträge zur Philosophie der deutschen Idealismus, Hefte I/2, II/3-4, III/1. Trad. fr. : Recherches logiques, dansEcrits logiques et philosophiques, Paris, Le Seuil, 170-234.
- GÄRDENFORS P. [2006], An Arrow-like Theorem for Voting with Logical Consequences, Economics and Philosophy, 22, 181-190.
- GENEST C., ZIDEK J.V. [1986], Combining Probability Distributions : a Critique and an Annotated Bibliography, Statistical Science, 1, 114-148.
- GIBBARD A. [1969], Social Choice and the Arrow Conditions, Working Paper, Department of Philosophy, University of Michigan.
- GRANGER G.G. [1956], La mathématique sociale du marquis de Condorcet, Paris, Presses Universitaires de France (2e éd., Paris, Odile Jacob, 1989).
- GUILBAUD G.T. [1952], Les théories de l’intérêt général et le problème logique de l’agrégation, Economie appliquée, 5, 501-551.
- HEIFETZ A., MONGIN P. [2001], Probability Logic for Type Spaces, Games and Economic Behavior, 35, 31-53.
- HERZBERG F.S. [2010], Judgment Aggregators and Boolean Algebra Homomorphisms, Journal of Mathematical Economics, 2010, 46, 132-140.
- HERZBERG F.S., ECKERT D. [2010], Impossibility Results for Infinite-electorate Abstract Aggregation Rules, IMW Working Paper 427, Universität Bielefeld.
- KANT E. [1800], Logik, ein Handbuch für Vorlesungen, herausgegeben by Jäsche, G.B., Königsberg. Trad. fr. : Logique, Paris, Vrin, 1970.
- KIRMAN A.P., SONDERMANN D. [1972], Arrow’s Theorem, Many agents, and Invisible Dictators, Journal of Economic Theory, 267-277.
- KONIECZNY S., PINO-PEREZ R. [2002], Merging Information Under Constraints : a Logical Framework, Journal of Logic and Computation, 12, 773-808.
- KORNHAUSER L.A. [1992], Modelling Collegial Courts II : Legal Doctrine, Journal of Law, Economics and Organization, 8, 441-470.
- KORNHAUSER L.A., SAGER L.G. [1986], Unpacking the Court, The Yale Law Journal, 96, 82-117.
- KORNHAUSER L.A., SAGER L.G. [1993], The One and the Many : Adjudication in Collegial Courts, California Law Review, 81, 1-59.
- KORNHAUSER L.A., SAGER L.G. [2004], The Many as One : Integrity and Group Choice in Paradoxical Cases, Philosophy and Public Affairs, 32, 249-276.
- LE BRETON M., WEYMARK J. [2003], Arrovian Social Choice Theory on Economic Domains, Working Paper, GREMAQ, Toulouse, et Dept of Economics, Vanderbuilt University.
- LEHRER K., WAGNER C. [1981], Rational Consensus in Science and Society, Dordrecht, Reidel.
- LEWIS D. (1973), Counterfactuals, Oxford, Blackwell.
- LISMONT L., MONGIN P. [2003], Strong Completeness for Weak Logics of Common Belief, Journal of Philosophical Logic, 32, 115-137.
- LIST C. [2003], A Possibility Theorem on Aggregation over Multiple Interconnected Propositions, Mathematical Social Sciences, 45, 1-13. (Corrigendum in Mathematical Social Sciences 52, 109-110.)
- LIST C. [2004], A Model of Path-Dependence in Decisions Over Multiple Propositions, American Political Science Review, 98, 495-513.
- LIST C., PETTIT P. [2002], Aggregating Sets of Judgments : An Impossibility Result,Economics and Philosophy, 18, 89-110.
- LIST C., PETIT P. [2005], On the Many as One : A Reply to Kornhauser and Sager,Philosophy and Public Affairs, 33, 377-390.
- LIST C., PUPPE C. [2009], Judgment Aggregation : A Survey, dans Oxford Handbook of Rational and Social Choice, publié par Anand, P., Puppe, C., Pattanaik, P., Oxford, Oxford University Press.
- MCCONWAY K.J. [1981], Marginalization and Linear Opinion Pools, Journal of the American Statistical Association, 76, 410-414.
- MILLER M.K., OSHERSON D. [2009], Methods for Distance-Based Judgment Aggregation, Social Choice and Welfare, 32, 575-601.
- MONGIN P. [1995], Consistent Bayesian aggregation, Journal of Economic Theory, 66, 313-351.
- MONGIN P. [1997], Spurious Unanimity and the Pareto Principle, Document de travail, THEMA, Université de Cergy-Pontoise.
- MONGIN P. [2003], L’axiomatisation et les théories économiques, Revue économique, 54, 99-138.
- MONGIN P. [2008], Factoring Out the Impossibility of Logical Aggregation, Journal of Economic Theory, 141, 100-113.
- MONJARDET B. [2003], De Condorcet à Arrow via Guilbaud, Nakamura et les « jeux simples », Mathématiques et sciences humaines / Mathematics and Social Sciences, n° 163, 5-32.
- NASH J.R. [2003], A Context-Sensitive Voting Protocol Paradigm for Multimembers Courts, Stanford Law Review, 56, 75-159.
- NEHRING K. [2003], Arrow’s Theorem as a Corollary, Economics Letters, 80, 379- 382.
- NEHRING K. [2005], The (Im) Possibility of a Paretian Rational, Working Paper, Department of Economics, University of California, Davis.
- NEHRING K., PUPPE C. [2002], Strategy-Proof Social Choice on Single-Peaked Domains : Possibility, Impossibility and the Space Between, Working Paper, Department of Economics, University of California, Davies.
- NEHRING K., PUPPE C. [2008], Consistent Judgement Aggregation : The Truth-Functional Case, Social Choice and Welfare, 31, 41-57.
- NEHRING K., PUPPE C. [2010], Abstract Arrowian Aggregation, Journal of Economic Theory, 145, Symposium on Judgment Aggregation, 467-494.
- NEHRING K., PUPPE C. [2010b], Justifiable Group Choice, Journal of Economic Theory, 145, Symposium on Judgment Aggregation, 583-602.
- NUTE D., CROSS C.B. [2001], Conditional Logic, dans Handbook of Philosophical Logic, publié par Gabbay, D., Guenthner, F., Dordrecht, Kluwer, t. 4, 1-98.
- PAULY M. [2007], Axiomatizing Collective Judgment Sets in a Minimal Logical Language, Synthese, 158, 233-250.
- PAULY M. [2008], On the Role of Language in Social Choice Theory, Synthese, 163, 227-243.
- PAULY M., VAN HEES M. [2006], Logical Constraints on Judgment Aggregation,Journal of Philosophical Logic, 35, 569-585.
- PETTIT P. [2001], Deliberative Democracy and the Discursive Dilemma, Philosophical Issues, 11, 268-299.
- PIGOZZI G. [2006], Belief Merging and the Discursive Dilemma : An Argument based Account to Paradoxes of Judgment Aggregation, Synthese, 152, 285-298.
- PRIEST G. [2002], Paraconsistent Logic, dans Handbook of Philosophical Logic, publié par Gabbay, D., Guenthner, F., Dordrecht, Kluwer Academic Publishers, t. 6, 287-393.
- RASHED R. [1974], Condorcet, Mathématique et société, Choix de textes et commentaires, Paris, Hermann.
- SEN A. [1970], Collective Choice and Social Welfare, Amsterdam, North Holland.
- STALNAKER R. [1968], A Theory of Conditionals, dans Studies in Logical Theory, American Philosophical Quarterly Monograph Series, 2, 98-112.
- VAN HEES M. [2007], The Limits of Epistemic Democracy, Social Choice and Welfare, 28, 649-666.
- WILSON R. [1975], On the Theory of Aggregation, Journal of Economic Theory, 10, 89-99.
Mots-clés éditeurs : agrégation des jugements, agrégation logique, dile, paradoxe doctrinal
Date de mise en ligne : 08/04/2011
https://doi.org/10.3917/redp.206.0929Notes
-
[*]
Cet article développe la présentation de la théorie de l’agrégation logique faite par Mikaël Cozic et les deux auteurs au colloque « New Developments in Social Choice and Welfare Theories. A Tribute to Maurice Salles » (Caen. 10-12 Juin 2009). Il reprend aussi les présentations faites par le premier auteur au « Workshop on Judgment Aggregation » (Barcelone, 14-16 décembre 2009) et au colloque LOFT 2010 (Toulouse, 5-7 juillet 2010). L’article incorpore les observations pertinentes et constructives que deux rapporteurs ont faites sur la version antérieure ; qu’ils soient ici chaleureusement remerciés.
-
[**]
Adresse : GREGHEC, 1 rue de la Libération, 78350 Jouy-en-Josas, FR. Courriel : mongin@greg-hec.com Centre National de la Recherche Scientifique & Groupe HEC
-
[***]
Adresse : Dept of Philosophy, Logic and Scientific Method, Houghton Street, London WC2A 2AE, GB. Courriel : f.dietrich@lse.ac.uk London School of Economics
-
[1]
La théorie de l’agrégation des probabilités remonte aux années 1960 avec des travaux de Stone, Raiffa et Winkler. Les principaux résultats ont été acquis rapidement, de sorte que la synthèse de Genest et Zidekh [1986] reste d’actualité. Chez McConway [1981], la théorie reproduit le modèle axiomatique de celle du choix social, tandis que, chez Lehrer et Wagner [1981], elle revêt la forme d’une théorie du consensus applicable à l’activité scientifique.
-
[2]
Monjardet [2003] isolait chez Guilbaud un théorème et sa démonstration relevant du choix social arrovien. Eckert et Monjardet [2009] lui attribuent un théorème et une démonstration qui relèvent de l’agrégation logique, et cette lecture est plus fidèle que la précédente à l’inspiration que Guilbaud trouvait chez Condorcet. Sur le plan strictement technique, on peut apercevoir chez Guilbaud le premier usage démonstratif des filtres et des ultrafiltres, dont les notions venaient d’entrer dans les mathématiques de l’époque. Depuis Kirman et Sondermann [1972] la théorie de choix social et, désormais, celle de l’agrégation logique empruntent couramment ce procédé.
-
[3]
Outre Guilbaud, Granger [1956] et Rashed [1974] ont participé à la redécouverte de la mathématique sociale du Condorcet, mais leur interprétation du paradoxe du vote reste cependant marquée par la lecture arrovienne. Le théorème du jury fait aujourd’hui l’objet d’une vaste littérature spécialisée qui recoupe parfois celle de l’agrégation logique, mais que nous devons malheureusement laisser de côté ici.
-
[4]
Le paradoxe doctrinal est mentionné pour la première fois chez Kornhauser [1992]. Les bibliographies citent abusivement Kornhauser et Sager [1986], qui mettaient en évidence des problèmes agrégatifs distincts du paradoxe.
-
[5]
En droit anglo-américain, les textes normatifs jouent un rôle presque exclusif en matière pénale, mais la jurisprudence compte beaucoup à côté des premiers en matière civile. Les sources de la doctrine juridique ne font pas une différence fondamentale pour les problèmes agrégatifs examinés ici. Nous remercions Lewis Kornhauser de cet éclaircissement et d’autres qui nous ont été précieux.
-
[6]
Voir notamment Post et Salop [1991-1992], qui écrivent peu après Kornhauser et Sager, et Nash [2003], qui synthétise la littérature juridique ultérieure sur le paradoxe doctrinal.
-
[7]
L’expression affaire par affaire ne devrait pas figurer dans la version synchronique, car l’affaire est alors fixée : on peut supposer que Kornhauser et Sager font écho à la version diachronique d’abord mise en exergue. Parmi les théoriciens de l’agrégation logique, il n’y a que List [2004] à s’être attaqué à cette version.
-
[8]
Le débat entre Kornhauser et Sager [2004] et List et Pettit [2005] n’identifie pas leurs différends avec une clarté entière.
-
[9]
La Logique de Kant, parue en 1800, est une synthèse remarquable de la conception dite ancienne. C’est dans les Recherches logiques de Frege (1918-1919) qu’apparaît le mieux la conception dite moderne.
-
[10]
Dietrich et Mongin [2007], suivis par Herzberg et Eckert [2010] et Herzberg [2010], ont traité des groupes infinis. Les résultats transposent ceux déjà obtenus en théorie du choix social, notamment par Kirman et Sonderman [1972].
-
[11]
La théorie de l’agrégation logique a seulement commencé à étudier les domaines restreints (avec les travaux de List [2003], et Dietrich et List [2010]).
-
[12]
Selon Mongin [2003], cette dualité rapproche la méthode axiomatique du choix social de celle de la logique. La définition des règles joue le rôle d’une sémantique par rapport à la syntaxe constituée par les axiomes, et les théorèmes de représentation deviennent ainsi des approximations des théorèmes de complétude prouvés en logique.
-
[13]
Selon l’un des premiers critiques de List et Pettit, Chapman [2002], la systématicité oblitère la dissymétrie fondamentale des prémisses et des conclusions, les premières servant de raisons aux secondes, mais non l’inverse. La faiblesse normative de l’axiome est, plus généralement, qu’il ignore la différence sémantique des propositions.
-
[14]
Les règles à quotas sont définies comme chez Dietrich et List [2007a], qui, après Nehring et Puppe [2002, 2008], en font l’étude détaillée : voir aussi Dietrich [2010].
-
[15]
De ce fait, l’indépendance améliore le statut normatif de la systématicité, mais des objections demeurent cependant [voir Mongin, 2008].
-
[16]
Pour tout sous-ensemble cohérent B ? X, le sous-ensemble nié { –| ? : ? ? B } doit être aussi cohérent.
-
[17]
Curieusement, la théorie de l’agrégation logique et celle du choix social ont suivi des progressions opposées. Le théorème d’Arrow en 1951 procède de l’indépendance, et ce n’est qu’ensuite et pour des contextes spéciaux que certains théorèmes partiront de la neutralité. Fleurbaey et Mongin [2005] réexaminent l’enchaînement historique.
-
[18]
Tout en étant classique au sens de la section 3, le calcul propositionnel de Pauly et van Hees autorise des valeurs de vérité en nombre fini quelconque. Van Hees [2007] et Duddy et Piggins [2009] se placent aussi en dehors de la sémantique bivalente ordinaire, à laquelle notre formalisme syntaxique se conforme implicitement.
-
[19]
Sans la restriction à D ou D *, il existerait une fonction du jugement social constante et systématique : pour tout (A 1,..., An ), F (A 1,..., An ) = X.
-
[20]
Des individus peuvent faire les mêmes comparaisons d’utilité espérée alors qu’ils s’opposent à la fois sur les valeurs d’utilité et de probabilité. Mongin [1995] explique par là l’impossibilité du bayésianisme collectif. Généralisant le propos, Mongin [1997] parle d’unanimité factice lorsque l’accord sur un jugement collectif s’accompagne de désaccords sur les raisons de le porter. Nehring [2005] retrouve l’idée dans son formalisme abstrait d’agrégation parétienne.
-
[21]
Nehring et Puppe [2010] abandonnent la condition – dite de vérifonctionnalité (truth-fonctionality) – qui correspond ici à la fermeture de l’agenda par variables propositionnelles. Il existe alors des F qui échappent à la dégénérescence oligarchique.
-
[22]
Dietrich [2007a] posait directement que chaque ensemble cohérent de formules s’étend à un ensemble maximal cohérent, ce qui correspond au lemme de Lindenbaum bien connu en logique. Cette propriété importante est ici déduite à partir de (E3).
-
[23]
Priest [2002] expose les calculs paraconsistants et leurs motivations.
-
[24]
C’est le cas des logiques épistémiques probabilistes [voir Heifetz et Mongin, 2001] et de certaines logiques de la connaissance commune (mais non pas de toutes, voir Lismont et Mongin, [2002]).
-
[25]
Techniquement parlant, on exploite l’homomorphisme entre le calcul des prédicats et son calcul propositionnel associé : voir par exemple Barwise [1977].
-
[26]
La condition est équivalente si, plus généralement, Z est de cardinalité paire (voir Dokow et Holzman [2010], et Dietrich et Mongin [2010]).
-
[27]
Pour qu’ils ne le soient pas, il faudrait qu’ils contiennent soit { v, r, –| d }, soit { –| v, d }, soit { –| r, d } ; or les trois cas sont exclus par définition de .
-
[28]
Un résultat oligarchique de Gärdenfors [2006] précède le Théorème 7, mais il n’impose que des conditions suffisantes, et d’ailleurs inutilement fortes, à l’agenda d’impossibilité.
-
[29]
Dietrich [2007b] obtient le théorème d’Arrow intégral par un autre détour. Il se place dans un autre cadre que celui du théorème canonique, où les formules entretiennent des relations de pertinence [relevance] en sus des relations logiques. La dérivation de Nehring [2003] doit être signalée, quoiqu’elle ne relève pas formellement de l’agrégation logique.
-
[30]
L’exemple provient de List et Puppe [2009].
-
[31]
Voici quelques exemples non exhaustifs. Pauly [2007 et 2009] propose de représenter l’acceptation des formules à l’aide d’un opérateur propositionnel non classique plutôt que par l’appartenance ensembliste. Cariani, Pauly et Snyder (2008) appliquent aux fonctions de jugement social une propriété métathéorique d’invariance qui débouche sur de nouveaux résultats d’impossibilité. Représentatifs d’un courant plus vaste, Konieczny et Pino-Perez [2002], Pigozzi [2006] et Miller et Osherson [2009] étudient des règles de fusion (merging) pour les ensembles de jugement. Dans cette dernière option, le dilemme discursif est surmonté par l’abandon de l’indépendance.
-
[32]
Voir Nash [2003]. Pour leur part, Kornhauser et Sager vont varier la résolution avec les cas, en recommandant au tribunal de procéder à un « méta-vote » sur la méthode de décision, par les prémisses ou bien par la conclusion.
-
[33]
Très développées aujourd’hui, les logiques conditionnelles procèdent des travaux de Stalnaker [1968] et Lewis [1973]. Elles visent à dépasser les paradoxes de l’implication « matérielle » (booléenne), dont le paragraphe suivant livre un nouvel échantillon.
-
[34]
Le lecteur peut se reporter à Nute et Cross [2001].