À la recherche de nouvelles traces sociales
L’exemple des conspirationnistes
Pages 13 à 52
Citer cet article
- BRONNER, Gérald,
- DAVID, Pascal
- et DEL BUONO, Luigi,
- Bronner, Gérald.,
- et al.
- Bronner, G.,
- David, P.
- et Del Buono, L.
https://doi.org/10.4000/ress.3988
Citer cet article
- Bronner, G.,
- David, P.
- et Del Buono, L.
- Bronner, Gérald.,
- et al.
- BRONNER, Gérald,
- DAVID, Pascal
- et DEL BUONO, Luigi,
https://doi.org/10.4000/ress.3988
Notes
-
[1]
Un marché prédictif est un marché où l’on réalise des paris sur la survenance d’événements (par exemple politiques), la convergence des pronostics organise le rapport de force entre ces hypothèses. Ceux qui font la promotion de ces marchés prédictifs soulignent que les résultats prédictifs obtenus sont supérieurs à ceux des sondages, par exemple. Cette thèse est défendue par Philip Tetlock et Dan Gardner (2016) dans le livre Superforecasting : The Art and Science of Prediction.
-
[2]
Voir à ce sujet <https://medium.com/@erinpettigrew/how-facebook-saw-trump-coming-when-no-one-else-did-84cd6b4e0d8e>.
-
[3]
Voir à ce sujet Hendler et al., 2008, p. 60-69.
-
[4]
Voir à ce sujet Grinsberg et al., 2014 et Lazer et al., 2014.
-
[5]
Cet outil est particulièrement intéressant dans le cas de la France puisque le moteur de recherche Google occupe une position presque monopolistique : selon l’Autorité française de la concurrence il serait utilisé dans 90 % des cas ; <http:// www.autoritedelaconcurrence.fr/doc/fiche2_presentation_google_14dec10.pdf>.
-
[6]
Mais peut-être publie-t-il opportunément ses nouveaux livres pendant cette saison ?
-
[7]
Il est aussi possible d’interpréter cette diminution par un changement de pratique de la population intéressée par cet auteur : elle utiliserait aujourd’hui un autre support qu’Internet pour s’informer.
-
[8]
Le maximum des requêtes sur l’année se situe aux alentours du mois de juin. Il correspond aux périodes précédents des examens. Peut-on alors en déduire que ces auteurs sont plus lus durant cette période ? Certainement pas. On ne peut avancer qu’une interprétation : l’intérêt pour ces auteurs est plus important en cette période du fait des contraintes qui s’exercent sur les personnes utilisant Internet. Cette remarque est importante car elle met en lumière les limites des interprétations que l’on peut construire à partir des spectres fournis par l’outil « Google tendances ».
-
[9]
En tenant compte des déphasages éventuels des calendriers.
-
[10]
Voir <https://trends.google.fr/trends>.
-
[11]
On appellera « entité » les mots entrés dans le moteur de recherche de GT.
-
[12]
On fait alors l’hypothèse que les résultats fournis par GT sont homogènes de 2011 à aujourd’hui.
-
[13]
Il est possible d’obtenir également des résultats sur des périodes restreintes (une journée, etc.) avec des granularités plus fines (jusqu’à quelques minutes), mais uniquement sur une période passée distante de moins d’une semaine du jour où l’on utilise GT. Cette limitation contraint fortement l’intérêt de ces possibilités.
-
[14]
« Slender man » est un « mème » ou un « creepypasta » ou encore une « légende urbaine » né en 2009 sur le forum Internet « something awful ». Son créateur est Victor Surge, pseudonyme d’Eric Knudsen. Slender man est un personnage maléfique qui s’immisce dans les photographies anodines et dont la « mythologie » le rapproche du croque-mitaine : il enlève – notamment – les enfants. En 2014 aux États-Unis, il a « demandé » à 2 fillettes de 12 ans de poignarder une troisième, ce qu’elles ont fait et revendiqué au nom de Slender man.
-
[15]
Par défaut, GT fournit des images de spectres (comme, par exemple, ceux qui ont été présentés lors de la discussion sur un auteur « classique »). Cependant, il est possible d’obtenir les valeurs des spectres. On peut alors traiter ces valeurs – un tableau donnant une amplitude (entre 0 et 100) en fonction d’une date – à l’aide d’un logiciel quelconque et donner une représentation du résultat. Dans les figures présentées ci-dessous, les points correspondent aux valeurs fournies par GT. Sur la figure de gauche, ces points ont été reliés entre eux afin de donner une image identique à l’image que fournit GT. Sur la figure de droite, seuls les points correspondant aux 20 spectres (i.e. chaque jour possède 20 points) apparaissent.
-
[16]
Ricardo distingue les propriétaires fonciers (la rente), les entrepreneurs (le profit) et les travailleurs (le salaire).
-
[17]
Dans ses études historiques Marx propose des nomenclatures de classes plus subtiles que dans ses études théoriques. Ainsi, dans La Lutte des classes en France (1848-1850), il distingue : la bourgeoisie financière, la bourgeoisie industrielle, la classe bourgeoise commerçante, la petite bourgeoisie, la classe paysanne, la classe prolétarienne et le sous-prolétariat.
-
[18]
La recherche méthodique de ces traces sociales date en France du xix e siècle et des premiers grands recensements qui ont lieu tous les 5 ans à partir de 1831. La SGF (Statistique générale de France) est fondée en 1833 pour mener ces enquêtes.
-
[19]
PCS (professions et catégories sociales) : il s’agit de la nouvelle nomenclature mise en place par l’INSEE en 1982 pour remplacer la nomenclature CSP.
-
[20]
Voir à ce sujet Brotherton et Eser, 2015a ; Brotherton et French, 2014 ; Brotherton et French, 2015b ; Crocker et al., 1999 ; Douglas et al., 2015 ; Grzesiak-Feldman, 2013 ; Grzesiak-Feldman et Ejsmont, 2008 ; Grzesiak-Feldman et Irzycka, 2009 ; Tempel et Alcock, 2015.
-
[21]
Voir à ce sujet Jolley et Douglas, 2014.
- [22]
-
[23]
Dans la pratique, on utilise des requêtes « étalons » dont on a étudié les propriétés statistiques (fluctuations, formes, périodicités etc.). On construit ainsi un dictionnaire de requêtes standards qui nous permet de calibrer l’ensemble des requêtes étudiées et ainsi de vérifier que les spectres observés ne sont pas entachés de fluctuations d’échantillonnage importantes. « Pizza » fait partie de notre dictionnaire d’échelle et représente dans l’étude évoquée ici ≈1 % du volume de la disjonction « charlie +...», ce qui nous assure que le spectre obtenu pour cette disjonction n’est pas entaché de fortes incertitudes statistiques.
-
[24]
Les conjonctions (de nature orthographique) « charly complot » etc. sont statistiquement très faibles par rapport à la conjonction « charlie complot ». On peut donc négliger leurs impacts sur le spectre présenté.
-
[25]
Certains arguments peuvent apparaître plusieurs fois dans une seule journée ou sur plusieurs jours. Nous ne tenons compte ici que des nouveaux arguments qui sont avancés.
-
[26]
Sur les graphiques que nous présentons, les points comportent des barres d’incertitudes horizontales et verticales. Les barres horizontales correspondent aux incertitudes liées à l’heure d’émission des articles ou des arguments. On choisit très logiquement 1 jour. Les barres verticales correspondent aux dénombrements des articles et des nouveaux arguments. Ceux-ci sont rares de sorte que l’on peut adopter un modèle poissonnien pour les incertitudes. Le modèle d’incertitudes que nous avons introduit intervient dans les ajustements des lois statistiques.
-
[27]
Dans certains cas les nouveaux arguments ne correspondent pas à la publication des articles (ils peuvent provenir par exemple de Youtube donc avoir pour support une vidéo et non un article). Ce rapport est alors indéfini et n’est donc pas représenté.
-
[28]
Nous mentionnons entre parenthèses la fréquence d’apparition des arguments de la catégorie dans l’ensemble des arguments.
-
[29]
Ce type d’argument est mobilisé selon Jean-Michel Berthelot « chaque fois qu’un phénomène va être conçu comme pouvant être l’expression d’un autre niveau de réalité » (1996, p. 79). Le fait que l’attentat ait été commis le 7/1, par exemple, a pu être interprété comme un signe étant donné que le numéro pour appeler la police est le 17.
-
[30]
Un tableau est donné en annexes qui résume la nomenclature des classifications employées dans cet article.
-
[31]
À qui profite le crime ?
-
[32]
Voir à ce sujet : <http:// www.voltairenet.org/article186408.html>.
-
[33]
Car il y a toujours une catégorie d’individus qui peuvent profiter d’un événement, aussi tragique soit-il.
-
[34]
Voir la distinction qu’opèrent Charles Leadbeater et Paul Miller (2004).
-
[35]
Pour des raisons statistiques, la granularité temporelle adoptée ici est de 4 jours.
-
[36]
Les graphes précédents sont limités à 30 jours, période durant laquelle se déroule la majeure partie de la production de commentaires et d’articles. Le taux de production de commentaires par article se stabilise remarquablement, et autour de la même valeur, pour les 3 classes. La production de commentaires par article est plus importante au début sur les sites trash, mais elle se stabilise rapidement (un peu en dessous du niveau des autres classes) et elle dure moins longtemps au delà des 30 jours.
-
[37]
L’ajustement ne prend pas en compte la première mesure (celle du 07-01-2015) pour la raison suivante : l’événement a eu lieu vers 13h et les réactions des sites conspirationnistes, plusieurs heures plus tard. La journée – qui est la granularité adoptée ici – est donc réduite d’un facteur ~2/3. Pour tenir compte de cette première mesure il serait alors nécessaire de pondérer ce nombre par un facteur ~3. L’imprécision du facteur de pondération engendrerait une incertitude sur cette mesure très importante. Dans l’ajustement, cette mesure serait alors peu contraignante.
-
[38]
La distribution de Pareto est très utilisée en sciences humaines et sociales car elle correspond bien à la représentation de nombreuses activités d’intérêt dans ce domaine. Il existe de nombreux exemples. Nous ne donnons ici que quelques références : voir Valade (2011) ; De Montbrial (1973) ; Vazquez et al. (2006).
-
[39]
La notation traditionnelle en statistique f (t | b, t0) signifie que dans cette densité de probabilité la variable aléatoire est t et que les paramètres de cette densité sont b et t 0.
-
[40]
Dans cette notation, p (x / y) signifie que la probabilité de la variable aléatoire x est conditionnée à la variable aléatoire y. Autrement dit que nous avons un processus bayésien.
-
[41]
Voir notamment à ce sujet <http:// www.rug.nl/research/globalisation-studies-groningen/cds/pdf/thiombiano.pdf>. Pour une vision plus complète et plus large, voir Dagnelie (2011).
-
[42]
On fait ici l’hypothèse que les sites de classe généraliste sont constitués de prosélytes fréquentant (aussi) les sites de classes trash et professionnelle ainsi que d’individus « dans le doute ». Si tel est le cas on doit obtenir dans la distribution des commentaires de la classe généraliste une composante identique à celle de la classe professionnelle, une composante identique à celle de la classe trash et une composante propre.
La sociologie cherche à recueillir des traces laissées dans le monde social. De ce point de vue, l’apparition d’Internet offre un espace de recherches inédit. Cet article explore certaines des nouvelles possibilités offertes par cet environnement social et certaines des difficultés méthodologiques qu’il implique. Internet, parce qu’il constitue un marché dérégulé de l’information, est notamment le lieu de la diffusion de « fake news ». Pour cette raison, l’article propose d’examiner certaines des traces laissées par une population particulières : les conspirationnistes. Quels types de comportements peuvent être décelés par les arguments qu’ils utilisent, les commentaires qu’ils font de l’actualité, c’est la question que pose l’article en convoquant une approche fondée sur les sciences sociales computationnelles.
- Internet
- croyances
- argumentation
- conspirationnisme
- sciences sociales computationnelles
Mots-clés éditeurs : argumentation, conspirationnisme, croyances, Internet, sciences sociales computationnelles
In search of new social footprints: the case of conspirationists
One of sociology’s aims is to gather traces left in the social world. From this standpoint, the appearance of Internet offers a previously unknown space for research. This article explores some of the new possibilities provided by this social environment and certain of its inherent methodological difficulties. Internet is a deregulated information market, which makes it a prime location for the dissemination of “fake news”. For this reason, the article proposes to examine certain of the traces left behind by a very particular population group—conspirationists. Which kinds of behaviour can be detected in the arguments they use or in their comments on news ? This is the question adressed in this article, using an approach based on computational social science.
- beliefs
- argumentation
- computational social science
- conspirationism
- Internet
Mots-clés éditeurs : argumentation, beliefs, computational social science, conspirationism, Internet