La révolution Big Data

Viktor Mayer-Schönberger

doi:10.3917/pe.144.0069

Politique étrangère 2014/4 Hiver

Article de revue

La révolution Big Data

Par Viktor Mayer-Schönberger

Pages 69 à 81

MAYER-SCHÖNBERGER, Viktor,

2014. La révolution Big Data. Politique étrangère, 2014/4 Hiver, p.69-81. DOI : 10.3917/pe.144.0069. URL : https://shs.cairn.info/revue-politique-etrangere-2014-4-page-69?lang=fr.

Mayer-Schönberger, Viktor.

« La révolution Big Data ». Politique étrangère, 2014/4 Hiver, 2014. p.69-81. CAIRN.INFO, shs.cairn.info/revue-politique-etrangere-2014-4-page-69?lang=fr.

Mayer-Schönberger, V.

(2014). La révolution Big Data. Politique étrangère, Hiver(4), 69-81. https://doi.org/10.3917/pe.144.0069.

https://doi.org/10.3917/pe.144.0069

Notes

[1]
Le terme anglais, plus usité que son équivalent français, signifie « volumes massifs de données » (Ndt).
[2]
Alfred W. Crosby le replace utilement dans un contexte beaucoup plus large dans son ouvrage La Mesure de la réalité. La quantification dans la société occidentale, Paris, Allia, 2003 [éd. originale, 1997].
[3]
Voir W. Kruskal et F. Mosteller, « Representative Sampling. IV: The History of the Concept in Statistics, 1895-1939 », International Statistical Review, n° 48, 1980, p. 169-195.
[4]
M. Hilbert et P. López, « The World’s Technological Capacity to Store, Communicate, and Compute Information », Science, 1^er avril 2011, p. 60-65 et « How to Measure the World’s Technological Capacity to Communicate, Store and Compute information? », International Journal of Communication, n° 2, 2012, p. 1042–1055, disponible sur : <www.ijoc.org/ojs/index.php/ijoc/article/viewFile/1562/742>.
[5]
Pour les estimations de l’impact dans le monde de la presse à imprimer sur les livres, voir E.L. Eisenstein, La Révolution de l’imprimé dans l’Europe des premiers temps modernes, Paris, La Découverte, 1991 [éd. originale, 1983].
[6]
C’est donc très opportunément que Nicholas Negroponte, ancien directeur du célèbre Massachusetts Institute of Technology (MIT) Media Lab, a intitulé son livre L’Homme numérique (Paris, Robert Laffont, 1995).
[7]
Par opposition au Big Data, soit un volume de données réduit et accessible à l’intelligence humaine (Ndt).
[8]
J. Ginsburg et al., « Detecting Influenza Epidemics Using Search Engine Query Data », Nature, n° 457, 2009, p. 1012-1014. Ce procédé doit toutefois être utilisé avec beaucoup de précautions notamment pour éviter le surajustement (overfitting). Certains des problèmes potentiels sont évoqués en détail dans D. Lazer et al., « The Parable of Google Flu: Traps in Big Data Analysis », Science, 14 mars 2014, p. 1203-1205.
[9]
J. Marcus, Amazonia: Five Years at the Epicenter of the Dot.Com Juggernaut, New York, NY, The New Press, 2004, p. 199.
[10]
V. Mayer-Schönberger et K. Cukier, Big Data. A Revolution That Will Transform How We Live, Work and Think, Londres, John Murray, 2013, p. 52 [trad. fr., Big Data. La révolution des données est en marche, Paris, Robert Laffont, 2014].
[11]
D. Kahneman, Système 1 / Système 2. Les deux vitesses de la pensée, Paris, Flammarion, 2012 [éd. originale, 2011].
[12]
Cela a notamment été avancé par John Horgan (The End of Science. Facing the Limits of Knowledge in the Twilight of the Scientific Age, Reading, MA, Addison-Wesley, 1996) ; mais cette idée est bien évidemment beaucoup plus ancienne.
[13]
L.M. Holson, « Putting a Bolder Face on Google », New York Times, 1^er mars 2009.
[14]
Voir l’article « Rolls-Royce: Britain’s Lonely High-Flier », The Economist, 8 janvier 2009, disponible sur : <www.economist.com/node/12887368>.
[15]
V. Mayer-Schönberger et K. Cukier, op. cit., p. 89.
[16]
V. Mayer-Schönberger et K. Cukier, op. cit., p. 135-138.
[17]
Ceci a déjà été montré en détail par Y. Bakos et E. Brynjolfsson, « Bundling Information Goods: Pricing, Profits and Efficiency », Management Science, n° 45, décembre 1999, p. 1613-1630.
[18]
Pour une présentation plus détaillée et recherchée de cet argument, voir Ph. Evans, « How Data Will Transform Business », TED Talk, novembre 2013, disponible sur : <www.ted.com/talks/philip_evans_how_data_will_transform_business>.
[19]
V. Mayer-Schönberger et K. Cukier, op. cit., p. 168.
[20]
« Big Government Meets Big Data », The Economist, 8 janvier 2013, disponible sur : <www.economist.com/blogs/schumpeter/2013/01/tax-evasion-italy>.
[21]
Un pétabyte, ou pétaoctet, représente 10¹⁵ octets (Ndlr).
[22]
« SIRFs Up », The Economist, 30 novembre 2013, disponible sur : <www.economist.com/news/united-states/21590912-cleverer-use-data-and-investigative-collaboration-can-help-cut-fraud-sirfs-up>.
[23]
Voir par exemple P. Orszag, « Open Government Directive, Memorandum for the Heads of Executive Departments and Agencies M-10-06 », Washington, DC, Bureau exécutif de la Présidence, 8 décembre 2009, disponible sur : <http://www.whitehouse.gov/sites/default/files/omb/assets/memoranda_2010/m10-06.pdf> ; N. Shadbolt, « A Year of data.gov.uk », Data Blog, The Guardian, 21 janvier 2011, disponible sur : <www.guardian.co.uk/news/datablog/2011/jan/21/data-gov-nigel-shadbolt-government> ; B. Noveck, Wiki Government. How Technology Can Make Government Better, Democracy Stronger, and Citizens More Powerful, Washington, DC, Brookings Institution Press, 2009.
[24]
Voir par exemple U.S. Federal Trade Commission (FTC), Protecting Consumer Privacy in an Era of Rapid Change: Recommendations for Businesses and Policymakers, rapport, 2012, disponible sur : <www.ftc.gov/os/2012/03/120326privacyreport.pdf> ; et dans la littérature universitaire, voir par exemple F.H. Cate, « The Failure of Fair Information Practice Principles », in J.K. Winn (dir.), Consumer Protection in the Age of the “Information Economy”, Aldershot, Ashgate, 2006, p. 341 et suiv.
[25]
Film réalisé en 2002 par Steven Spielberg d’après une nouvelle de Philip K. Dick.
[26]
Voir par exemple la décision, le 8 avril 2011, du ministère américain de la Justice demandant à Google de développer et de céder sous licence un logiciel destiné aux compagnies de voyage avant d’autoriser l’acquisition par le moteur de recherche d’ITA Software, disponible sur : <www.justice.gov/opa/pr/justice-department-requires-google-inc-develop-and-license-travel-software-order-proceed-its>.
[27]
V. Mayer-Schönberger et K. Cukier, op. cit., p. 163-170 et 195-197; Voir également D. Boyd et K. Crawford, « Six Provocations for Big Data », communication présentée au A Decade in Internet Time: Symposium on the Dynamics of the Internet and Society, Oxford Internet Institute, 21 septembre 2011, disponible sur : <http://ssrn.com/abstract=1926431>.

Citer cet article

Mayer-Schönberger, V.

(2014). La révolution Big Data. Politique étrangère, Hiver(4), 69-81. https://doi.org/10.3917/pe.144.0069.

Mayer-Schönberger, Viktor.

« La révolution Big Data ». Politique étrangère, 2014/4 Hiver, 2014. p.69-81. CAIRN.INFO, shs.cairn.info/revue-politique-etrangere-2014-4-page-69?lang=fr.

MAYER-SCHÖNBERGER, Viktor,

2014. La révolution Big Data. Politique étrangère, 2014/4 Hiver, p.69-81. DOI : 10.3917/pe.144.0069. URL : https://shs.cairn.info/revue-politique-etrangere-2014-4-page-69?lang=fr.

https://doi.org/10.3917/pe.144.0069

Notes

[1]
Le terme anglais, plus usité que son équivalent français, signifie « volumes massifs de données » (Ndt).
[2]
Alfred W. Crosby le replace utilement dans un contexte beaucoup plus large dans son ouvrage La Mesure de la réalité. La quantification dans la société occidentale, Paris, Allia, 2003 [éd. originale, 1997].
[3]
Voir W. Kruskal et F. Mosteller, « Representative Sampling. IV: The History of the Concept in Statistics, 1895-1939 », International Statistical Review, n° 48, 1980, p. 169-195.
[4]
M. Hilbert et P. López, « The World’s Technological Capacity to Store, Communicate, and Compute Information », Science, 1^er avril 2011, p. 60-65 et « How to Measure the World’s Technological Capacity to Communicate, Store and Compute information? », International Journal of Communication, n° 2, 2012, p. 1042–1055, disponible sur : <www.ijoc.org/ojs/index.php/ijoc/article/viewFile/1562/742>.
[5]
Pour les estimations de l’impact dans le monde de la presse à imprimer sur les livres, voir E.L. Eisenstein, La Révolution de l’imprimé dans l’Europe des premiers temps modernes, Paris, La Découverte, 1991 [éd. originale, 1983].
[6]
C’est donc très opportunément que Nicholas Negroponte, ancien directeur du célèbre Massachusetts Institute of Technology (MIT) Media Lab, a intitulé son livre L’Homme numérique (Paris, Robert Laffont, 1995).
[7]
Par opposition au Big Data, soit un volume de données réduit et accessible à l’intelligence humaine (Ndt).
[8]
J. Ginsburg et al., « Detecting Influenza Epidemics Using Search Engine Query Data », Nature, n° 457, 2009, p. 1012-1014. Ce procédé doit toutefois être utilisé avec beaucoup de précautions notamment pour éviter le surajustement (overfitting). Certains des problèmes potentiels sont évoqués en détail dans D. Lazer et al., « The Parable of Google Flu: Traps in Big Data Analysis », Science, 14 mars 2014, p. 1203-1205.
[9]
J. Marcus, Amazonia: Five Years at the Epicenter of the Dot.Com Juggernaut, New York, NY, The New Press, 2004, p. 199.
[10]
V. Mayer-Schönberger et K. Cukier, Big Data. A Revolution That Will Transform How We Live, Work and Think, Londres, John Murray, 2013, p. 52 [trad. fr., Big Data. La révolution des données est en marche, Paris, Robert Laffont, 2014].
[11]
D. Kahneman, Système 1 / Système 2. Les deux vitesses de la pensée, Paris, Flammarion, 2012 [éd. originale, 2011].
[12]
Cela a notamment été avancé par John Horgan (The End of Science. Facing the Limits of Knowledge in the Twilight of the Scientific Age, Reading, MA, Addison-Wesley, 1996) ; mais cette idée est bien évidemment beaucoup plus ancienne.
[13]
L.M. Holson, « Putting a Bolder Face on Google », New York Times, 1^er mars 2009.
[14]
Voir l’article « Rolls-Royce: Britain’s Lonely High-Flier », The Economist, 8 janvier 2009, disponible sur : <www.economist.com/node/12887368>.
[15]
V. Mayer-Schönberger et K. Cukier, op. cit., p. 89.
[16]
V. Mayer-Schönberger et K. Cukier, op. cit., p. 135-138.
[17]
Ceci a déjà été montré en détail par Y. Bakos et E. Brynjolfsson, « Bundling Information Goods: Pricing, Profits and Efficiency », Management Science, n° 45, décembre 1999, p. 1613-1630.
[18]
Pour une présentation plus détaillée et recherchée de cet argument, voir Ph. Evans, « How Data Will Transform Business », TED Talk, novembre 2013, disponible sur : <www.ted.com/talks/philip_evans_how_data_will_transform_business>.
[19]
V. Mayer-Schönberger et K. Cukier, op. cit., p. 168.
[20]
« Big Government Meets Big Data », The Economist, 8 janvier 2013, disponible sur : <www.economist.com/blogs/schumpeter/2013/01/tax-evasion-italy>.
[21]
Un pétabyte, ou pétaoctet, représente 10¹⁵ octets (Ndlr).
[22]
« SIRFs Up », The Economist, 30 novembre 2013, disponible sur : <www.economist.com/news/united-states/21590912-cleverer-use-data-and-investigative-collaboration-can-help-cut-fraud-sirfs-up>.
[23]
Voir par exemple P. Orszag, « Open Government Directive, Memorandum for the Heads of Executive Departments and Agencies M-10-06 », Washington, DC, Bureau exécutif de la Présidence, 8 décembre 2009, disponible sur : <http://www.whitehouse.gov/sites/default/files/omb/assets/memoranda_2010/m10-06.pdf> ; N. Shadbolt, « A Year of data.gov.uk », Data Blog, The Guardian, 21 janvier 2011, disponible sur : <www.guardian.co.uk/news/datablog/2011/jan/21/data-gov-nigel-shadbolt-government> ; B. Noveck, Wiki Government. How Technology Can Make Government Better, Democracy Stronger, and Citizens More Powerful, Washington, DC, Brookings Institution Press, 2009.
[24]
Voir par exemple U.S. Federal Trade Commission (FTC), Protecting Consumer Privacy in an Era of Rapid Change: Recommendations for Businesses and Policymakers, rapport, 2012, disponible sur : <www.ftc.gov/os/2012/03/120326privacyreport.pdf> ; et dans la littérature universitaire, voir par exemple F.H. Cate, « The Failure of Fair Information Practice Principles », in J.K. Winn (dir.), Consumer Protection in the Age of the “Information Economy”, Aldershot, Ashgate, 2006, p. 341 et suiv.
[25]
Film réalisé en 2002 par Steven Spielberg d’après une nouvelle de Philip K. Dick.
[26]
Voir par exemple la décision, le 8 avril 2011, du ministère américain de la Justice demandant à Google de développer et de céder sous licence un logiciel destiné aux compagnies de voyage avant d’autoriser l’acquisition par le moteur de recherche d’ITA Software, disponible sur : <www.justice.gov/opa/pr/justice-department-requires-google-inc-develop-and-license-travel-software-order-proceed-its>.
[27]
V. Mayer-Schönberger et K. Cukier, op. cit., p. 163-170 et 195-197; Voir également D. Boyd et K. Crawford, « Six Provocations for Big Data », communication présentée au A Decade in Internet Time: Symposium on the Dynamics of the Internet and Society, Oxford Internet Institute, 21 septembre 2011, disponible sur : <http://ssrn.com/abstract=1926431>.

1L’analyse d’ensemble de données exhaustives peut changer notre vision du monde. Sous cet angle, le Big Data [1] est un projet instillant raison et rationalité dans notre monde complexe. Les sciences aspirent à décrire ce monde via des règles abstraites mais relativement simples – les lois de la nature par exemple. La méthode scientifique, qui constitue sans conteste l’un des apports français majeurs au Progrès [2], repose sur la prémisse selon laquelle on peut tirer de théories abstraites des hypothèses concrètes sur la réalité, lesquelles peuvent être mises à l’épreuve grâce aux données collectées à cette fin. Le Big Data altère profondément ces deux fondements rationnels ; non pour remettre en question la rationalité comme projet, mais pour la faire passer à une étape supérieure.

Une nouvelle création de sens

2À propos de l’abandon de règles abstraites simples, on rappellera que de tels changements se sont produits tout au long de l’histoire de l’humanité. Un tel abandon peut être comparé, par sa portée, au passage, au siècle dernier, de la notion newtonienne d’absolu à la relativité d’Einstein. La justesse de la loi de Newton n’était pas en cause : elle était une simplification du monde suffisante quand il n’était pas nécessaire de comprendre la gravité dans sa complexité, ni de la calculer précisément. Quand il a fallu appréhender l’espace lointain ou construire un système mondial de localisation, on a dû renoncer à la simplification pour une interprétation plus complexe, et plus exacte, de la réalité.

3D’énormes volumes de données donnent instantanément une vision inédite et exhaustive du monde. Un tel affinement de la saisie de la réalité peut aider la prise de décision, notamment parce que le Big Data permet de mieux prévoir l’avenir. C’est crucial pour les sociétés occidentales les plus avancées, caractérisées par leur aversion au risque, leur penchant pour l’efficacité et une tendance à réglementer dans la complexité.

4Jusque récemment, la collecte de données était difficile, chronophage et coûteuse. Nos processus, méthodes, institutions de recueil et d’analyse pouvaient fonctionner avec le moins de données possibles. La méthode à peine centenaire de l’échantillonnage aléatoire, par exemple, utilise ingénieusement une petite partie pour avoir une idée du tout [3]. Mais ce raccourci comporte des restrictions intrinsèques insolubles, et acceptables seulement tant qu’il n’existait aucune alternative.

5Nous avons aujourd’hui à notre disposition beaucoup plus de données que jamais dans l’histoire humaine. Les volumes en auraient été multipliés par 100 entre 1987 et 2007, et doublent depuis tous les ans ou tous les deux ans [4]. Augmentation infiniment supérieure à celle provoquée par l’invention de l’imprimerie, laquelle avait entraîné en gros un doublement des données sur 50 années [5].

6Au cours des 15 dernières années, nous sommes en outre passés d’un monde dans lequel les trois quarts des données étaient analogiques à un monde où celles-ci représentent à peine 1 % du total. Les données numériques sont plus faciles à stocker, à retrouver et à analyser, ce qui permet non seulement de transcrire de vastes pans de la réalité sous forme de données, mais aussi de tirer parti de ces dernières [6]. Cette formidable augmentation quantitative produit un changement qualitatif. Si le Small Data [7] est l’outil d’un âge où la collecte et l’analyse de données étaient difficiles, l’avènement de celui des données à profusion nous incite à repenser les processus et institutions de création de sens directement issus de cette ère passée.

7La méthode scientifique illustre la façon dont le Big Data peut faire évoluer nos méthodes de recherche de sens. Quand Google a prédit la propagation de la grippe en s’appuyant seulement sur l’analyse des requêtes envoyées à son moteur de recherche, ses ingénieurs n’ont pas formulé d’hypothèse concrète – les cinq mots que les personnes atteintes de la grippe sont susceptibles de rechercher, par exemple. Grâce à ses ensembles de données exhaustifs, le géant de l’internet a pu confier à l’ordinateur le soin de générer des hypothèses et de les mettre à l’épreuve [8]. Pour son exercice de prédiction sur la grippe, Google a testé près d’un demi-milliard d’hypothèses, pour identifier la meilleure d’entre elles. Cela n’aurait pas été possible si leur formulation et leur mise à l’épreuve avaient dû être réalisées par des humains.

8Le Big Data nous permet aussi de ne plus plier la réalité à des catégories a priori. Nous pouvons désormais laisser les données nous fournir elles-mêmes les catégories qu’elles contiennent, plutôt que de croire qu’une personne peut établir des classifications reflétant fidèlement la réalité. À l’origine, Amazon fondait ses recommandations de produits sur des catégories préconçues de consommateurs utilisées par ses experts en marketing ; avec pour résultat l’impression de faire, selon un employé de l’entreprise, « ses achats avec l’idiot du village [9] ». Quand Amazon a commencé à utiliser l’analyse du Big Data pour dégager les similitudes entre produits vendus, la pertinence de ses recommandations s’est accrue de façon vertigineuse. Cette approche ne se contente pas d’appréhender la réalité telle qu’elle est, elle est aussi une clé du succès économique : le système de recommandations d’Amazon représenterait aujourd’hui environ un tiers des revenus de l’entreprise [10].

9Cette approche révèle des liens apparents entre des données qui, en substance, montrent ce qui se passe, sans en fournir le pourquoi. On pourrait penser que cette inaptitude du Big Data à éclairer la causalité constitue une grave faiblesse. Daniel Kahneman a brillamment montré que les hommes aiment se représenter le monde en termes de causes et d’effets ; mais il a aussi mis en évidence le fait que nos intuitions causales immédiates sont souvent fausses, bien que rassurantes puisqu’elles nous font croire que nous comprenons le monde [11]. Avec le Big Data, nous en savons plus sur ce qui se passe, sans nous en remettre à de fausses intuitions sur le pourquoi. La logique de causalité n’est certes pas morte, loin de là, mais elle n’a plus le monopole de la recherche de sens, qui sera aidée et facilitée par des analyses corrélationnelles de Big Data.

10Ce dernier va donc sans doute ébranler notre vision dominante du monde, fondée sur des simplifications causales, des hypothèses non optimisées et des approches préconçues de la réalité. Nous devrons être plus humbles, accepter que la réalité soit plus complexe que nos conceptions idéalisées. Tout cela est théoriquement positif, mais le statu quo est menacé, des principes bien établis sont remis en cause [12].

11Prenons par exemple le rôle des experts. Le Big Data pourrait rendre patent que leur expertise n’est pas nécessairement étayée par les faits. Les spécialistes pourront avoir confiance en leur jugement, le Big Data n’en prouvera pas moins qu’ils peuvent avoir tort. Afin de trouver la bonne couleur pour la bordure de son écran de recherche, Google a mené des tests sur 41 nuances de bleu. Le designer de l’entreprise avait décrété que telle nuance était appropriée ; une analyse de données a révélé qu’un ton légèrement différent fonctionnait mieux [13]. Les données discréditent les préjugés et les croyances humaines déguisés en expertise – et le Big Data mettra au jour beaucoup de cas semblables.

Une nouvelle ressource économique

12Le Big Data nous fait prendre conscience que les données constituent une matière première pouvant être transformée en valeur économique. Contrairement à une ressource matérielle, la valeur des données n’est pas détruite par un usage unique correspondant au motif de la collecte. Elles peuvent être utilisées indéfiniment à des fins multiples et nouvelles, une valeur supplémentaire étant produite à chaque opération. Jusque récemment, les données étaient rarement réutilisées, leur stockage et leur analyse étant difficiles et coûteux. Or, la chute de ces coûts fait évoluer l’économie des données, et la réutilisation se banalise rapidement. Plus important encore, celle-ci ouvre la voie à la création de nouveaux produits et services, et donc à de nouveaux flux de revenus pour les entreprises – ce qui pourrait conduire à l’évolution de leur business model.

13Rolls-Royce, deuxième producteur mondial de réacteurs pour avions commerciaux, équipe par exemple ses moteurs de capteurs et d’ordinateurs perfectionnés pour gérer leur fonctionnement en vol. Cette technologie produit d’énormes quantités de données, auparavant éliminées par l’ordinateur de vol après utilisation. Avec le virage Big Data, plutôt que d’être effacées, les données des capteurs sont collectées et envoyées au serveur principal de Rolls-Royce après chaque vol. Grâce à une analyse minutieuse des milliards d’éléments ainsi recueillis, l’entreprise a découvert qu’elle pouvait anticiper avec un degré de probabilité convaincant quelle partie du moteur était susceptible d’être endommagée. Une découverte qui a renforcé la sécurité des vols, et a aussi permis au fabricant de proposer aux compagnies aériennes des contrats de maintenance à prix fixes. Rolls-Royce est ainsi passé de la vente de réacteurs à un business model qui lui permet de tirer plus de la moitié de ses revenus d’offres de services [14].

14Rolls-Royce est désormais une entreprise de gestion de données qui se trouve produire également des réacteurs. D’autres entreprises s’adaptent aussi. UPS, par exemple, applique le même concept de maintenance prévisionnelle à sa flotte de fourgonnettes de livraison, ce qui lui permet d’optimiser les coûts de réparation et de service [15]. SWIFT, le géant international des paiements, a découvert qu’il était possible de traiter ses données de transactions (data-mining) relatives aux paiements transfrontaliers pour prévoir la santé des économies locales en temps presque réel – des prévisions que l’entreprise vend désormais dans le monde entier.

15Les entreprises peuvent désormais pénétrer de nouveaux marchés très éloignés de leur secteur de référence. UPS sera peut-être plus au fait de la réparation de ses fourgonnettes que les fabricants eux-mêmes, et SWIFT en saura plus sur la santé des économies nationales que les gouvernements des États concernés. Quant à Google, sa voiture sans conducteur pourrait bien faire du groupe un acteur majeur du secteur des transports… Aucune entreprise ne peut désormais compter sur le fait que ses concurrents demeureront tels qu’elle les a toujours connus. Les possibilités techniques et les faibles coûts d’entrée intensifieront la concurrence, notamment d’acteurs inattendus, grands et petits.

16Prenons le cas de la start-up américaine Inrix, qui aide chaque jour 100 millions de personnes à éviter les embouteillages entre leur domicile et leur lieu de travail, leur fournissant des informations en temps réel sur la circulation. Si Inrix peut fournir ce service, c’est que chacun de ses utilisateurs est un capteur informant l’entreprise de sa localisation et de la vitesse de son déplacement. La start-up a aussi découvert que les milliards de données recueillies chaque jour peuvent être utilisées à d’autres fins. Elle a par exemple observé une corrélation entre celles concernant la circulation aux alentours des centres commerciaux durant le week-end et les revenus des chaînes de distribution nationales qui y sont implantées. Inrix a donc noué des relations avec un fonds d’investissement qui achète ou vend des actions en se fondant sur les prévisions de revenus tirées des données de circulation [16]. Le recours au Big Data n’est donc pas le fait exclusif des grandes entreprises, ou des petites : toutes en tirent profit.

17Les grandes entreprises, en particulier celles qui détiennent déjà des volumes significatifs de données, bénéficient d’un avantage quand elles élargissent leur capital et combinent autrement les données qu’elles possèdent. Les effets de réseau positifs qui en découlent leur permettent de tirer un profit supérieur à celui de leurs concurrents, dont l’accès aux données est moindre, notamment parce que ces entreprises peuvent faire valoir ce capital pour attirer des investissements externes conséquents. Ce qui pourrait renforcer encore la position des grands détenteurs de données [17].

18De même, le Big Data bénéficie grandement aux start-up et aux petites entreprises. Pour démarrer, celles qui s’appuient sur le Big Data n’ont pas besoin des investissements considérables qui étaient requis à l’ère industrielle, ou même aux premières heures du numérique. Inutile de construire d’onéreuses usines ; inutile même de disposer de vastes parcs de serveurs. Les données peuvent être recueillies, stockées et analysées par des services informatiques en nuage (cloud) qui permettent de fait aux petits acteurs nouvellement arrivés sur le marché de louer à faible coût autant de puissance informatique que nécessaire. Tout ce dont un acteur majeur du Big Data a besoin, c’est d’une bonne idée, des compétences pour la mettre en œuvre et d’un accès aux données.

19Même cette dernière condition ne devrait pas entraver les petits acteurs. Certains d’entre eux sont si bien placés dans les flux de données qu’ils peuvent en accumuler à moindre coût – Inrix en est un excellent exemple. D’autres pourraient convaincre les grands détenteurs de données de leur en fournir l’accès moyennant finance, tous ceux-là n’étant pas capables ou désireux d’extraire la valeur de leurs données – opération susceptible de mettre en péril leur business model. Ces grands détenteurs pourraient préférer arrondir leurs revenus par des droits de licence.

20Les coûts d’entrée pour les nouveaux venus dans l’analyse de Big Data sont ainsi bien moindres qu’ils ne l’étaient pour les entrepreneurs d’hier. On devrait donc voir se constituer de dynamiques écosystèmes de start-up innovantes tournées vers le Big Data – un phénomène déjà à l’œuvre aux États-Unis.

21Les sociétés de taille moyenne ne bénéficieront pas autant du Big Data que leurs concurrentes des deux extrémités du spectre entrepreneurial : les économies d’échelle, toujours réelles, sont beaucoup moins importantes dans ce secteur que dans les secteurs traditionnels. À l’ère du Big Data, la nouvelle norme d’échelle favorisera le très petit ou le très grand [18].

22L’économie des données influera également sur la façon dont celles-ci sont traitées par les différents acteurs. À mesure que plus d’entreprises prendront conscience de la valeur inexploitée que représente la réutilisation des données, le secteur privé ne manquera pas d’en recueillir plus, d’en stocker plus longtemps, de les utiliser plus fréquemment. Ce qui aura des implications considérables pour les dispositifs juridiques et politiques qui encadrent le traitement de ces données, en particulier celles qui sont de nature sensible.

23Les gouvernements se sont eux aussi lancés dans la course aux bénéfices associés au Big Data. Edward Snowden a révélé que les États-Unis, entre autres, sont impliqués dans la collecte, le stockage et l’analyse à une échelle sans précédent des données personnelles de centaines de millions de personnes – un cas loin d’être isolé. Dans différentes villes du monde, les organismes chargés d’appliquer la loi recourent au Big Data pour mettre en œuvre la technique dite de police prévisionnelle (predictive policing), qui consiste à envoyer des agents patrouiller au moment et à l’endroit où le Big Data prévoit qu’un crime pourrait être commis [19]. Les autorités fiscales d’un nombre croissant de pays ont conclu des contrats avec des fournisseurs privés de services Big Data pour réprimer la fraude fiscale à une échelle encore inédite [20]. Pour certains, la capacité américaine d’enregistrement et d’analyse est de l’ordre de pétabytes [21] de données, soit un volume d’informations plusieurs centaines de fois supérieur à celui que recèle la bibliothèque du Congrès américain – la plus grande du monde [22].

Un instrument de politique économique et ses limites

24Le Big Data est de plus en plus utilisé par les décideurs politiques. Jusqu’à une date récente, les débats consacrés aux « données ouvertes » (open data) étaient réservés à une communauté réduite de décideurs éclairés. Ils visaient à savoir si un accès aisé aux données pourrait favoriser le débat public, renforcer la transparence de la gouvernance et affermir la démocratie [23]. À mesure que les responsables politiques se rendent compte que ces données peuvent être – et sont – transformées en valeur économique, ils relancent le débat sur l’accès à celles du secteur public en le réorientant sur la nécessité de favoriser l’innovation et d’approfondir une politique économique fondée sur la stimulation de la croissance par le progrès technologique. Alors que la perspective des élites se déplace de l’engagement civique aux politiques économiques, les questions politiques liées aux données prennent de l’importance et s’éloignent progressivement de leurs racines civiques originelles.

25Pour des pays désireux d’entrer dans le club des économies capitalistes avancées, telles la Chine ou l’Inde, le Big Data est un moyen supplémentaire de prendre de l’avance sur l’Occident. À la différence de leurs rivaux occidentaux, ces États sont moins encombrés de réglementations et de débats sur le respect de la vie privée, la protection de la propriété intellectuelle ou la domination du marché par des oligopoles – donc mieux à même d’exploiter le potentiel économique du Big Data. On ne peut savoir si leur optimisme est fondé, mais en promouvant une transition rapide de leurs économies vers le Big Data, ils alimentent le sentiment que ce dernier peut être utilisé comme un avantage compétitif dans le cadre de la mondialisation.

26Aborder le sujet sous l’angle économique ne suffit pourtant pas, du moins pour les responsables politiques occidentaux. Chaque semaine ou presque, des entreprises reconnaissent que des données personnelles sensibles de leurs clients ont été piratées, et nous sommes abreuvés de flux de détails apparemment infinis sur les programmes de surveillance des États-Unis et de leurs alliés – ce qui ne manque pas d’éroder la confiance du public dans la collecte et l’analyse de données personnelles, dans les secteurs public et privé.

27De plus, les mécanismes légaux destinés à protéger les individus des faces cachées du Big Data sont aussi inefficaces qu’insuffisants. Le consentement donné par les individus à l’utilisation de leurs données personnelles, au moment de leur collecte, est devenu une pénible et négligeable formalité, consistant à cliquer « OK » sans savoir – ou sans se préoccuper de savoir – exactement ce à quoi on consent. Ce qui suffit difficilement à protéger la vie privée des individus [24]…

28Pis, les lois actuelles de protection de la vie privée ne sont d’aucun secours contre l’une de ces faces cachées, troublante quoiqu’encore relativement méconnue : celle qui donne aux résultats des analyses de données plus de sens qu’ils n’en ont réellement, et donc les fait « mentir ». Cela pourrait nous conduire à une dictature des données – une situation où l’on accorderait trop de crédit à ce que l’on croit pouvoir tirer de ces dernières.

29L’utilisation du Big Data pour assigner des responsabilités à des individus, non pour ce qu’ils ont fait, mais pour ce que l’on prévoit qu’ils pourraient faire, est l’une des situations possibles où ce danger est le plus prégnant. Ce qui revient à croire que les prédictions du Big Data peuvent déterminer à l’avance qui commettra une infraction, et que l’on peut donc arrêter une personne, et la tenir pour responsable, avant même que les faits n’aient été commis. Cette tentation, qui rappelle le film Minority Report [25], va bien au-delà des limites de l’application de la loi. Que se passerait-il, par exemple, si l’on pouvait « prévoir » qu’une personne sera bonne conductrice avant même qu’elle ne passe son permis de conduire ? Si les données montrent qu’un individu est susceptible de causer des accidents, la société acceptera-t-elle de lui délivrer un permis s’il réussit à l’examen ? Les assureurs accepteront-ils d’assurer cette personne ? À quel prix ? Punir sur la simple base de prévisions revient à dénier aux individus tout libre arbitre, une valeur pourtant fondatrice des sociétés libres.

30Dans la plupart des cas, le Big Data ne peut déterminer la responsabilité d’un individu en se fondant sur des prévisions probabilistes de son comportement ; mais étant donné que les humains perçoivent le monde en termes de causes et d’effets, nous serons toujours tentés – à tort – d’exploiter le Big Data dans ce but. Pour nous prémunir contre cette tentation et nous protéger de la dictature des données, il faudra élargir nos libertés civiques en s’assurant d’une utilisation encadrée afin que la volonté humaine reste respectée.

31Ce n’est pas là la seule préoccupation politique émergente. Il est probable que ceux – individus ou grandes organisations – qui détiennent des données, et ne peuvent en exploiter la valeur économique, voudront bénéficier de leur part du gâteau Big Data, en en offrant l’accès à des tiers, sous certaines conditions. Il n’existe pas aujourd’hui de mécanismes juridiques permettant d’encadrer un tel accès conditionnel. D’aucuns défendent la création d’un droit des données. Il n’est pas certain qu’il soit nécessaire, mais un débat approfondi sur la question s’impose.

32Ce qui nous renvoie à la question de la concentration du marché des détenteurs de données. Aux États-Unis, les agences fédérales ont déjà étendu leur réflexion sur le monopole et la concurrence à la question des fonds de données [26]. C’est une première étape, mais des mesures plus nombreuses – et plus fortes – sont sans doute nécessaires.

33Le Big Data présente nombre d’enjeux politiques majeurs, auxquels nos sociétés devront répondre. Le désir d’un cadre légal adapté et efficace pour son utilisation ne concerne pas seulement le citoyen lambda. Les acteurs du Big Data, en particulier dans le secteur privé, appellent aussi un tel cadre de leurs vœux ; c’est seulement sur des règles adaptées et fonctionnelles que l’on pourra reconstruire la confiance du public en la collecte et l’analyse des données. Il s’agit là d’un préalable sans lequel la plupart des entreprises du secteur ne survivront pas.

La gouvernance des données, demain

34La voie à suivre pour atteindre un tel cadre réglementaire sera longue et semée d’embûches. Pour nombre de problématiques, un nouveau dispositif réglementaire sera nécessaire. Les progrès seront lents au niveau national, plus lents encore à l’échelon international ; et pourtant c’est à ce niveau qu’un accord sur un éventail de règles de gouvernance pourrait se révéler le plus efficace.

35À moyen terme, les problématiques de gouvernance des données remplaceront et excéderont celles de la prétendue gouvernance de l’internet, qui reviennent régulièrement dans le débat public depuis plus d’une décennie. Celles-ci portent essentiellement sur le contrôle de la ressource partagée centrale (et unique) de l’internet, à savoir son système d’adressage qui permet aux ordinateurs de communiquer entre eux. Pour ceux qui s’y intéressent, il s’agit d’un sujet brûlant, avec sans nul doute d’importantes implications dépassant la question immédiate de la gestion des adresses.

36Mais les données ont un double statut. Elles sont matière première de l’économie des données et sources d’appréhensions innovantes de la réalité. Le débat sur la gouvernance de l’internet sera donc éclipsé par les débats sur celle des données : Qui accède aux données ? Qui les contrôle ? Qui les utilise ? Qui exploite leur valeur économique dérivée de leur utilisation ? Et avec quelles limites éthiques et juridiques ? Les institutions qui se consacrent à la gouvernance d’internet se montrent relativement discrètes sur la question de celle des données, pour des raisons différentes. L’Internet Corporation for Assigned Names and Numbers (ICANN) tente, par exemple, de maintenir son rôle dans la gouvernance de l’internet, ce qui exige un prudent équilibre entre les intérêts divergents des États-Unis et de la communauté internationale, en particulier depuis l’affaire Snowden. L’Union internationale des télécommunications (UIT), que l’on présente parfois comme le concurrent de l’ICANN, a des attributions qui limitent sa capacité à jouer un rôle dans ce domaine. L’Union européenne (UE) débat actuellement d’un nouveau règlement sur la protection des informations personnelles, qui permettrait de renforcer l’application des règles grâce à une nécessaire centralisation, mais les mécanismes sur lesquels l’UE s’appuie sont encore solidement ancrés dans un mode de pensée propre au xx^e siècle. Quant au gouvernement américain, il est trop occupé à d’autres affaires pour jouer un rôle significatif et cohérent. Les seules contributions recensées sont éparses. Les experts de l’Organisation de coopération et de développement économiques (OCDE), par exemple, comprennent en général le rôle transformateur des données et commencent à suggérer des orientations politiques.

37La grande valeur et la polyvalence des données pourraient toutefois faire naître un désir de contrôle outrepassant la simple création de cadres juridiques et de mécanismes de réglementation. Le Big Data promet des avantages compétitifs de valeur économique encore inexploitée, et des perspectives remarquables. Il n’est pas improbable, dans un avenir prévisible, que des conflits internationaux soient déclenchés suite à des désaccords en matière de gouvernance des données.

38Celles-ci, en sus d’être un motif d’affrontement entre États, pourraient devenir, sous la forme de flux de données, un nouveau champ de bataille. La question de la cybersécurité, principalement dominée par les activités de hackers et de criminels, est déjà passée aux mains d’acteurs commandités par les États. L’importance croissante des données renforcera encore davantage l’implication de ces derniers.

39***

40Le Big Data va faire évoluer la façon dont nous donnons du sens au monde, et transformer ce que nous considérons comme étant source de valeur économique. L’avenir qui en découlera sera peut-être traversé de tensions : entre usages utiles et désir de certains de maximiser leur bénéfice ; entre la nécessité d’un cadre juridique pour garantir les libertés humaines et des désaccords de fond sur la manière dont celles-ci devraient être protégées ; entre ceux qui avancent que le Big Data accroît la rationalité de la prise de décision et ceux qui préféreront l’irrationalité humaine – faite de préjugés, de croyances et d’intuitions –, seul moyen de distinguer l’humain de la machine.

41La perception actuelle d’une progression des idéologies extrémistes pourrait rendre séduisante l’idée d’une pensée éclairée et rationnelle fondée sur les analyses de Big Data. Cette possibilité peut exister. Mais celui-ci, comme toute connaissance humaine, est contingent, modelé et limité par nos capacités de compréhension. Quelque progrès que nous fassions sur la voie de la rationalité, le Big Data, outil humain, restera biaisé par nos limites humaines [27]. Il nous permettra peut-être d’avoir sur le monde une perspective plus détaillée, mais cette dernière aura des limites que nous ne pourrons surmonter. Garder cette conscience aiguë est nécessaire pour comprendre la véritable portée de la révolution des données qui s’annonce.

Mots-clés éditeurs : Big Data, Contrôle des données, Gouvernance, Internet

Date de mise en ligne : 08/12/2014

https://doi.org/10.3917/pe.144.0069

Compte personnel

La révolution Big Data

Notes

Citer cet article

Notes

Une nouvelle création de sens

Une nouvelle ressource économique

Un instrument de politique économique et ses limites

La gouvernance des données, demain

Accès institutions

Toutes les institutions