Notes
-
[1]
Conseil d’État. Numérique et droits fondamentaux, La Documentation française, 2014, p. 48
-
[2]
V. Mayer-Schönberger et K. Cukier. Big data, la révolution des données est en marche !, Robert Laffont, 2014, p. 121 & suiv.
-
[3]
J.-C. Cointot et Y. Eychenne. La révolution Big data, Dunod, 2014, p. 31 & suiv.
-
[4]
Big data : seizing opportunities, preserving value. Rapport. The White House, Washington, mai 2014, https://www.whitehouse.gov/sites/default/files/docs/big_data_privacy_report_may_1_2014.pdf
-
[5]
V. Mayer-Schönberger et K. Cukier, op. cit., p. 185 & suiv.
-
[6]
En ce sens, voir Conseil d’État, Numérique et droits fondamentaux, La Documentation française, 2014 ; A. Bensamoun et C. Zolynski. « Big data et cloud clomputing : quel encadrement pour ces nouveaux usages ? », Revue Réseaux, 2015, n°189
-
[7]
Proposition de règlement relatif à la protection des personnes physiques à l’égard du traitement des données à caractère personnel et à la libre circulation de ces données COM (2012) 11 final, article 23.
-
[8]
Conseil national du numérique. Neutralité des plateformes. Réunir les conditions d’un environnement numérique ouvert et soutenable. Rapport, 2014 et Conseil d’Etat, op. cit., p. 274
-
[9]
V. Mayer-Schönberger et K. Cukier, op. cit., p. 219 et Conseil d’État, op. cit., p. 237
-
[10]
C. THIBIERG. « Avenir de la responsabilité, responsabilité de l’avenir », Revue Dalloz, 2004, p. 577
1Le Big data consacre indiscutablement notre entrée dans la société de l’information. Ce terme désigne la capacité à traiter en temps quasi réel d’immenses gisements d’informations, de grandes masses de données structurées, semi-structurées, voire non structurées et disparates pour extraire de leur recoupement de nouvelles valeurs qui demeuraient jusqu’alors inconnues.
La règle des 5V
2Plus précisément, on définit le Big data par la règle des 5V [1]. Le premier V renvoie à un volume important de données auquel s’ajoute la variété puisque le Big data permet d’appréhender des données hétérogènes, dans des formats variés, qu’elles soient structurées ou non structurées, ce que favorise l’explosion des données produites par les entreprises, l’État ou encore les individus dans un mouvement de mise en données généralisée (données structurées dans des bases de données, échanges sur les réseaux sociaux, données publiques ouvertes, données de navigation ou celles émises par les objets connectés, etc.).
3Le troisième V renvoie à la vélocité du traitement dans la mesure où la vitesse de traitement des données peut aller jusqu’au temps réel car il est possible aujourd’hui de capturer une masse de données mouvante et de les corréler de façon dynamique. À ces 3 V, on ajoute désormais le quatrième de véracité qui souligne l’enjeu relatif à la fiabilité des données exploitées et, surtout, le 5e V de valeur.
4Le Big data génère, en effet, une valeur nouvelle en transformant les données en information, en développant l’utilisation secondaire des données et de nouveaux instruments de compréhension qui révolutionnent nos modes d’analyse. Le Big data s’inscrit effectivement à rebours de la méthode statistique classique qui procède d’une logique déductive dont les conclusions sont fondées sur un échantillonnage grâce aux causalités, reposant au contraire sur une logique inductive qui conduit à collecter le plus grand nombre de données possibles pour exploiter leurs corrélations. Ces masses de données sont ensuite brassées afin d’en extraire, grâce aux corrélations, de nouvelles informations à des fins d’analyse souvent prédictive. La donnée, dont le Big data révèle la valeur latente, va alors « parler d’elle-même », et pourra livrer une réponse sans que la question n’ait même été envisagée [2] !
Les défis du Big data
5Le Big data offre des perspectives sans précédent tant pour les opérateurs économiques que pour les autorités publiques et, au-delà, pour la société : la fusion des données et leur analyse prédictive - analyse des sentiments, segmentation et géolocalisation des besoins, connaissance affinée des comportements, voire des attentes de l’utilisateur qui permet d’adapter l’offre en temps réel [3] - laissent augurer un nombre considérable d’applications allant du marketing intelligent jusqu’à l’optimisation des processus de production ou encore une meilleure gestion des villes intelligentes (gestion de l’énergie, du trafic, voire de la sécurité et de la santé publique), ceci sans même évoquer les perspectives en terme de recherche fondamentale [4].
6Mais, en même temps, le Big data est source de risques majeurs. Certains dénoncent les conséquences négatives que peut engendrer ce pouvoir d’information s’il est réservé à quelques opérateurs dominants. D’autres avancent le risque de censure ou de discrimination que l’individu pourrait courir en raison du traitement algorithmique de ses données visant à lui proposer des services personnalisés assortis d’une tarification dynamique qui pourraient le départir de sa liberté de choix ; sans évoquer la crainte, qui relève peut-être du fantasme, d’une dictature des données et des algorithmes prédictifs imposant une définition d’un « homme calculé » qui remettrait en cause le principe d’autodétermination, principe qui est, selon notre vision, l’essence même de toute personne humaine [5]. Quoi qu’il en soit, un équilibre doit être trouvé entre protection et innovation qui impose d’encadrer l’usage des données valorisées par le Big data.
Penser la société du Big data
7Plusieurs propositions sont actuellement formulées pour réguler ces nouveaux usages. Une première approche consiste à intervenir ex post, à sanctionner les opérateurs en cas d’atteinte portée à l’équilibre du marché grâce à leur pouvoir d’information, voire à engager leur responsabilité en cas de préjudice résultant de l’usage de ces données massives et de leur traitement algorithmique.
8Une seconde approche consacre plutôt une régulation ex ante. On s’interroge notamment sur l’application de certaines règlementations, particulièrement les textes organisant la protection des données personnelles. Nombreux doutent pourtant de leur capacité à appréhender le caractère dynamique et mouvant du Big data car les législations française et européenne reposent sur une approche figée de la donnée, et portent des principes qui semblent peu adaptés comme le principe de proportionnalité et de finalité. À cela, certains opposent que le Big data ne traite pas systématiquement de données personnelles, qu’il peut exploiter des données purement statistiques, voire que la finalité peut être assouplie [6]. On le conçoit bien pour certains usages, notamment lorsqu’il s’agit d’optimiser la gestion de l’outil entrepreneurial. Mais la question semble délicate lorsque les données croisées - comme les échanges numériques sur les réseaux sociaux ou les données de consommation -, même anonymisées, traduisent le comportement des individus dont ils émanent. Dès lors, d’autres modes de régulation ex ante doivent être mobilisés pour appréhender ces traitements, qui entendent responsabiliser les opérateurs désirant tirer profit du potentiel du Big data : ceux-ci devraient être tenus d’un devoir de rendre des comptes imposant de décrire les garanties qu’ils mettent en œuvre pour assurer le respect des droits des tiers selon une logique d’accountability prônée par les autorités européennes dans le projet de règlement en cours de discussion [7]. Il convient, en même temps, de porter la reconnaissance de nouvelles obligations à mettre à la charge de ces opérateurs à l’image des obligations de transparence et de loyauté préconisées par le Conseil national du numérique et le Conseil d’État [8] et, plus spécifiquement, d’imposer un contrôle de l’usage des algorithmes, par exemple par un tiers certificateur, un « algorithmiste », sur le modèle des commissaires aux comptes [9].
Chercher l’équilibre entre innovation et précaution
9Compte tenu des conséquences majeures susceptibles de résulter du traitement du Big data, ne pourrait-on pas imaginer une forme de responsabilité pour risque, sur le modèle du droit de l’environnement [10] ? Celle-ci permettrait à l’opérateur de tirer bénéfice de ces traitements dans la limite de la protection légale des données personnelles et, plus généralement, des droits des tiers sur les données (propriété intellectuelle, secret d’affaires, notamment). En contrepartie, celui-ci engagerait sa responsabilité s’il fait naître un risque susceptible de causer un dommage majeur à autrui sans avoir pris les précautions nécessaires pour éviter la réalisation d’un tel risque. Telle serait une voie féconde pour porter l’éthique des données qui conditionne certainement l’équilibre entre principe d’innovation et principe de précaution.
Notes
-
[1]
Conseil d’État. Numérique et droits fondamentaux, La Documentation française, 2014, p. 48
-
[2]
V. Mayer-Schönberger et K. Cukier. Big data, la révolution des données est en marche !, Robert Laffont, 2014, p. 121 & suiv.
-
[3]
J.-C. Cointot et Y. Eychenne. La révolution Big data, Dunod, 2014, p. 31 & suiv.
-
[4]
Big data : seizing opportunities, preserving value. Rapport. The White House, Washington, mai 2014, https://www.whitehouse.gov/sites/default/files/docs/big_data_privacy_report_may_1_2014.pdf
-
[5]
V. Mayer-Schönberger et K. Cukier, op. cit., p. 185 & suiv.
-
[6]
En ce sens, voir Conseil d’État, Numérique et droits fondamentaux, La Documentation française, 2014 ; A. Bensamoun et C. Zolynski. « Big data et cloud clomputing : quel encadrement pour ces nouveaux usages ? », Revue Réseaux, 2015, n°189
-
[7]
Proposition de règlement relatif à la protection des personnes physiques à l’égard du traitement des données à caractère personnel et à la libre circulation de ces données COM (2012) 11 final, article 23.
-
[8]
Conseil national du numérique. Neutralité des plateformes. Réunir les conditions d’un environnement numérique ouvert et soutenable. Rapport, 2014 et Conseil d’Etat, op. cit., p. 274
-
[9]
V. Mayer-Schönberger et K. Cukier, op. cit., p. 219 et Conseil d’État, op. cit., p. 237
-
[10]
C. THIBIERG. « Avenir de la responsabilité, responsabilité de l’avenir », Revue Dalloz, 2004, p. 577