Big_Data

Déplier le réel: l’Anschluss par le Big Data

Big Data is Watching You. You are watching Big Data.

Le Big data, on en avait glissé un mot ici, en 2010. C’est l’accès à une formidable banque de données, à son analyse et l’extraction de connaissances.Appelé data mining auparavant, il fait référence aux outils, processus et procédures permettant à une organisation de créer, de manipuler et de gérer de très larges quantités de données en vue d’en extraire des informations de valeur.

La nouvelle expression, Big Data, semble avoir été adoptée comme pour signifier qu’aujourd’hui on y ajoute le temps réel et des prises de données décuplées.

Je laisse ici de côté les manipulations bassement marketing qui ne cherchent qu’à vendre du vieux en le faisant passer pour neuf. Intéressons-nous à ce que veut réellement dire accéder à une très, très grande masse de données.

Ce qu’on ne voit pas sur les murs de la caverne, existe-t-il?

Vous connaissez l’expression «l’autoroute de l’information». Son côté suranné laisse suinter l’idée que le terme ne couvre pas toute la réalité. Le data mining est à l’autoroute de l’information ce que le Big data est aux médias sociaux.

Certains ont anticipé avec prescience, il y a plus de 40 ans, le type de monde dans lequel nous nous retrouvons aujourd’hui.

Pourtant les films de science-fiction n’ont fait que surfer sur le futur technologique qu’ils entrevoyaient pour nous (télé-achat, communication à distance et portable, écran tactile).

Je n’ai vu aucun film ou livre (à ma connaissance) qui mettaient les réseaux socionumériques au coeur d’un changement sociétal comme on le vit aujourd’hui.

Aujourd’hui, encore, les oeuvres artistiques ont encore beaucoup de mal à intégrer cette mutation sociale dans leur représentation du réel.

Hubert Guillaud et Xavier de la Porte avaient déjà signalé il y a deux ans la gêne que cause l’absence des problématiques numériques dans la littérature contemporaine française.

Il y a bien plus d’une décennie que les cellulaires sont entrés dans la fiction comme ressort dramatique (et ils semblent aujourd’hui omniprésents). Mais les médias sociaux?

J’ai l’impression que nos représentations du Big Data sont du même ordre. On sait que ça s’en vient, on sait que c’est gros, mais on sous-estime les changements que cela va causer.

J’aimerais partager avec vous mes intuitions de ce côté.

Voir le data mining dans l’œil du voisin et ne pas voir le Big data dans le sien

Moi-même, ce que je signalais en 2010 à propos du Big data, ne faisait que gratter la surface.

Je m’en tenais à une référence aux outils et à leur possibilité de gérer, trier, analyser de grandes quantités de données.

Bien sûr, je me réjouissais qu’une démocratisation était en cours de ce côté. Cette démocratisation permettrait de mettre une expertise entre les mains de plus de gens, en leur permettant de faire remonter des signaux faibles et voir émerger des patterns. Magie que seul les grands parmi les grands avaient les ressources pour le faire.

Mais c’est encore sous-estimer l’ampleur du changement. Comme on a tous sous-estimé les changements sociaux découlant d’Internet (non, Internet n’est pas juste un immense Wal-Mart virtuel).

Pour le Big data, ce n’est pas une démultiplications des données auquel on assiste mais à un véritable dépliage de la réalité!

La réalité se déplie, s’ouvre, se montre, s’agrandit. Le Big data, c’est l’accès à la couche tout juste sous le sensible: c’est ce que j’entends par le dépliage. On déplie le réel pour voir la couche en dessous, pour qu’elle entre dans notre réel.

Contrairement à un microscope grossissant, on ne parle pas simplement d’un accès, d’un polaroïd, d’une incursion timide dans ce sous-monde, mais à une Anschluss en règle de cette sous-couche dans notre monde.

On parle ici de rattacher l’invisible au visible, à agrandir le royaume du réel, à prendre en compte les informations de ce sous-monde pour l’intégrer dans la gestion quotidienne de notre réalité.

Autrement dit, le Big Data repousse la frontière de notre monde. Le réel s’agrandit de l’intérieur .

Datatifier le monde

Viktor Mayer-Schönberger, auteur de Big Data: A Revolution That Will Transform How We Live, Work, and Think, dans une interview qu’il a donnée récemment à Nora Yong de l’excellente émission Spark à la radio de CBC donnait l’exemple des sondes sur des prématurés.

Au lieu de prendre des mesures vitales quelques fois par jour, les instruments d’aujourd’hui peuvent colliger des milliers de mesures à la minute ou à l’heure.

Dans le cas de prématurés, c’est la différence entre la vie et la mort. Viktor raconte que le traitement de ce « Big data » permet « d’anticiper » des problèmes bien avant les médecins.

Après plusieurs essais, les chercheurs ont fini par faire des corrélations entre certains patterns dérivés des données et les diagnostics des docteurs. Mais avec la finesse des datas (ou plutôt leur quantité) il leur était possible de détecter les signes avant-coureurs qui mènent vers des problèmes pathologiques bien avant qu’ils soient détectables par les experts.

Autrement dit le Big data peut « sauver » la vie de ces prématurés.

Le big data déplie le monde et nos instruments nous permettent de l’intégrer à notre temps réel, à notre espace-temps…

Prenons une analogie pour être plus clair. Sur l’écran où vous regardez ce texte, il y a des pixels, mais ils sont trop petits pour que vous puissiez les voir distinctement. Hé bien, imaginez que votre vue peut permette de voir chacun des pixels aussi gros que chacune des touches de votre clavier.

Vous viendriez de déplier une dimension invisible du monde; vous viendriez de repousser l’horizon du visible de l’intérieur. Les pixels gros comme des touches de clavier feraient partie du monde tout comme les poignées de porte et les marches d’escalier: des informations supplémentaires et actionnables sur votre monde.

Cette dimension serait prise en considération comme les panneaux de circulations sont des informations pour vous: quelque chose sur lequel vous pouvez avoir une emprise pour comprendre davantage le monde en vous créant de nouvelles représentations.

Viktor Mayer-Schönberger appelle ça « to datafy ». La datatification du monde.

Causalité à l’épreuve de la corrélation

Je vous invite à écouter l’entrevue (en anglais) de Viktor Mayer-Schönberger par Nora Young, car c’est fort instructif. Voici quelques citations, traduites à la volée, un peu approximatives dans les mots, mais juste sur le fond.

«Ce qui a changé, c’est qu’avant, collecter, conserver et analyser du data entraînaient des frais énormes, ce qui n’est plus le cas aujourd’hui. […]

Si je n’ai que 15 prises de données et que 5 d’entre elles sont défectueuses, mon résultat s’en trouvera irrémédiablement affecté. Mais si je fais 5 milliards de collectes de données, je peux me permettre d’avoir quelques données faussées.[…]

Cette approche ne s’applique pas à toute les facettes de notre vie. Si vous allez à la banque, vous n’accepterez pas qu’il y ait des dépôts qui ont été oubliés. Tout doit être parfaitement enregistré jusqu’au dernier sou. Vous ne vous contenterez pas d’une réponse approximative qu’il reste à peu près 4000 dollars dans votre compte.

Mais dans d’autres circonstances, cette approximation n’est pas dommageable. Votre assistance-navigation SatNat peut vous dire que vous allez arriver à telle intersection dans trois minutes. Sans être à la seconde près, cette approximation est tout à fait suffisante. […]

Prenons l’exemple de Google Flu qui pouvait prédire l’éclosion de la grippe presqu’en temps réel. C’était un peu approximatif, mais définitivement de grande valeur comparée aux vrais résultats colligée par les docteurs qui n’arrivaient qu’au bout de 2 semaines seulement. […]

Depuis le début de l’humanité, nous sommes habitués à voir le monde comme une suite de cause et conséquences (si nous allons au restaurant un jour, et que nous sommes malades le lendemain, il ne faut pas grand temps pour relier les deux événements. Mais parfois, nos intuitions nous jouent des tours (nous sommes tombés malades pcq on a serré la main à un collègue malade).

L’analyse du Big Data ne peut nous dire le pourquoi, mais simplement le quoi: la corrélation entre deux choses/événements. Google ne fait que remarquer la corrélation entre les recherches en lignes et les cas déclarés de la grippe. Il n’y a aucune indication de causalité ici. […]

Notre cerveau ne peut s’empêcher de faire des liens de causalité. Ce n’est que de la corrélation, une prédiction dont la cause n’est pas identifiée.

Les problèmes commencent quand on mélange les deux, quand on utilise la corrélation pour deviner la cause. On risque de faire de mauvaises connexions [comme par exemple faire du profilage].

La promesse du Big data est de réussir à avoir moins de faux positifs [en augmentant la finesse probabilistique de la corrélation] alors que notre tendance à tout vouloir ramener à la causalité devient nuisible à ce niveau [on se dit toujours qu’il n’y a pas de fumée sans feu].

Ce que je retiens de la fin de son intervention sur la corrélation, c’est que cette partie du monde qui se déplie demande de développer de nouveaux réflexes, donc une éducation aux logiques statistiques et probabilistique, donc à une pensée rationnelle.

Polaroïd ou flux?

Que vous le vouliez ou non, le monde se déplie. Déjà ceux qui maîtrise le Big data voit le monde plus grand que vous. Ils ont accès à plus d’information que vous. Une course vient de démarrer.

Ce n’est pas nécessairement un land claim. C’est surtout une expertise pour voir et analyser le réel avec de nouvelles données. Ce monde qui se déplie est une opportunité de voir plus loin.

Ça peut être fait à la façon d’un Polaroïd (on capture un instant donné et on en tire des conclusions). Ce sont les tests d’ADN qui vous donnent un pronostique sur votre état de santé génétique. C’est un sondage des réseaux sociaux pour connaître des tendances de fond.

Mais ce n’est encore que la continuité de ce que la science fait depuis longtemps (elle découvre le réel).

Mais quand le Big data sera non pas un Polaroïd mais un flux en temps réel, alors là le sous-monde fera partie de notre monde.

Déjà la détection des visages dans une foule se fait en temps réel. On laisse même entendre que les policiers brésiliens auront des lunettes qui peuvent scanner 400 visages à la minute pour 2014.

Même si je suis sceptique sur cette dernière nouvelle-là — on dirait plus de l’intox pour faire peur aux hooligans– ce n’est plus du domaine de la fiction.

Des « laboratoires sous-cutanés » sont en cours de conception: ce sont de minuscules implants qui sauront analyser en temps réel certaines caractéristiques de votre corps.

Le minuscule dispositif implanté juste sous la peau fait des analyses en temps réel des substances dans le corps, via le sang. Il a un module radio qui transmet les résultats sur le réseau à un médecin à partir de notre  téléphone cellulaire via Bluetooth

Je le redis autrement. Vos cellules téléphoneront elles-mêmes à votre médecin si un problème se déclare.

Encore un autre exemple: des chercheurs du MIT ont développé un logiciel libre qui permet de révéler les détails (dans les vidéos) autrement invisibles: les micro-mouvements et le pouls.

Celui ou celle qui peut accéder à un tel flux en temps réel (disons, par exemple, au hasard, dans une app sur les lunettes Google) possède une information de plus que les autres. Il peut lire des intentions qui sont autrement cachées (gêne, mensonge, etc)

On peut peut-être contester l’usage du mot Big data dans ce contexte. Mais je ne crois pas détourner le sens original de data mining en tout cas.

Avec le Big data, je pense que dire qu’on déplie le réel prend son tout sens. Datatifier le monde, le prochain défi.

(Reste maintenant à l’analyser tout ça de façon critique. On se reprendra dans un autre billet.)

Martin Lessard
Conférencier, consultant en stratégie web et réseaux sociaux, chargé de cours. Nommé un des 8 incontournables du Montréal 2.0 (La Presse, 2010). Je tiens ce carnet depuis 2004.
http://zeroseconde.com

One thought on “Déplier le réel: l’Anschluss par le Big Data

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *