Du côté des médias sociaux

C’est la longue lecture de la semaine, mais elle en vaut le coup : Fred Pailler rend compte de ses travaux sur les sites de rencontre en ligne sur la plateforme Culture Visuelle : on y lit à la fois la construction publicitaire et médiatique de sites comme meetic, leurs liens avec d’autres sites plus directement charnels, et une réflexion générale sur la notion. Parlant de construction publicitaire, Facebook devrait peut-être s’inquiéter de la sienne : d’après un sondage, une majorité de marketers ignore si la promotion (payante) qu’ils y font change quelque chose à la visibilité de leurs propos.

Sur le grand réseau mondial

Amateurs de belles histoires (vraies), il vous faut lire celle du belge Paul Otlet, concepteur du Mundaneum dans lequel il entendait rassembler, dans des milliers de tiroirs, toute la connaissance humaine de son temps, avec des principes d’organisation et de communication que rétrospectivement, les historiens comparent à Google. Sur des questions contemporaines, découvrez l’histoire du shrug, aka ¯\_(ツ)_/¯, qui exprime à sa façon le sentiment par défaut d’Internet, un mélange d’indifférence et de résignation par ailleurs assez intraduisible.

Au royaume de la data

En sciences sociales, on peut distinguer (au moins) deux écoles : ceux qui pensent que l’humain et la société sont un objet à part, qu’on ne peut étudier que d’une façon spécifique et subjective, et ceux qui considèrent que l’on peut naturaliser les sciences sociales et les étudier comme des phénomènes naturels. Sandy Pentland, chercheur au MIT qui parle de physique sociale avec les big data, est résolument dans le camp de ceux qui considèrent les sciences sociales comme des sciences « normales », en l’occurrence la physique, et qu’on peut les étudier, par la donnée, comme la nature. Dans les nouveaux usages liés aux big data, on relèvera également l’évolution du journalisme, qui peut se nourrir de données sur des périodes longues et est donc encouragé à traiter non pas de l’actualité récente, comme dans le journalisme de flux, mais des sujets un peu plus atemporels, ou sur un temps un peu plus long, avec le journalisme de stock. Côté technique, les statisticiens s’intéressent à l’apport de leur métier au big data, ce que Jeff Leek a formulé en 10 recommandations qui incluent à la fois des questions de méthodes, de visualisation et d’objectif final de l’exercice. Retour également sur les corrélations absurdes et amusantes dont nous parlions la semaine dernière, en la personne de William Briggs qui souligne que ces corrélations sont ici absurdes de façon évidente mais qu’il y a des situations où on n’est pas en mesure de le déterminer : c’est là que peut se produire la fameuse confusion entre corrélation et causalité. En intelligence artificielle, on aime beaucoup comparer les systèmes mis au point au cerveau humain : il est vrai que certains procédés comme les réseaux de neurone s’inspirent librement d’une modélisation du cerveau mais ce qu’ils produisent n’a rien à voir avec l’intelligence humaine. Toutefois il est intéressant de voir que la recherche en intelligence artificielle évolue en fonction de notre définition de l’intelligence et notre compréhension du cerveau, qui a bien changé depuis les premiers travaux dans le domaine. Aujourd’hui, on met l’accent sur les capacité d’apprentissage automatique, où des systèmes comme le projet LEVAN se nourrissent du web pour acquérir de nouvelles connaissances : on parle alors de projets « supervisé par le web », qui constitue en effet la plus grande source d’informations jamais créées. Concluons sur des aspects plus concrets : la nomination d’Henri Verdier, responsable d’Etalab, comme « chief data officer » français (traduction proposée : « administrateur des données publiques »), ce qui constitue globalement une extension des pouvoirs d’Etalab avec la possibilité non seulement de conseiller mais aussi d’imposer des actions. Du côté des entreprises, un rapport IDC montre que les big data sont avant tout un outil de réduction des coûts plutôt que d’augmentation des bénéfices, ce qui en fait encore un peu plus un outil associé aux centres de coût. Notre visualisation de la semaine est un diagramme de Venn mettant en lumière les situations où il est judicieux d’opter pour un diagramme de Venn, et les autres possibilités qui s’offrent à nous en termes de visualisation de données. venn