Du côté des médias sociaux

La grande actualité de la fin de semaine, c’est la publication par une équipe de recherche où figure un data scientist de Facebook, d’une nouvelle étude qui analyse l’impact des publications Facebook auxquelles on est exposés. L’article fait grand bruit, tant sur l’éthique de la démarche (les internautes ont le sentiment qu’on a cherché à les manipuler à leur insu) que sur son fond scientifique (qui n’est pas très solide). Par bonheur, l’auteur de ces lignes a fait la lecture de la publication et tiré au clair la méthode qui a été suivie. De son côté, The Atlantic est allé interroger un certain nombre de personnes dont les auteurs du papier. Un psychologue a également fait des remarques fort justes sur l’article et ses résultats.

Sur un tout autre sujet, il s’est tenu récemment une journée de la veille à l’occasion de laquelle a été abordée la question de l’information grise à l’heure du web et des big data, qui fait notamment remarquer comment les réseaux sociaux créent la possibilité de nouvelles indiscrétions dont l’auteur n’a pas forcément conscience.

Sur le grand réseau mondial

En réponse à l’idée selon laquelle le web serait une nouvelle méritocratie, la chercheuse danah boyd rappelle comment les réseaux sociaux réorganisent l’information en fonction de leur popularité, de nos amis… et c’est une nécessité car les flux d’information doivent faire l’objet d’une curation pour pouvoir être suivis.

En réponse au débat sur l’apprentissage du code à l’école, un article de MotherJones déporte la question sur la nécessité d’apprendre le raisonnement, ce que permet de faire la pratique de l’algorithmique. Le code n’est qu’un formalisme, mais les algorithmes sont une façon de résoudre des problèmes qu’il est utile d’apprendre.

Enfin, on a remis la main sur la première occurrence de Google à la télévision et c’est… un épisode de Buffy contre les Vampires.

Au royaume de la data

Le signe que les big data sont là, c’est que tout le monde dit n’importe quoi dessus et que l’on commence à lire des articles de mise au point. Ainsi Olivier Grisel rappelle qu’il ne faut pas confondre machine learning et big data car il y a des problèmes propres aux données et d’autres propres à leur analyse (néanmoins on pourrait aussi discuter sa définition des big data…)

Autre signe que le phénomène s’installe, les formation. L’IUT Paris Descartes s’ajoute à la liste des université qui proposent une formation autour des big data, avec un ciblage plutôt analyste.

Aussi il est important de faire la différence entre statistiques et analyse de données : c’est Lev Manovich, interrogée par Xavier de la Porte, qui montre comment la transition de l’un à l’autre permet de faire de nouvelles opérations, et surtout change la façon dont on fait des catégories. De ce fait c’est notre organisation du monde qui évolue et peut-être même notre représentation de la société.

Notre visualisation de la semaine est un bel exemple de la façon dont la représentation graphique crée de la compréhension : en analysant les langues des articles proposés à un colloque et celles des articles publiés, on peut voir comment l’anglais semble être favorisé et proposer des pistes d’interprétation.

DH2014stats
Cliquer sur l’image