Du côté des médias sociaux

Une belle semaine qui s’achève sur le web, avec pour commencer la ré-élection d’Obama, qui a suscité le tweet le plus retweeté de tous les temps. En réalité Twitter suscite de plus en plus l’intérêt des chercheurs, ce qui donne lieu à d’étonnantes conclusions : ainsi, en étudiant la façon dont les gens s’expriment, des équipes ont pu déterminer avec un bon taux de réussite le genre (féminin ou masculin) de la personne qui tient un compte Twitter. Dans le même esprit, il y a sur Twitter des bots qui tentent d‘imiter le comportement humain, et sont étudiés pour voir la façon dont les internautes interagissent entre eux et se laissent éventuellement prendre à ces imitations.

Sur un plan plus technique, Twitter prévoierait de généraliser les « expanded tweets » et de les afficher automatiquement dans leur version étendue. Ces tweets enrichis n’inverseront certainement pas la tendance qu’ont les internautes à retweeter un lien sans l’avoir lu, une tendance qui concernerait environ 15% des tweets. De son côté, Facebook poursuit ses tentatives de monétisation et prévoirait de lancer un service de petites annonces qui pourrait concurrencer eBay ou Le bon coin, si le service est un succès.

Sur le grand réseau mondial

Internet devient-il de plus en plus monopolistique ? C’est la question que pose le Journal du Net en observant que les 10 sites les plus fréquentés en France attirent une part croissante du trafic total, quels que soient ces 10 sites. Une chose est sûre, la presse ne fait pas partie de ces sites, et un article factuel analyse, dans le débat sur Google et la presse, la part de trafic web qui revient à celle-ci : le fait est que l’information journalistique est loin d’être la plus consultée sur Internet, et que la désindexation de la presse par Google ne changerait probablement pas grand chose pour le moteur de recherche.

Quels que soient les gagnants de ce bras de fer, Internet continue à susciter la méfiance. Comme toute technologie nouvelle finalement, on lui impute tous les maux de la terre :  totalitaire, abrutissant, désocialisant, des adjectifs qui furent en leur temps attribués au téléphone ou à la télévision. Les nouveaux ennemis d’Internet sont finalement le pendant des utopistes qui voyaient dans le web un nouveau monde où l’on pourrait réinventer la vie…

Pendant ce temps-là, le web évolue, avec deux projets concomitants de rajouter au web une nouvelle couche « sociale » : d’une part, Firefox propose une Social API qui permet de connecter au navigateur les différents réseaux sociaux de l’utilisateur ; d’autre part, MetaWeb est un logiciel qui fonctionne avec tout navigateur (de bureau ou mobile) et permet d’interagir, par exemple, avec les autres lecteurs d’une même page.

Au royaume de la data

La victoire d’Obama a beaucoup été décrite comme « une victoire des nerds », des statistiques et des données. Au premier plan, le maintenant célèbre statisticien Nate Silver a prédit correctement les résultats Etat par Etat, montrant a priori la validité de son modèle statistique. Mais avant même le vote, l’analyse de données a été plus que jamais sollicitée par la campagne : Obama a embauché des équipes de mathématiciens pour analyser toutes les données connues sur les électeurs et mettre un maximum de chances du côté des démocrates.

Ces deux articles montrent bien les deux aspects de l’analyse de données : d’une part, il est essentiel de disposer d’un ensemble de données riche, conséquent et utile. D’autre part, la qualité du modèle d’analyse est indispensable pour produire une information fiable et représentative de la réalité. Le débat se pose souvent de savoir s’il vaut mieux plus de données ou un meilleur modèle : avec le développement de la big data et des très grands jeux de données, on a pu penser que la complexité du modèle et des algorithmes qui en découlent devenait accessoire. Cet excellent article revient sur l’emballement autour des données, sans doute un peu orchestré par Google et son Directeur de recherche Peter Norvig, et rappelle somme toute l’évidence : il est important d’avoir de bonnes données autant qu’un modèle satisfaisant.

Notre visualisation de la semaine est en fait un outil de création de dataviz : Datawrapper, lancé récemment, permet en effet à tout internautes de créer très simplement une visualisation à partir d’un nombre intéressant de format de données.